Generalized linear models (GLM)
У линейных моделей есть ряд ограничений. Прежде всего, возникают сложности с интерпретацией результата, если модель накладывает жесткие требования по неотрицательности ответа или приходится извлекать кубические корни и т.п. Используемые натуральные логарифмы не работают с нулевыми или отрицательными значениями.
GLM включают в себя линейные модели, но имеют некоторые преимущества и не так сложны в вычислениях. Такие модели включают в себя три компонента: экспоненциальную прогнозную часть (отклик); линейную часть — предиктор; функцию, связывающую мат ожидание отклика и предиктор.
Наиболее частые случаи использования GLM моделей: линейные модели; биномиальная и бинарная регрессии; пуассоновские регресии (число событий в единицу времени).
Логистическая регрессия
Часто интересуют исходы, которые имеют только два состояния. Например, выиграл/проиграл. Такие исходы называются биномиальными, частный случай распределения Бернулли.
Пуассона регрессия (Poisson GLM)
Многие данные счетные, без определенных границ. Например, число звонков в колл-центр или количество машин, проезжающих по мосту. Для анализа подобных данных используют распределение Пуассона. Данные также могут быть в относительной форме, например, число людей, сдавших тест (в более широком смысле доля — число событий за промежуток времени).
( Collapse )