Generalized linear models (GLM)

У линейных моделей есть ряд ограничений. Прежде всего, возникают сложности с интерпретацией результата, если модель накладывает жесткие требования по неотрицательности ответа или приходится извлекать кубические корни и т.п. Используемые натуральные логарифмы не работают с нулевыми или отрицательными значениями.

GLM включают в себя линейные модели, но имеют некоторые преимущества и не так сложны в вычислениях. Такие модели включают в себя три компонента: экспоненциальную прогнозную часть (отклик); линейную часть — предиктор; функцию, связывающую мат ожидание отклика и предиктор.

Наиболее частые случаи использования GLM моделей: линейные модели; биномиальная и бинарная регрессии; пуассоновские регресии (число событий в единицу времени).

Логистическая регрессия

Часто интересуют исходы, которые имеют только два состояния. Например, выиграл/проиграл. Такие исходы называются биномиальными, частный случай распределения Бернулли.

Пуассона регрессия (Poisson GLM)

Многие данные счетные, без определенных границ. Например, число звонков в колл-центр или количество машин, проезжающих по мосту. Для анализа подобных данных используют распределение Пуассона. Данные также могут быть в относительной форме, например, число людей, сдавших тест (в более широком смысле доля — число событий за промежуток времени).

Распределение Пуассона полезно в случаях: анализа веб-траффика, относительной частоты событий за период времени, аппроксимация биномиального распределения с малыми вероятностями и большим числом событий, анализа таблиц случайных данных.

Error

Anonymous comments are disabled in this journal

default userpic