August 27th, 2018

Generalized linear models (GLM)

У линейных моделей есть ряд ограничений. Прежде всего, возникают сложности с интерпретацией результата, если модель накладывает жесткие требования по неотрицательности ответа или приходится извлекать кубические корни и т.п. Используемые натуральные логарифмы не работают с нулевыми или отрицательными значениями.

GLM включают в себя линейные модели, но имеют некоторые преимущества и не так сложны в вычислениях. Такие модели включают в себя три компонента: экспоненциальную прогнозную часть (отклик); линейную часть — предиктор; функцию, связывающую мат ожидание отклика и предиктор.

Наиболее частые случаи использования GLM моделей: линейные модели; биномиальная и бинарная регрессии; пуассоновские регресии (число событий в единицу времени).

Логистическая регрессия

Часто интересуют исходы, которые имеют только два состояния. Например, выиграл/проиграл. Такие исходы называются биномиальными, частный случай распределения Бернулли.

Пуассона регрессия (Poisson GLM)

Многие данные счетные, без определенных границ. Например, число звонков в колл-центр или количество машин, проезжающих по мосту. Для анализа подобных данных используют распределение Пуассона. Данные также могут быть в относительной форме, например, число людей, сдавших тест (в более широком смысле доля — число событий за промежуток времени).

Collapse )