Course Summary
This course teaches students how to build linear models using R programming language. It covers topics such as model fitting, variable selection, and model diagnostics.Key Learning Points
- Learn how to build linear models using R
- Understand the process of model fitting, variable selection, and model diagnostics
- Apply linear models to real-world data sets
Related Topics for further study
Learning Outcomes
- Ability to build linear models using R programming language
- Understanding of the process of model fitting, variable selection, and model diagnostics
- Ability to apply linear models to real-world data sets
Prerequisites or good to have knowledge before taking this course
- Basic understanding of statistics
- Familiarity with R programming language
Course Difficulty Level
IntermediateCourse Format
- Online
- Self-paced
- Video lectures
Similar Courses
- Multiple Regression Analysis in Excel
- Data Analysis and Statistical Inference
- Statistics with R
Related Education Paths
Notable People in This Field
- Hadley Wickham
- Andrew Gelman
Related Books
Description
Результаты подсчета чего-либо или вероятности возникновения событий - это величины, практически не поддающиеся моделированию при помощи обычных линейных моделей, так как не подчиняются нормальному распределению. Обобщенные линейные модели (Generalized Linear Models, GLM) позволяют обойти это ограничение. В этом курсе мы постараемся с минимальным количеством математики рассказать об устройстве GLM и многочисленных подводных камнях, связанных с анализом. GLM для счетных данных основаны на распределении Пуассона или отрицательном биномиальном распределении. Модели для бинарных данных (например, логистическая регрессия) - на биномиальном распределении. Мы обсудим особенности диагностики моделей, возникающие в зависимости от выбранного распределения. Параметры GLM подбирают при помощи метода максимального правдоподобия, поэтому и аппарат тестирования гипотез и техники упрощения моделей довольно сильно отличаются от привычного для простых линейных моделей. Для анализа данных мы будем использовать язык R, чтобы вы могли лучше разобраться в тонкостях работы с обобщенными линейными моделями. Вас ждут интерактивные задания на платформе Stepic и проект по анализу данных в конце курса.
Outline
- Знакомство с обобщенными линейными моделями
- Линейные модели для величин с разной формой распределения
- Зоопарк распределений
- Обобщенные линейные модели
- GLM с нормальным распределением отклика
- Пример -- питательная ценность икры
- Подбор GLM c нормальным распределением отклика в R
- Разновидности остатков обобщенных линейных моделях
- Диагностика GLM с нормальным распределением отклика
- Тестирование значимости коэффициентов при помощи критерия Вальда
- Работаем с логарифмами правдоподобий. Анализ девиансы
- Анализ девиансы в R
- Качество подгонки GLM
- Визуализация GLM
- Что мы знаем и что будет дальше?
- Обзор курса
- Знакомство с обобщенными линейными моделями
- Проблема выбора модели
- All models are wrong
- Проблема выбора в действии
- Третий путь: несколько равноправных моделей
- Информационные критерии
- Вычисление AIC вручную
- AIC в действии
- Сопоставление моделей-кандидатов
- Блеск и нищета выбора моделей
- В саду расходящихся тропок
- Выбор моделей на краю пропасти
- Что мы знаем и что будет дальше?
- Проблема выбора модели
- Обобщенные линейные модели для счетных данных
- Счетные величины вокруг нас
- Пример - гадючий лук и опылители
- Опасности моделирования счетных величин при помощи обычной регрессии
- GLM с Пуассоновским распределением отклика
- Диагностика моделей с Пуассоновским распределением отклика
- Квазипуассоновские модели
- GLM с отрицательным биномиальным распределением отклика
- Описание и визуализация модели
- Что мы знаем и что будет дальше?
- Обобщенные линейные модели для счетных данных
- Обобщенные линейные модели с бинарным откликом
- Бинарные переменные вокруг нас
- Пример – морские звезды и мидии
- Простой линейной регрессией не обойтись
- Логистическая кривая
- Шансы и логиты
- Немного алгебры: Логиты в качестве зависимой переменной
- Вернемся к морским звездам и мидиям
- Смысл коэффициентов в моделях с бинарным откликом
- Диагностика модели с бинарным откликом
- Визуализация модели
- Что мы знаем и что будет дальше?
- Обобщенные линейные модели с бинарным откликом
Summary of User Reviews
Key Aspect Users Liked About This Course
The course content is comprehensive and well-organized.Pros from User Reviews
- Great course for beginners to learn about generalized linear models
- Excellent instructor who explains concepts clearly and provides helpful examples
- The course covers a wide range of topics and provides plenty of practice exercises
Cons from User Reviews
- Some of the assignments are too difficult and require more guidance
- The course could benefit from more interactive elements and group discussions
- The pace of the course may be too slow for more advanced learners