Course Summary
This course offers an introduction to machine learning and big data, covering topics such as data mining, clustering, regression, and more. Students will learn about different algorithms and techniques used in machine learning and how to apply them to real-world problems.Key Learning Points
- Learn about the different algorithms and techniques used in machine learning
- Understand how to apply machine learning to real-world problems
- Explore the world of big data and learn about data mining, clustering, and regression
Related Topics for further study
Learning Outcomes
- Understand the different types of machine learning algorithms
- Apply machine learning techniques to real-world problems
- Gain knowledge of big data and its applications
Prerequisites or good to have knowledge before taking this course
- Basic knowledge of programming concepts
- Familiarity with statistics and probability
Course Difficulty Level
IntermediateCourse Format
- Online
- Self-paced
Similar Courses
- Applied Machine Learning
- Data Mining and Analysis
- Big Data Essentials: HDFS, MapReduce and Spark RDD
Related Education Paths
Notable People in This Field
- Andrew Ng
- Yann LeCun
Related Books
Description
Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.
Knowledge
- Основным стандартам и методологиям анализа, обработки, описания и визуализации социально-экономических данных
- Математическим и инструментальным методам машинного обучения
- Использованию современных информационно-коммуникационных технологий в профессиональной деятельности
Outline
- Анализ данных
- Большие данные (Big Data). Основные понятия
- Машинное обучение. Интеллектуальный анализ данных
- Искусственная нейронная сеть
- Алгоритмы обучения нейронных сетей
- Виды нейронных сетей
- Применение интеллектуального анализа данных
- Стандарты KDD и SEMMA
- Стандарт CRISP-DM
- Типы задач анализа данных
- Задачи и методологии анализа данных
- Контрольный тест
- Подготовка данных
- Восстановление пропущенных значений
- Трансформация данных
- Квантование, нормализация
- Факторный анализ. Метод главных компонент
- Пример реализации метода главных компонент
- Метод главных факторов
- Пример использования факторного анализа
- Подготовка данных
- Контрольный тест
- Визуализация данных
- Понятие и направления визуализации данных
- Направления визуализации данных. Примеры
- Техники визуализации данных. Классификация
- Геометрические техники визуализации
- Пиксель-ориентированные техники
- Иерархические техники
- Техники, основанные на графах. Картограммы
- Визуализация данных
- Контрольный тест
- Описательные статистики
- Систематизация данных
- Описательные статистики. Меры среднего уровня
- Меры среднего уровня
- Меры рассеяния. Гистограммы
- Анализ статистических связей. Кросс-табуляция
- Тест хи-квадрат. Тесты Стьюдента
- Критерий Манна—Уитни
- Дисперсионный анализ. Метод Краскела—Уоллиса
- Понятие описательных статистик
- Контрольный тест
- Анализ связей
- Корреляционно-регрессионный анализ
- Корреляционная связь. Коэффициент корреляции Пирсона
- Ранговая корреляция. Коэффициент корреляции Спирмена
- Коэффициенты корреляции Фехнера и Кендалла
- Коэффициенты контингенции и ассоциации. Коэффициенты взаимной сопряженности
- Виды регрессионных моделей
- Регрессионный анализ
- Анализ связей
- Контрольный тест
- Практикум. Работа на платформе RapidMiner (Часть 1)
- Основные функции RapidMiner и принципы работы с ним
- Начальная подготовка данных с помощью RapidMiner
- Процедура проведения предиктивной аналитики в RapidMiner
- Кластеризация
- Кластерный анализ
- Классификация методов кластерного анализа. Меры расстояния и сходства
- Меры сходства для бинарных и категориальных переменных
- Агломеративные методы кластерного анализа
- Метод k-средних. Карты Кохонена
- Кластеризация
- Контрольный тест
- Мягкая и жесткая кластеризация
- Методы кластеризации
- Метод кластеризации DBSCAN
- Особенности метода DBSCAN
- Критерии качества кластеризации
- Мягкая и жесткая кластеризация
- Мягкая и жесткая кластеризация
- Контрольный тест
- Классификация
- Задача классификации
- Формирование тестовой и обучающей выборки
- Обзор основных методов классификации
- Методы классификации. Нейронные сети
- Деревья решений в задачах классификации
- Ирисы Фишера. Классификация деревьев решений
- Байесовская классификация. Анализ результатов классификации
- Классификация
- Контрольный тест
- Методы поиска ассоциативных правил
- Поиск ассоциативных правил
- Метод Apriori
- Шаблона последовательных событий
- Методы GSP и FP-Growth
- Методы поиска ассоциативных правил
- Контрольный тест
- Интеллектуальный анализ текста
- Текстовый анализ. Токенизация
- Регулярные выражения
- Удаление стоп-слов. Стемминг. Лемматизация
- Генерация признаков. Модель текстового анализа «мешок слов»
- Модель текстового анализ Word2vec. Нейросетевые методы текстового анализа
- Тематическое моделирование. Применение текстового анализа
- Интеллектуальный анализ текста
- Глоссарий
- Контрольный тест
- Практикум. Работа на платформе RapidMiner (Часть 2)
- Текстовый интеллектуальный анализ в RapidMiner
- Работа с ассоциативными правилами в RapidMiner
- Использование RapidMiner для решения задач классификации
Summary of User Reviews
Discover the latest advancements in Machine Learning and Big Data in this highly-rated course on Coursera. Users have praised the course for its comprehensive curriculum and engaging lectures, earning it a high overall rating.Key Aspect Users Liked About This Course
Many users have found the real-world case studies and hands-on projects to be particularly valuable.Pros from User Reviews
- Comprehensive curriculum covering a wide range of topics
- Engaging lectures with real-world applications
- Hands-on projects provide practical experience
- Great value for the price
- Experienced and knowledgeable instructor
Cons from User Reviews
- Some users found the pace of the course to be too fast
- Occasional technical issues with course materials
- Limited interaction with the instructor and other students
- Not suitable for complete beginners to Machine Learning