Course Summary
Learn how to collect and analyze data in Python with this hands-on course. You'll gain practical experience with web scraping, data cleaning, and data visualization using popular Python libraries such as BeautifulSoup, Pandas, and Matplotlib.Key Learning Points
- Learn how to collect and analyze data using Python
- Gain practical experience with web scraping, data cleaning, and data visualization
- Use popular Python libraries such as BeautifulSoup, Pandas, and Matplotlib
Related Topics for further study
Learning Outcomes
- Perform web scraping using Python
- Clean and preprocess data using Pandas
- Visualize data using Matplotlib
Prerequisites or good to have knowledge before taking this course
- Basic knowledge of Python programming
- Familiarity with data structures and algorithms
Course Difficulty Level
BeginnerCourse Format
- Online
- Self-paced
Similar Courses
- Python for Data Science
- Applied Data Science with Python
- Data Mining
Related Education Paths
Related Books
Description
В этом курсе мы изучим основы математической статистики и аккуратную работу с данными.
Knowledge
- Генерировать случайные величины из различных распределений и решать задачи с помощью симуляций
- Работать с API разных сервисов, писать парсеры для сбора данных, делать предобработку и предварительный анализ данных
- Понимать, какой смысл стоит за различными распределениями, центральной предельной теоремой и законом больших чисел
Outline
- Распределения и описательные статистики
- Дорожная карта курса
- Что такое случайность и как устроен мир
- Случайная величина и её распределение
- Характеристики случайных величин
- Какими бывают случайные величины
- Генерация случайных величин в python
- Описательные статистики
- [доска] Описательные статистики
- Гистограмма и эмпирическая функция распределения
- [доска] Эмпирическая функция распределения и гистограмма
- Эмпирическое распределение в python
- Описательные статистики и pandas
- Группировка и простые методы визуализации
- Поиск ответов на вопросы в pandas
- Почему важна визуализация
- Справочник по теории вероятностей
- Конспект по описательным статистикам
- Презентация
- Основные понятия теории вероятностей
- Выборочные статистики
- Особенности в данных
- Зависимые и независимые случайные величины
- [доска] Корреляция и кубик
- [доска] Независимость и ковариация
- Корреляции в python
- Нормальное распределение и его свойства
- Многомерное нормальное распределение
- [доска] Нормальное распределение
- Ядерные оценки плотности
- Пропуски и выбросы
- Преобразование Бокса-Кокса
- Масштабирование и категориальные переменные
- [бонусное видео] Сегментация
- Презентация
- Ковариация и корреляция
- Нормальное распределение
- Проблемы в данных
- Сбор и очистка данных
- Сбор данных своими руками
- Практика сбора данных: парсинг мемов (запрос данных)
- Практика сбора данных: парсинг мемов (структурирование данных)
- Практика сбора данных: парсинг мемов (детализация данных)
- Практика сбора данных: парсинг мемов (сбор всех операций в одну функцию)
- Практика сбора данных: парсинг мемов (итоговый цикл)
- Борьба с ошибками в процессе парсинга
- Знакомство с API ВКонтакте
- API ВКонтакте: получение датафрейма
- Знакомство с Selenium
- Полезные хитрости при сборе данных
- Презентация
- Парсер мемов
- API Вконтакте в python
- Работа с selenium в python
- Полезные хитрости для сбора данных
- Разведочный анализ данных и визуализация
- Разведочный анализ данных
- Предобработка данных в Python: описательные статистики
- Предобработка данных в Python: работа со временем
- Предобработка данных в Python: непрерывные переменные
- Предобработка данных в Python: категориальные и тестовые переменные
- Предобработка данных в Python: работа с графиками
- Поиск аномалий в данных
- Работа с логами: рассмотрение данных
- Работа с логами: возвращаемость и посещаемость
- Работа с логами: анализ покупок
- Работа с логами: анализ выручки
- Презентация
- Закон больших чисел и центральная предельная теорема
- Друзья нормального распределения
- Закон больших чисел (ЗБЧ)
- Сходимость по вероятности
- ЗБЧ в картинках
- Центральная предельная теорема
- ЦПТ в картинках
- Какими бывают сходимости
- Откуда компьютер берёт случайности
- Квантильное преобразование
- Что разрешает ЗБЧ (симуляции)
- Проклятье размерности
- Презентация
- Распределения, связанные с нормальным
- ЗБЧ и ЦПТ
Summary of User Reviews
Data Collection and Analysis in Python is a comprehensive course that covers all aspects of data collection and analysis in Python. The course is highly recommended by users who have taken it.Key Aspect Users Liked About This Course
The course offers a hands-on approach that allows learners to gain practical experience in data collection and analysis.Pros from User Reviews
- The instructors are knowledgeable and provide clear explanations.
- The course covers a wide range of topics in data collection and analysis.
- The assignments and quizzes are challenging and help learners to solidify their understanding.
- The course is well-structured and easy to follow.
- The course offers valuable insights into data collection and analysis that can be applied in real-world settings.
Cons from User Reviews
- Some users found the course to be too basic and not challenging enough.
- The course can be time-consuming, especially for those who are new to programming.
- Some users felt that the course could benefit from more interactive elements, such as live sessions or discussion forums.
- The course requires learners to have a basic understanding of Python programming.
- The course may not be suitable for those who are looking for a more advanced course in data collection and analysis.