Course Summary
Learn how to process and analyze Big Data with this comprehensive course. Gain hands-on experience with popular Big Data technologies like Hadoop, MapReduce, and Spark.Key Learning Points
- Learn how to process and analyze large amounts of data using Hadoop, MapReduce, and Spark
- Gain hands-on experience with real-world Big Data projects
- Learn how to optimize data processing for speed and scalability
Related Topics for further study
Learning Outcomes
- Ability to process and analyze large amounts of data using Hadoop, MapReduce, and Spark
- Hands-on experience with real-world Big Data projects
- Optimization skills for data processing for speed and scalability
Prerequisites or good to have knowledge before taking this course
- Basic programming knowledge
- Basic understanding of data structures and algorithms
Course Difficulty Level
IntermediateCourse Format
- Online
- Self-paced
- Hands-on
Similar Courses
- Introduction to Big Data
- Big Data Analytics Using Spark
- Big Data Essentials: HDFS, MapReduce and Spark RDD
Related Education Paths
Notable People in This Field
- Creator of Hadoop
- Creator of Apache Spark
Related Books
Description
El presente curso tiene como objetivo presentar los métodos y técnicas básicos para el procesamiento y análisis de datos en el contexto de Big Data. No prentende ser un curso exhaustivo sobre Machine Learning ni sobre métodos Estadísticos, simplemente se pretenden mostrar las características principales de estas técnicas para que el alumno pueda tener una visión general de las opciones que ofrece el análisis de datos para poder explorar, confirmar indicios y en definitiva, extraer conclusiones.
Outline
- INTRODUCCIÓN
- Presentación de la especialización
- Presentación del curso
- Bienvenida
- Contenidos del curso (Temario)
- Organización del curso y evaluación
- Resolver dudas e incidencias
- Sobre el certificado
- FAQs - Generales
- FAQs - Cuestionarios y ejercicios
- FAQs - Certificado
- Enlaces relacionados
- LA MÁQUINA VIRTUAL
- Introducción
- Instalación de la máquina virtual - Import start
- Instalación de la máquina virtual - Tips
- Instalación de la máquina virtual - Pyspark setup
- Link para la descarga de la MV_Cloudera
- Instalación de la MV - Import start
- Instalación de la MV - Tips
- Instalación de la MV - Pyspark setup
- MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO
- FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE
- INICIO DE LA SESIÓN - IMPORTANTE
- MÓDULO 1 - Análisis Exploratorio de Datos
- Introducción
- Datos - Fuentes de información
- Distintos problemas y técnicas
- Caso de estudio y herramientas
- Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)
- Exploración de la estructura de datos (S1E5.ipynb)
- Primera etapa del análisis exploratorio (S1E6.ipynb)
- Preproceso de datos (I) - (S1E7.ipynb)
- Preproceso de datos (II) - (S1E8.ipynb)
- Segunda etapa del análisis exploratorio (S1E9.ipynb)
- Cuestionario 1
- Cuestionario 2
- Cuestionario 3
- Cuestionario 4
- Cuestionario 5
- Cuestionario 6
- MÓDULO 2 - MODELOS DE REGRESIÓN
- Introducción
- Objetivo de la Modelización
- Calibración del modelo
- Resultado de la Modelización
- Regresión Simple (S2E4.ipynb)
- Nuevas variables (S2E5.ipynb)
- Regresión Múltiple (I) (S2E6.ipynb)
- Regresión Múltiple (II) (S2E7.ipynb)
- Regresión Logística (I) (S2E8.ipynb)
- Regresión Logística (II) (S2E9.ipynb)
- Cuestionario 1
- Cuestionario 2
- Cuestionario 3
- Cuestionario 4
- Cuestionario 5
- Cuestionario 6
- Cuestionario 7
- MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN
- Introducción
- Introducción a la Modelización
- Medir la Incertidumbre
- Concepto de Árbol
- Árboles de Regresión
- Modelización con Árboles de Regresión (S3E5.ipynb)
- Árboles de Clasificación
- Modelización con Árboles de Clasificación (S3E7.ipynb)
- Bosques Aleatorios
- Modelización con Bosques Aleatorios (S3E9.ipynb)
- Cuestionario 1
- Cuestionario 2
- Cuestionario 3
- Cuestionario 4
- Cuestionario 5
- Cuestionario 6
- Cuestionario 7
- MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS
- Introducción
- Redes Neuronales
- Modelización con redes neuronales (S4E2.ipynb)
- Introducción al reconocimiento de patrones
- Reducción dimensión
- Análisis de componentes principales (S4E6.ipynb)
- Clasificación automática
- Análisis de clústers (S4E8.ipynb)
- Revisión de la ciencia de datos (I)
- Revisión de la ciencia de datos (II)
- TRABAJO PRÁCTICO - Enunciado
- Cuestionario 1
- Cuestionario 2
- Cuestionario 3
- Cuestionario 4
- Cuestionario 5
- Cuestionario 6
- Cuestionario del Ejercicio Práctico
Summary of User Reviews
Discover the power of big data processing and analysis with this Coursera course. Students have praised the course for its comprehensive content and valuable insights into the field of big data processing and analysis.Key Aspect Users Liked About This Course
The course provides a comprehensive overview of big data processing and analysis, providing valuable insights into the field.Pros from User Reviews
- The course is well-structured and provides a comprehensive overview of big data processing and analysis.
- The instructors are knowledgeable and provide valuable insights into the field.
- The course is engaging and interactive, making it easy to learn and understand complex concepts.
- The course provides hands-on experience with big data tools and technologies.
- The course is suitable for both beginners and experienced professionals in the field.
Cons from User Reviews
- The course can be time-consuming and requires a significant amount of effort to complete.
- The course may be too basic for experienced professionals in the field.
- The course may not provide enough practical experience for some students.
- The coursework can be challenging and requires a strong understanding of programming and data analysis.
- The course may not cover all the latest trends and technologies in the field.