Building Batch Data Pipelines on GCP en EspaƱol

  • 0.0
Approx. 13 hours to complete

Course Summary

Learn how to build batch data pipelines using Google Cloud Platform's data processing technologies in this course. You'll gain hands-on experience with tools like Dataflow, BigQuery, and Dataproc to design and deploy efficient data pipelines.

Key Learning Points

  • Design and build batch data pipelines using GCP technologies
  • Learn how to use Dataflow, BigQuery, and Dataproc for data processing
  • Gain practical experience through hands-on labs and real-world projects

Job Positions & Salaries of people who have taken this course might have

    • USA: $91,000 - $142,000
    • India: ā‚¹5,00,000 - ā‚¹22,00,000
    • Spain: ā‚¬30,000 - ā‚¬50,000
    • USA: $91,000 - $142,000
    • India: ā‚¹5,00,000 - ā‚¹22,00,000
    • Spain: ā‚¬30,000 - ā‚¬50,000

    • USA: $110,000 - $160,000
    • India: ā‚¹6,50,000 - ā‚¹25,00,000
    • Spain: ā‚¬35,000 - ā‚¬55,000
    • USA: $91,000 - $142,000
    • India: ā‚¹5,00,000 - ā‚¹22,00,000
    • Spain: ā‚¬30,000 - ā‚¬50,000

    • USA: $110,000 - $160,000
    • India: ā‚¹6,50,000 - ā‚¹25,00,000
    • Spain: ā‚¬35,000 - ā‚¬55,000

    • USA: $85,000 - $130,000
    • India: ā‚¹4,50,000 - ā‚¹20,00,000
    • Spain: ā‚¬25,000 - ā‚¬45,000

Related Topics for further study


Learning Outcomes

  • Design and build efficient batch data pipelines
  • Deploy and manage data processing technologies on GCP
  • Gain practical experience through real-world projects

Prerequisites or good to have knowledge before taking this course

  • Basic understanding of data processing concepts
  • Familiarity with GCP or similar cloud platforms

Course Difficulty Level

Intermediate

Course Format

  • Self-paced
  • Online
  • Hands-on Labs

Similar Courses

  • Data Engineering with Google Cloud
  • Google Cloud Platform Big Data and Machine Learning Fundamentals
  • Dataflow Programming

Related Education Paths


Related Books

Description

Por lo general, la canalizaciĆ³n de datos se clasifica en uno de los siguientes paradigmas: Extraer-cargar, Extraer-cargar-transformar o Extraer-transformar-cargar. En este curso, se describe cuĆ”l es el paradigma que se debe usar y en quĆ© momento usarlo para los datos por lotes. AdemĆ”s, en este curso, se presentan diferentes tecnologĆ­as de Google Cloud Platform para la transformaciĆ³n de datos, entre las que se incluyen BigQuery, la ejecuciĆ³n de Spark en Cloud Dataproc, los grĆ”ficos de canalizaciĆ³n en Cloud Data Fusion y el procesamiento de datos sin servidores mediante Cloud Dataflow. Los participantes obtendrĆ”n experiencia prĆ”ctica sobre cĆ³mo compilar los componentes de la canalizaciĆ³n de datos en Google Cloud Platform mediante QwikLabs.

Outline

  • IntroducciĆ³n
  • IntroducciĆ³n al curso
  • CĆ³mo comenzar a usar GoogleĀ CloudĀ Platform y Qwiklabs
  • IntroducciĆ³n a las canalizaciones de datos por lotes
  • EL, ELT y ETL
  • Consideraciones sobre la calidad
  • CĆ³mo realizar operaciones en BigQuery
  • Limitaciones
  • ETL para resolver problemas de calidad de los datos
  • EL, ELT, ETL
  • CĆ³mo ejecutar Spark en Cloud Dataproc
  • El ecosistema de Hadoop
  • CĆ³mo ejecutar Hadoop en CloudĀ Dataproc
  • GCS en lugar de HDFS
  • CĆ³mo optimizar Dataproc
  • CĆ³mo optimizar el almacenamiento de Dataproc
  • CĆ³mo optimizar las plantillas y el ajuste de escala automĆ”tico de Dataproc
  • CĆ³mo optimizar la supervisiĆ³n de Dataproc
  • IntroducciĆ³n al lab: CĆ³mo ejecutar trabajos de ApacheĀ Spark en CloudĀ Dataproc
  • Resumen
  • CĆ³mo ejecutar Spark en Cloud Dataproc
  • Administre canalizaciones de datos con Cloud Data Fusion y Cloud Composer
  • IntroducciĆ³n
  • Componentes de DataĀ Fusion
  • CĆ³mo compilar una canalizaciĆ³n
  • CĆ³mo explorar datos con Wrangler
  • Lab: CĆ³mo compilar y ejecutar un grĆ”fico de canalizaciĆ³n en CloudĀ DataĀ Fusion
  • CĆ³mo organizar el trabajo entre los servicios de GCP con CloudĀ Composer
  • Entorno de ApacheĀ Airflow
  • DAG y operadores
  • ProgramaciĆ³n del flujo de trabajo
  • SupervisiĆ³n y registro
  • Lab: IntroducciĆ³n a CloudĀ Composer
  • Cloud Data Fusion y Cloud Composer
  • Procesamiento de datos sin servidores con Cloud Dataflow
  • Cloud Dataflow
  • Por quĆ© los clientes valoran Dataflow
  • CĆ³mo compilar canalizaciones de CloudĀ Dataflow en el cĆ³digo
  • Consideraciones claves para el diseƱo de canalizaciones
  • CĆ³mo transformar datos con PTransforms
  • Lab: CĆ³mo compilar una canalizaciĆ³n simple de Dataflow
  • CĆ³mo agregar elementos con GroupByKey y Combine
  • Lab: MapReduce en CloudĀ Dataflow
  • Datos de entrada adicionales y ventanas de datos
  • Lab: PrĆ”ctica con datos de entrada adicionales de la canalizaciĆ³n
  • CĆ³mo crear y reutilizar plantillas de canalizaciĆ³n
  • Canalizaciones de CloudĀ DataflowĀ SQL
  • Procesamiento de datos con Cloud Dataflow
  • Resumen
  • Resumen del curso

Summary of User Reviews

Learn how to build efficient and scalable batch data pipelines on GCP with this course.

Key Aspect Users Liked About This Course

The course provides hands-on experience with real-world projects.

Pros from User Reviews

  • Great introduction to GCP data pipelines
  • Excellent hands-on experience with real-world projects
  • Instructor is knowledgeable and engaging

Cons from User Reviews

  • The course may be too basic for advanced users
  • Some sections feel rushed
  • Not enough emphasis on troubleshooting and debugging
Spanish
Available now
Approx. 13 hours to complete
Google Cloud Training
Google Cloud
Coursera
Share
Saved Course list
Cancel
Get Course Update
Computer Courses