Modernizing Data Lakes and Data Warehouses with GCP en Français
- 0.0
Course Summary
In this course, you will learn about data lakes and data warehouses on the Google Cloud Platform (GCP), and how to build and manage them using tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc.Key Learning Points
- Understand the differences between data lakes and data warehouses
- Learn how to build and manage data lakes and data warehouses on GCP
- Get hands-on experience with tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc
Job Positions & Salaries of people who have taken this course might have
- USA: $91,000
- India: ₹6,00,000
- Spain: €45,000
- USA: $91,000
- India: ₹6,00,000
- Spain: €45,000
- USA: $61,000
- India: ₹4,00,000
- Spain: €32,000
- USA: $91,000
- India: ₹6,00,000
- Spain: €45,000
- USA: $61,000
- India: ₹4,00,000
- Spain: €32,000
- USA: $118,000
- India: ₹9,00,000
- Spain: €60,000
Related Topics for further study
Learning Outcomes
- Ability to understand the differences between data lakes and data warehouses
- Ability to build and manage data lakes and data warehouses on GCP
- Hands-on experience with tools such as BigQuery, Cloud Dataflow, and Cloud Dataproc
Prerequisites or good to have knowledge before taking this course
- Basic knowledge of SQL
- Familiarity with GCP
Course Difficulty Level
IntermediateCourse Format
- Online self-paced course
- Video lectures
- Hands-on exercises
Similar Courses
- Data Engineering on Google Cloud Platform
- Data Analysis on Google Cloud Platform
Related Education Paths
- Google Cloud Certified - Professional Data Engineer
- Google Cloud Certified - Professional Cloud Architect
Notable People in This Field
- Data Scientist
- Engineer
Related Books
Description
Les deux principaux composants de tout pipeline de données sont les lacs de données et les entrepôts de données. Ce cours aborde les cas d'utilisation de chacun de ces systèmes de stockage, et présente en détail les solutions disponibles sur Google Cloud Platform. Il décrit également le rôle de Data Engineer et les atouts des pipelines de données pour l'entreprise, en plus d'expliquer l'intérêt de l'environnement cloud pour l'ingénierie de données. Vous vous familiariserez, dans le cadre d'exercices pratiques dans QwikLabs, aux concepts de lacs et d'entrepôts de données sur Google Cloud Platform.
Outline
- Introduction
- Présentation du cours
- Premiers pas avec Google Cloud Platform et Qwiklabs
- Data Engineering
- Découvrir le rôle d'un ingénieur de données
- Analyser les défis liés à l'ingénierie des données
- Présentation de BigQuery
- Lacs de données et entrepôts de données
- Démo : Requêtes fédérées avec BigQuery
- Bases de données transactionnelles et entrepôts de données
- Travailler efficacement avec d'autres équipes de gestion des données
- Gérer l'accès et la gouvernance des données
- Démo : Trouver les informations personnelles dans votre ensemble de données avec l'API DLP
- Créer des pipelines prêts à l'emploi
- Réviser l'étude de cas GCP
- Récapitulatif
- Présentation de l'atelier : Analyser avec BigQuery
- Introduction à Data Engineering
- Créer un lac de données
- Présentation des lacs de données
- Stockage de données et options ETL sur GCP
- Créer un lac de données avec Cloud Storage
- Démo : Optimiser les coûts avec les classes Google Cloud Storage et Cloud Functions
- Sécuriser Cloud Storage
- Stocker des données de tous types
- Démo : Exécuter des requêtes fédérées dans des fichiers Parquet et ORC dans BigQuery
- Stocker des données relationnelles dans le cloud
- Cloud SQL en tant que lac de données relationnelles
- Atelier : Charger les données des taxis dans Cloud SQL
- Créer un lac de données
- Créer un entrepôt de données
- L'entrepôt de données moderne
- Présentation de BigQuery
- Démo : Interroger des téraoctets de données en quelques secondes
- Premiers pas
- Charger des données
- Présentation de l'atelier : Charger des données dans BigQuery
- Explorer les schémas
- Démo : Explorer les schémas
- Conception de schémas
- Champs imbriqués et répétés
- Démo : Champs imbriqués et répétés
- Présentation de l'atelier : Utiliser les données JSON et Array dans BigQuery
- Optimiser avec le partitionnement et le clustering
- Démo : Créer des tables partitionnées
- Démo : Partitionnement et clustering
- Aperçu : Transformer les données par lots et les flux de données
- Récapitulatif
- Créer un entrepôt de données
- Résumé
- Résumé du cours
Summary of User Reviews
Discover the world of data lakes and data warehouses on GCP with this course. Students love the practical approach to learning and the real-world examples provided.Key Aspect Users Liked About This Course
Real-world examplesPros from User Reviews
- Practical approach to learning
- Great real-world examples
- Good pace and structure
- Instructors are knowledgeable and engaging
- Materials are well-organized and easy to follow
Cons from User Reviews
- Some technical issues with the platform
- Not enough hands-on exercises
- Lacks depth in certain areas
- Some topics are rushed through
- Course can be too basic for advanced learners