En este curso, aprenderás sobre los entresijos de BigQuery y las mejores prácticas para diseñar, optimizar y administrar tu almacén de datos. A través de una combinación de presentaciones, demostraciones y laboratorios, conocerás la arquitectura de BigQuery y cómo diseñar un almacenamiento y esquemas para la ingestión y cambios de datos. A continuación, aprenderás técnicas para mejorar el rendimiento de lectura, optimizar consultas, gestionar cargas de trabajo y utilizar herramientas de registro y monitorización. También aprenderás sobre los diferentes modelos de precios. Por último, conocerás varios métodos para proteger datos, automatizar cargas de trabajo y construir modelos de aprendizaje automático con BigQuery ML.
Objectivos
Este curso enseña a los participantes las siguientes habilidades:
- Describir los fundamentos de la arquitectura de BigQuery.
- Implementar patrones de diseño de almacenamiento y esquema para mejorar el rendimiento.
- Usar DML y programar transferencias de datos para la ingestión de datos.
- Aplicar las mejores prácticas para mejorar la eficiencia de lectura y optimizar el rendimiento de las consultas.
- Administrar capacidad y automatizar cargas de trabajo.
- Comprender los patrones versus anti-patrones para optimizar las consultas y mejorar el rendimiento de lectura.
- Utilizar herramientas de registro y monitoreo para entender y optimizar patrones de uso.
- Aplicar las mejores prácticas de seguridad para gobernar datos y recursos.
- Construir e implementar varias categorías de modelos de aprendizaje automático con BigQuery ML.
Público
Esta clase está dirigida a la siguiente audiencia:
- Analistas de datos, científicos de datos, ingenieros de datos y desarrolladores que realizan trabajos a una escala que requiere un conocimiento avanzado de los entresijos de BigQuery para optimizar el rendimiento.
Prerrequisitos
Para aprovechar al máximo este curso, los participantes deben cumplir con los siguientes criterios:
- Tener conocimiento o experiencia con Google Cloud, equivalente al curso Big Data and Machine Learning Fundamentals.
Duración
3 días
Inversión
Resumen del curso
- Explain the benefits of columnar storage.
- Understand how BigQuery processes data.
- Explore the basics of BigQuery’s shuffling service to improve query efficiency.
- Compare the performance of different schemas (snowflake, denormalized, and nested and repeated fields).
- Partition and cluster data for better performance.
- Improve schema design using nested and repeated fields.
- Describe additional best practices such as table and partition expiration.
- Ingest batch and streaming data.
- Query external data sources.
- Schedule data transfers.
- Understand how to use Storage Write API.
- Write DML statements.
- Address common DML performance problems and bottlenecks.
- Identify slowly changing dimensions (SCD) in your data and make updates.
- Explore BigQuery’s cache.
- Create materialized views.
- Work with BI Engine to accelerate your SQL queries.
- Use the Storage Read API for fast access to BigQuery-managed storage.
- Explain the caveats of using external data sources.
- Interpret BigQuery execution details and the query plan.
- Optimize query performance by using suggested methods for SQL statements and clauses.
- Demonstrate best practices for functions in business use cases.
- Define a BigQuery slot.
- Explain pricing models and pricing estimations (BigQuery UI, bq dry_run, jobs API).
- Understand slot reservations, commitments, and assignments.
- Identify best practices to control costs.
- Use Cloud Monitoring to view BigQuery metrics.
- Explore the BigQuery admin panel.
- Use Cloud Audit logs.
- Work with INFORMATION_SCHEMA tables to get insights for your BigQuery entities.
- Explore data discovery using Data Catalog.
- Discuss data governance using DLP API and Data Catalog.
- Create IAM policies (e.g., authorized views) to secure resources.
- Secure data with classifications (e.g., row-level policies).
- Understand how BigQuery uses encryption.
- Schedule queries.
- Use scripting and stored procedures to build custom transformations.
- Describe how to integrate BigQuery workloads with other Google Cloud big data products.
- Describe some of the different applications of BigQuery ML.
- Build and deploy several categories of machine learning models with BigQuery ML.
- Use AutoML Tables to solve high-value business problems.