El análisis de datos ha crecido exponencialmente como una de las áreas transversales más interesantes en la empresa, aplicado a campos tan diversos como la salud, inversión, gestión pública, educación, mantenimiento y desarrollo de sistemas industriales, agronomía, márketing y comercial, etc.
BigQuery es uno de los Data Warehouses más importantes (#19 en db-engines.com), utilizado por Uber, Twitter, Spotify, Vodafone, Home Depot, Ford, etc., desarrollado por la propia Google originalmente para sus necesidades de escala en sus propios servicios.
En este curso veremos una introducción 100% práctica al análisis de datos utilizando BigQuery como la principal herramienta de análisis de datos en el ecosistema de servicios en la nube de Google Cloud, por su gran potencia de ejecución, capacidad y nulo mantenimiento del servicio o su infraestructura ("serverless").
Objetivos
- Introducir al alumno en el análisis de datos en la nube de Google Cloud con BigQuery como servicio principal.
- Explicar cómo analizar, procesar y almacenar datos en un data warehouse (DWH).
- Practicar el análisis de datos con SQL en una variedad de campos y aplicaciones.
- Mostrar las posibilidades de visualización de datos integrada con Looker Studio y de entrenamiento de modelos de ML con BigQuery ML
Perfil del alumno
- Ingenieros IT
- Analistas de datos y de negocio
- Científicos de datos e ingenieros de ML/IA
- Matemáticos y científicos
- "Ciudadanos digitales" interesados en iniciarse en el mundo técnico del análisis de datos
Conocimientos previos recomendados
- Conocimientos básicos de SQL y BBDD relacionales
Contenido
- Presentación del curso
- Introducción al curso
- Entorno de trabajo
- Introducción al análisis de datos en Google Cloud
- Introducción a la nube y Google Cloud
- Arquitectura de data lakes y data warehouses
- EL, ELT, ETL
- Ingeniería de datos en GCP
- BigQuery como Data Warehouse
- Introducción a BigQuery
- Arquitectura
- Organización de datos
- Análisis de datos con SQL
- Precios, facturación y uso gratuito
- Ingesta y almacenamiento de datos
- Fuentes de datos disponibles
- Carga de datos manual y automatizada
- Almacenamiento en BigQuery
- Integración con otras fuentes de datos
- Consultas federadas
- Análisis de datos a escala
- Procesado y tratamiento de datos
- Vistas lógicas y materializadas
- Optimización de consultas
- Particiones y clustering
- Tablas normalizadas y denormalizadas
- Seguridad y control de acceso
- Notebooks Python y Spark en BigQuery Studio
- Visualización de datos y Business Intelligence
- Integración con Looker Studio y otras herramientas de BI
- BI Engine
- Modelos de ML e IA con BigQuery ML
- Entrenamiento automático de modelos
- MLOps
Fechas y horarios
Fechas; del 11 al 15 de noviembre 2024
Horario: de lunes a viernes de 18:00 a 21:00
Imparte
Marcos Manuel Ortega
Metodología
Curso online síncrono por vídeoconferencia
Inscripciones
El curso es gratuito, financiado por el Gobierno de La Rioja. La inscripción no garantiza la obtención de plaza en el curso, en caso de tener más inscripciones que plazas se hará una selección de los alumnos. Los alumnos deberán confirmar su asistencia una vez seleccionados.
Inscripción