Serverless Data Processing with Dataflow: Develop Pipelines en Español
En esta segunda parte de la serie de cursos sobre Dataflow, analizaremos en profundidad el desarrollo de canalizaciones con el SDK de Beam. Comenzaremos con un repaso de los conceptos de Apache Beam. A continuación, analizaremos el procesamiento de datos de transmisión con ventanas, marcas de agua y activadores. Luego, revisaremos las opciones de fuentes y receptores en sus canalizaciones, los esquemas para expresar datos estructurados y cómo realizar transformaciones con estado mediante las API de State y de Timer. Después, revisaremos las prácticas recomendadas que ayudan a maximizar el rendimiento de las canalizaciones. Al final del curso, presentaremos SQL y Dataframes para representar su lógica empresarial en Beam y cómo desarrollar canalizaciones de forma iterativa con notebooks de Beam.
Watch on External: Coursera ↗
(saves to browser)
Sign in to unlock AI tutor explanation · ⚡30
Related AI Lessons
⚡
⚡
⚡
⚡
Pandas and Data Visualization Using Matplotlib and Seaborn
Dev.to · Joseous Ng'ash
The Data Engineer’s Job Is Changing Faster Than Anyone Admits — Here’s What’s Actually Coming in…
Medium · AI
Pandas vs Polars vs DuckDB 2026: I Processed 1 Million Rows in FastAPI (Pandas Crashed My RAM…
Medium · AI
Pandas vs Polars vs DuckDB 2026: I Processed 1 Million Rows in FastAPI (Pandas Crashed My RAM…
Medium · Machine Learning
🎓
Tutor Explanation
DeepCamp AI