FREUNDT
LABS
Volver a Research
LakehouseStreamingApache IcebergArquitectura

Lakehouse en Tiempo Real: Construyendo la Capa de Streaming sin Perder Confiabilidad Batch

Joshi Lopez

Joshi Lopez

Senior Data & Platform Engineer

5 de marzo de 2026
11 min de lectura
Lakehouse en Tiempo Real: Construyendo la Capa de Streaming sin Perder Confiabilidad Batch

El debate entre streaming y batch es una falsa dicotomía. El lakehouse moderno necesita ambos, y la arquitectura que los hace coexistir sin fricción.

La arquitectura lakehouse ha madurado significativamente en los últimos tres años. Lo que comenzó como un término de marketing es ahora un patrón arquitectónico legítimo con sólidas bases open source.

El Problema Lambda, Revisitado

La arquitectura lambda clásica intentó resolver la dualidad streaming-batch con dos rutas de procesamiento separadas. La carga de mantenimiento era significativa. Dos codebases, dos conjuntos de garantías de calidad, dos modos de fallo que gestionar.

Apache Iceberg como Capa de Reconciliación

La idea clave en el diseño moderno de lakehouse es usar un formato de tabla transaccional, específicamente Apache Iceberg como capa de reconciliación entre escrituras de streaming y lecturas batch. Los jobs de streaming escriben micro-batches en tablas Iceberg. Los jobs batch leen snapshots consistentes. Ambos operan sobre los mismos datos físicos sin overhead de bloqueo o coordinación.

La Arquitectura

El patrón involucra: Kafka para streaming de eventos, Flink para procesamiento de flujos hacia Iceberg, dbt para transformaciones batch sobre Iceberg, y un motor de consultas (Trino o Spark SQL) para servir. El resultado es un sistema que entrega frescura casi en tiempo real con las garantías de confiabilidad de un data warehouse tradicional.

Sobre el investigador

Joshi Lopez

Joshi Lopez

Senior Data & Platform Engineer

Ingeniero de datos senior con experiencia en entornos financieros de alta exigencia. Especializado en arquitecturas lakehouse, plataformas cloud y pipelines end-to-end sobre Databricks, Azure y AWS. Diseña sistemas donde la integridad del dato no es opcional.

Cómo citar este artículo

Lopez, J. (2026). "Lakehouse en Tiempo Real: Construyendo la Capa de Streaming sin Perder Confiabilidad Batch." Freundt Labs Research. freundtlabs.com/research/arquitectura-lakehouse-tiempo-real

Haz clic en el texto para seleccionarlo y copiarlo.

Freundt Labs

¿Listo para construir
en serio?

Del criterio técnico al sistema en producción. Un equipo de primer nivel que entiende tu negocio y construye contigo lo que viene.