Data Lakehouse
Un data lakehouse est une architecture de stockage de données qui combine la souplesse et le faible coût d'un data lake (fichiers bruts dans un object storage type S3) avec les capacités transactionnelles et analytiques…
Un [data](/ressources/glossaire-de-la-tech/data-donnee) lakehouse est une architecture de stockage de données qui combine la souplesse et le faible coût d'un data lake (fichiers bruts dans un object storage type S3) avec les capacités transactionnelles et analytiques d'un data warehouse (ACID, schémas, requêtes SQL performantes).
Le lakehouse repose sur des formats de table ouverts comme Apache Iceberg, Delta Lake ou Apache Hudi, qui ajoutent une couche de métadonnées au-dessus de fichiers Parquet pour offrir transactions, time travel et évolution de schéma.
Les plateformes de référence sont Databricks (Delta Lake), Snowflake (Iceberg), AWS Athena et les déploiements Iceberg-natifs sur Trino, DuckDB ou ClickHouse. Le lakehouse est devenu en 2026 le pattern dominant pour la data analytics à l'échelle.
