Hoy aprendí lo qué es un Data Lake

“A data lake is a storage repository that holds a vast amount of raw data in its native format, including structured, semi-structured, and unstructured data. The data structure and requirements are not defined until the data is needed.”

https://blog.nucleusanalytics.com/data-warehouse-vs.-data-lake-and-why-it-matters

“Un data lake es un repositorio de almacenamiento que contiene una enorme cantidad de datos sin procesar, en su forma nativa, incluyendo a aquellos estructurados, semi estructurados y no estructurados. La estructura de datos y requerimientos no son definidos hasta que los datos se necesiten”

Concepto importante en un contexto de integración actual de datos provenientes de distintas fuentes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.