Cómo modernizar tu arquitectura de Business Intelligence con Data Lakehouse

Blog ABAST

Cómo modernizar tu arquitectura de Business Intelligence con Data Lakehouse

26 de marzo de 2024

Data Warehouse, Data Lake, Data Lakehouse… Hoy en día nuestros diccionarios evolucionan de una manera vertiginosa y muchas veces no tenemos tiempo para entender los nuevos conceptos que van apareciendo en el sector del análisis de datos. Desde finales de los 80, los Data Warehouse han ido evolucionando de muchas maneras: nuevas herramientas de ETL, motores de base de datos más potentes y más facilidad parar crear modelos de datos entre otros.

Por Àlex Ginés, BI & BA Business Manager

Entrados los 2000, se empezó escuchar la palabra Data Lake y aparecieron las primeras menciones a tecnologías como MapReduce, Hadoop, Spark e incluso Hive, y con todas estas tecnologías aparecen también un montón de palabras ininteligibles para la gente de a pie.

¿Qué tienen de bueno los Data Lake? Los Data Lakes ofrecen una clara ventaja en flexibilidad y capacidad para gestionar datos no estructurados y semi-estructurados. Sin embargo, la contrapartida principal consiste en la organización de estos datos, ya que suelen almacenarse en archivos que pueden resultar difíciles de gestionar.

Y entonces…¿qué es un Data Lakehouse? Es juntar lo mejor de los dos mundos: la potencia para tratar datos de todo tipo junto a las características analíticas habituales de tener un Data Warehouse.

Para desplegar este tipo de soluciones, necesitamos nuevas herramientas y metodologías. Por ejemplo, los llamados Data Lakehouse se suelen estructurar en tres capas llamadas Bronze, Silver y Gold:

  1. Bronze: datos en estado original y sin procesado
  2. Silver: datos procesados y limpios, pero de manera básica
  3. Gold: datos procesados con lógica de negocio aplicada y listos para ser explotados.

Una arquitectura típica para ejemplificar este ecosistema, en este caso dentro de Azure y bajo el paraguas de Microsoft, sería la siguiente:

Captura de pantalla 2024-03-25 173011

Cada pieza de esta arquitectura cumple una función importante:

  • Azure Data Lake: repositorio dónde residirá nuestro Data Lakehouse
  • Azure Data Factory: integrador de datos de los orígenes al Data Lake
  • Azure Databricks: motor de procesado de datos y encargado de ejecutar las transformaciones de datos
  • Azure Key Vault & DevOps: securización de credenciales y control de código
  • Power BI: herramienta de Business Intelligence que nos permitirá analizar los datos de una manera ágil y visual

Al final del día, lo que buscamos son resultados y tomar decisiones en el momento oportuno. Para ello, plataformas como la anterior son excelentes porque se ajustan a nuestras necesidades en tiempo real. La nube juega un papel clave al ser un catalizador de la innovación.

 

En próximas entradas del blog, os explicaremos más en detalle cómo funciona esta arquitectura y cada una de sus piezas y os daremos consejos para que le saquéis el máximo partido.

Si estás interesado en conocer más sobre las últimas tendencias en análisis de datos o si te gustaría probar la tecnología Data Lakehouse con un caso práctico, no dudes en ponerte en contacto con nosotros

Últimos posts publicados en el Blog de ABAST

UiPath Communications Mining: Transformando la Comunicación Empresarial

UiPath Communications Mining nos ayudará a comprender y actuar con rapidez sobre cada mensaje que recibimos, para mejorar la experiencia de nuestros clientes.
Leer más

GLPI: La solución ideal para iniciar la Gestión de Servicios TI

Para aquellos que buscan una herramienta eficaz y accesible para iniciar su camino en la gestión de servicios de TI, GLPI se presenta como una…
Leer más

Claves para la adopción de Microsoft Copilot

Las organizaciones interesadas en incorporar COPILOT deberían, antes de ponerse en marcha, pensar en establecer una estrategia apropiada para su adopción. Sin duda aporta significativos…
Leer más

Registration

Forgotten Password?