Saltar a contenido

Prólogo

La explosión del volumen de datos que manejan las organizaciones compromete el modelo operacional clásico de gestión de datos y eleva el concepto Data Stack (pila de datos) al nivel de componente esencial para cualquier empresa que desee mantener su competitividad. Sin embargo, el ritmo cada vez más acelerado de la innovación tecnológica y la proliferación de la jerga técnica hacen que comprender qué supone una pila de datos moderna resulte difícil, incluso para quienes poseen una formación técnica sólida

iceberg.png

¿Qué es un Data Stack?

En tecnología, el término stack (pila) se utiliza para describir un grupo de componentes que funcionan conjuntamente para alcanzar un objetivo común. Los ingenieros de software aprovechan una pila tecnológica para crear productos con diversos fines. Del mismo modo, una pila de datos se refiere al conjunto interconectado de herramientas y tecnologías que permiten a las empresas recopilar, almacenar, procesar y analizar datos de forma escalable y rentable. El objetivo final de una pila de datos es transformar los datos crudos en información valiosa que sirva de base para la toma de decisiones

MDS: Modern Data Stack

Históricamente las organizaciones diseñaron e implementaron infraestructuras de datos que se basaban en arquitecturas monolíticas y componentes personalizados, que requerían importantes inversiones en infraestructura y personal de TI. Debido al procesamiento de datos local, la escalabilidad del rendimiento estaba limitada por la capacidad del hardware instalado, lo que la convertía en una estructura compleja, rígida y costosa de mantener y escalar

Por el contrario, una pila de datos moderna explota fuentes de datos locales o remotas e integra componentes listos para usar que se centran en aspectos específicos del procesamiento y la gestión de datos. Este enfoque modular hace que el MDS sea altamente escalable y más fácil de gestionar. Muchas herramientas MDS cuentan con el soporte activo de comunidades y se ofrecen como SaaS (Software as a Service) u open core. Las herramientas de pila de datos modernas están diseñadas para ser fáciles de usar, con un diseño de bajo código, o sin código, y modelos de precios basados en el uso que las hacen accesibles a empresas de todos los niveles

Una pila de datos moderna suele constar de seis áreas o dimensiones cada una de las cuales incorpora un conjunto distinto de tecnologías que funcionan conjuntamente para proporcionar funcionalidades específicas. Este marco permite una amplia gama de casos de uso, desde el análisis hasta la inteligencia empresarial, la ciencia de datos y el aprendizaje automático. La composición concreta de una pila de datos moderna depende de las necesidades específicas y la escala de una organización, que determinan si un componente es una herramienta única o una combinación de varias herramientas

Info

Siguiente: Sección Arquitectura MDS