¿Qué es un Data Warehouse?
- Kimball vs a Inmon en la arquitectura del almacén de datos
- Kimball vs.Inmon en el enfoque de construcción de un data warehouse de datos
- ¿Cuales son los Principales aportes o ventajas de un datawarehouse empresarial ?
- ¿Como es la estructuras o arquitectura de un Data Warehouse?
- ¿Cuales son las características del Data warehouse?
- Elementos que integran un Data warehouse.
- Diseño de un Data Warehouse.
- Razones para poner en marcha un datawharehouse
Kimball vs a Inmon en la arquitectura del almacén de datos
Ambas arquitecturas de un Data Warehouse, la de Kimball y la de Inmon, tienen en común que cada una cuenta con un único repositorio integrado de datos atómicos. En la arquitectura de Inmon, se denomina almacén de datos empresarial. Y en la arquitectura de Kimball, se conoce como almacén de datos dimensional. Ambas arquitecturas tienen un enfoque empresarial que apoya el análisis de la información en toda la organización. Este enfoque permite abordar los requisitos de la empresa no sólo dentro de un área temática, sino también entre áreas temáticas.
Sin embargo, hay algunas diferencias en las arquitecturas de almacén de datos de ambos expertos:
Kimball utiliza el modelo dimensional, como los esquemas en estrella o los copos de nieve, para organizar los datos en el almacén de datos dimensional, mientras que Inmon utiliza el modelo ER en el almacén de datos empresarial. Inmon sólo utiliza el modelo dimensional para los mercados de datos, mientras que Kimball lo utiliza para todos los datos.
Inmon utiliza los marts de datos como separación física del almacén de datos de la empresa y se construyen para usos departamentales. Mientras que en la arquitectura de Kimball, no es necesario separar los marts de datos del almacén de datos dimensional.
En el almacén de datos dimensional de Kimball, los sistemas analíticos pueden acceder a los datos directamente. Mientras que en la arquitectura de Inmon, los sistemas analíticos sólo pueden acceder a los datos de un almacén de datos empresarial a través de los marts de datos.
Kimball vs.Inmon en el enfoque de construcción de un data warehouse de datos
Bill Inmon recomienda construir un almacén de datos que siga el enfoque de arriba hacia abajo. En la filosofía de Inmon, está comenzando con la construcción de un gran almacén de datos empresarial centralizado donde todos los datos disponibles de los sistemas de transacciones se consolidan en una colección de datos orientada al tema, integrada, variable en el tiempo y no volátil que respalda la toma de decisiones. luego, los data marts se construyen para las necesidades analíticas de los departamentos.
A diferencia del enfoque de Bill Inmon, Ralph Kimball recomienda construir el almacén de datos que sigue el enfoque de abajo hacia arriba. En la filosofía de Kimball, primero comienza con mercados de datos de misión crítica que atienden las necesidades analíticas de los departamentos. Luego, está integrando estos mercados de datos para la coherencia de los datos a través de un denominado bus de información. Kimball utiliza el modelo dimensional para abordar las necesidades de los departamentos en diversas áreas dentro de la empresa.
La definición de Data Warehouse (DW) llegó de la mano de Bill Inmon y Ralph Kimball. los dos pensaron en un único repositorio de información para poder integrar y explotar información de múltiples sistemas de origen. Pero, más allá de esta generalización conceptual, cada uno decidió hacerlo a su manera. Entonces, veamos qué es lo que propone cada uno de ellos:
Kimball sugiere utilizar una metodología Bottom-Up, donde la información se extrae de los sistemas transaccionales para ser cargada en diferentes Data Marts cada uno de los cuales son independientes, están modelados en forma dimensional y tienen foco departamental. Estos Data Marts podrían ser implementados con tecnología ROLAP o MOLAP.
Básicamente para una empresa un Data Warehouse es un almacén electrónico donde se guarda una gran cantidad de información, sin embargo muchos autores señalan que representa más relevancia dentro de sus funciones, ya que no solo es un depósito permanente, sino que es el lugar en cual que se recopilan los datos elementales de manera integrada para organizar, comprender y sustentar la generación y presentación de informes que favorecen la toma de decisiones, así como su posterior análisis todo en relación a la inteligencia de negocio.
Cuando se tienen volúmenes de datos que requieren un procesamiento y gran análisis, es en donde entra en juego tener un potente plan de información obteniendo una data warehouse, a través de la cual se garantiza que los datos de cada sistema se almacenen de una forma confiable, segura, con fácil recuperación y buena administración.
Comúnmente una data warehouse se instala para migrar la información en un servidor corporativo o en la nube, siendo esta última la más utilizada por los beneficios que brinda, ofreciendo mayor protección, así como mejor consolidación, racionalización y lo más importante es que monetiza rápidamente los datos dentro de la nube.
Los cinco componentes de un almacén de datos son según Gartner :
- Fuentes de datos de producción.
- Extracción y conversión de datos.
- Sistema de gestión de la base de datos del almacén de datos.
- Administración del almacén de datos.
- Herramientas de inteligencia empresarial (BI)
Un almacén de datos contiene datos organizados en áreas temáticas abstractas con versiones de los mismos registros que varían en el tiempo, con un nivel apropiado de grano de datos o de detalle para que sean útiles en dos o más tipos de análisis diferentes, a menudo desplegados con tendencia a la tercera forma normal. Un mercado de datos contiene datos similares orientados a temas y variables en el tiempo, pero con relaciones que implican un uso dimensional de los datos en el que los hechos están claramente separados de los datos dimensionales, lo que los hace más apropiados para categorías únicas de análisis.
¿Cuales son los Principales aportes o ventajas de un datawarehouse empresarial ?
- Proporciona una herramienta fundamental basada en la información integrada y amplia de un negocio para que los ejecutivos puedan tomar decisiones en cualquier área de trabajo.
- Favorece la ejecución de aplicaciones que suministran técnicas estadísticas de análisis y modelización, hallando conexiones ocultas entre los datos almacenados que sin duda es una herramienta muy útil para el manejo de esta información.
- Facilita la capacidad de comparar y aprender de los datos recabados antiguamente y proyecta situaciones venideras en diversos escenarios.
- Reduce la creación de sistemas de gestión integral dentro de la empresa que favorecen la relación profesional con el cliente.
¿Como es la estructuras o arquitectura de un Data Warehouse?
La Data Warehouse está compuesta por tres estructuras simples que se dividen de la siguiente forma.
- Estructura Básica.
Mediante este componente, los archivos planos y los sistemas operativos facilitan datos e información en bruto que inmediatamente se guardan en el almacén o Data Warehouse junto a los metadatos, luego son analizados directamente por el consumidor final generando informes y minería.
- Estructura con un área de ensayo.
Cuando se incorpora un área de ensayo, la información que se recoge tiene un espacio entre la fuente de datos y la Data Warehouse donde se resguardan y pasan por un proceso de limpieza antes de ingresar al almacén, adicional a esto se puede aplicar una configuración que puede ser personalizada para clasificar la información de grupos internos de acuerdo a la organización.
- Estructura con área de ensayo y data marts.
Un data marts es un subconjunto que aglomera datos para facilitar que un espacio en particular descifre las mejores decisiones, pudiendo obtener grupos individuales de distintas áreas como inventarios, compra y ventas entre otros, logrando que los usuarios directos ingresen de forma ordenada según sean sus necesidades.
¿Cuales son las características del Data warehouse?
El término Data warehouse traducido literalmente del ingles significa “almacén de datos”, obviamente esta descripción se queda corta para todo lo que ofrece dentro de una organización, a continuación te detallamos las características que cumple para ser un almacén de datos.
- Integrado, los datos almacenados en el Data Warehouse se integra en una estructura estable, la cual elimina todas las inconsistencias existentes automáticamente entre los diversos sistemas operacionales, adaptando a las necesidades de cada usuario la información bajo diferentes niveles de detalle.
- Temático, los datos se clasifican por temas para mejorar el acceso y el manejo por parte de los beneficiarios finales. Un ejemplo claro es cuando la información acerca de los clientes se consolida en una única tabla del almacén de datos, con esto es mas fácil conseguir las solicitudes de la información de clientes ya que todo estaría resguardado en el mismo lugar.
- Variable en el tiempo, automáticamente queda un registro en relación al tiempo en que los datos fueron modificados, mostrando esos cambios en los informes que se puedan generar posteriormente.
- No volátil, los datos son guardados de forma permanente, una vez almacenado no es posible modificarse ni eliminarse, convirtiéndose en información de sólo lectura, que puede ser consultado a futuro.
Elementos que integran un Data warehouse.
Existen tres elementos que componen un almacén de datos que garantizan y hacen posible que este funcione adecuadamente.
- Metadatos.
Los metadatos permiten conocer la procedencia y toda la información de los datos, siendo los encargados de simplificar y computar la información desde los sistemas operacionales sabiendo cuál es la estructura, su relación y donde se van a almacenar. El metadato registra qué tipo de tablas existen, así como la relación entre ellas, jerarquías y dimensiones de datos, entidades y realiza comparaciones entre las columnas de tablas que hay en la base de datos y las almacena de acuerdo a su lugar de origen.
- Funciones ETL.
Compuesto a su vez por los procesos que son extracción, trasformación y carga, siendo el primero el encargado de obtener los datos deseados provenientes de fuentes externas, la transformación consiste en cualquier operación que se realice para que la información pueda ser subida al almacén o se migre desde una base de datos a otra y la carga que se encarga finalmente de almacenar. Todos son importantes ya que a través de los mismos, es posible que la información se guarde en un data Warehouse.
- Middleware.
Ofrece servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas y prácticamente es el encargado de asegurar que haya conectividad entre todos los componentes de la estructura de un almacén de datos.
Diseño de un Data Warehouse.
Un almacén de datos requiere de herramientas que ayuden a la migración y a su transformación, su diseño va depender de las necesidades que requiera una compañía para mover grandes volúmenes de información, para crear una data warehouse de deben tomar en cuenta los siguientes aspectos.
- Estado actual del negocio.
Al diseñarse un data warehouse, el mismo debe satisfacer las necesidades de la compañía por lo que su arquitectura técnica debe ser compatible con la misma y estar orientado a su solución.
- Aplicación del tipo de negocio.
Es fundamental saber exactamente acerca del tipo de negocios de la organización para así comprender el soporte que requiere la información durante todo el proceso de toma de decisiones.
- Entorno técnico
Se debe tomar en cuenta aplicaciones, herramientas y el hardware como servidores y redes para darle énfasis a los sistemas de soporte a decisiones (DSS), y la forma en que operan en la actualidad.
- Expectativas de los clientes.
Un data Warehouse no solo se trata de un proyecto tecnológico sino de un estilo de vida de las organizaciones en el que también se debe considerar las expectativas del cliente y si éste cuenta con el apoyo y la aprobación de la compañía.
- Etapas de desarrollo y prototipo.
Con todo el conocimiento anterior se comienza desarrollar el modelo conceptual para la fabricación el data warehouse, creando un prototipo que simule el manejo del almacén de datos y en donde se hagan todas las pruebas necesarias hasta obtener el producto final.
- Producto final y puesta en marcha.
Después de realizar las pruebas, se llega al prototipo, el cual es llamado en muchos casos “beta o piloto” donde los usuarios interactúan con esta versión y detectan en todo caso algunas fallas ya sea de funcionamiento o estética, estos aportes son utilizados para finalmente construir el producto final.
Razones para poner en marcha un datawharehouse
Para saber si un negocio necesita aplicar un data warehouse, existen varias razones que permiten detectar cuando se debe implementar.
- Volumen de datos. Cuando se tiene un gran contenido de datos a procesar y analizar y para manejarlo se requiere de un buen plan de gestión.
- Control de la calidad, cuando no se tiene dominio de los datos es necesario utilizar un Data Wharehouse
- Operatividad reducida, cuando se tienen problemas de agilidad, confiabilidad o sobrecarga de datos en las hojas de cálculo es oportuno un data Wharehouse.
- Archivos duplicados, sino se tiene control sobre la aparición de datos repetidos es justificable optar por un data Wharehouse centralizado, donde se unifican y simplifican.
Deja una respuesta
Artículos relacionados