¿Qué es un Data Warehouse?

Comparte si te gusto

Kimball vs Inmon

La definición de Data Warehouse (DW) llegó de la mano de Bill Inmon y Ralph Kimball. los dos pensaron en un único repositorio de información para poder integrar y explotar información de múltiples sistemas de origen. Pero, más allá de esta generalización conceptual, cada uno decidió hacerlo a su manera. Entonces, veamos qué es lo que propone cada uno de ellos:

Kimball sugiere utilizar una metodología Bottom-Up, donde la información se extrae de los sistemas transaccionales para ser cargada en diferentes Data Marts cada uno de los cuales son independientes, están modelados en forma dimensional y tienen foco departamental. Estos Data Marts podrían ser implementados con tecnología ROLAP o MOLAP.

Bill Inmon vs. Ralph Kimball

Básicamente para una empresa un Data Warehouse es un almacén electrónico donde se guarda una gran cantidad de información, sin embargo muchos autores señalan que representa más relevancia dentro de sus funciones, ya que no solo es un depósito permanente, sino que es el lugar en cual que se recopilan los datos elementales de manera integrada para organizar, comprender y sustentar la generación y presentación de informes que favorecen la toma de decisiones, así como su posterior análisis todo en relación a la inteligencia de negocio.

Cuando se tienen volúmenes de datos que requieren un procesamiento y gran análisis, es en donde entra en juego tener un potente plan de información obteniendo una data warehouse, a través de la cual se garantiza que los datos de cada sistema se almacenen de una forma confiable, segura, con fácil recuperación y buena administración.

Comúnmente una data warehouse se instala para migrar la información en un servidor corporativo o en la nube, siendo esta última la más utilizada por los beneficios que brinda, ofreciendo mayor protección, así como mejor consolidación, racionalización y lo más importante es que monetiza rápidamente los datos dentro de la nube.

porque usar un data warehouse

¿Cuales son los Principales aportes o ventajas de un datawarehouse empresarial ?

  • Proporciona una herramienta fundamental basada en la información integrada y amplia de un negocio para que los ejecutivos puedan tomar decisiones en cualquier área de trabajo.
  • Favorece la ejecución de aplicaciones que suministran técnicas estadísticas de análisis y modelización, hallando conexiones ocultas entre los datos almacenados que sin duda es una herramienta muy útil para el manejo de esta información.
  • Facilita la capacidad de comparar y aprender de los datos recabados antiguamente y proyecta situaciones venideras en diversos escenarios.
  • Reduce la creación de sistemas de gestión integral dentro de la empresa que favorecen la relación profesional con el cliente.

¿Como es la estructuras o arquitectura de un Data Warehouse?

Arquitectura Data Warehouse - Curso DW + BI
Data Warehouse + Business Intelligence

La Data Warehouse está compuesta por tres estructuras simples que se dividen de la siguiente forma.

  • Estructura Básica.

Mediante este componente, los archivos planos y los sistemas operativos facilitan datos e información en bruto que inmediatamente se guardan en el almacén o Data Warehouse junto a los metadatos, luego son analizados directamente por el consumidor final generando informes y minería.

  • Estructura con un área de ensayo.

Cuando se incorpora un área de ensayo, la información que se recoge tiene un espacio entre la fuente de datos y la Data Warehouse donde se resguardan y pasan por un proceso de limpieza antes de ingresar al almacén, adicional a esto se puede aplicar una configuración que puede ser personalizada para clasificar la información de grupos internos de acuerdo a la organización.

  • Estructura con área de ensayo y data marts.

Un data marts es un subconjunto que aglomera datos para facilitar que un espacio en particular descifre las mejores decisiones, pudiendo obtener grupos individuales de distintas áreas como inventarios, compra y ventas entre otros, logrando que los usuarios directos ingresen de forma ordenada según sean sus necesidades.

¿Cuales son las características del Data warehouse?

Definición, elementos y características de Datawarehouse

El término Data warehouse traducido literalmente del ingles significa “almacén de datos”, obviamente esta descripción se queda corta para todo lo que ofrece dentro de una organización, a continuación te detallamos las características que cumple para ser un almacén de datos.

  • Integrado, los datos almacenados en el Data Warehouse se integra en una estructura estable, la cual elimina todas las inconsistencias existentes automáticamente entre los diversos sistemas operacionales, adaptando a las necesidades de cada usuario la información bajo diferentes niveles de detalle.
  • Temático, los datos se clasifican por temas para mejorar el acceso y el manejo por parte de los beneficiarios finales. Un ejemplo claro es cuando la información acerca de los clientes se consolida en una única tabla del almacén de datos, con esto es mas fácil conseguir las solicitudes de la información de clientes ya que todo estaría resguardado en el mismo lugar.
  • Variable en el tiempo, automáticamente queda un registro en relación al tiempo en que los datos fueron modificados, mostrando esos cambios en los informes que se puedan generar posteriormente.
  • No volátil, los datos son guardados de forma permanente, una vez almacenado no es posible modificarse ni eliminarse, convirtiéndose en información de sólo lectura, que puede ser consultado a futuro.

Elementos que integran un Data warehouse.

Existen tres elementos que componen un almacén de datos que garantizan y hacen posible que este funcione adecuadamente.

  • Metadatos.

Los metadatos permiten conocer la procedencia y toda la información de los datos, siendo los encargados de simplificar y computar la información desde los sistemas operacionales sabiendo cuál es la estructura, su relación y donde se van a almacenar. El metadato registra qué tipo de tablas existen, así como la relación entre ellas, jerarquías y dimensiones de datos, entidades y realiza comparaciones entre las columnas de tablas que hay en la base de datos y las almacena de acuerdo a su lugar de origen.

  • Funciones ETL.

Compuesto a su vez por los procesos que son extracción, trasformación y carga, siendo el primero el encargado de obtener los datos deseados provenientes de fuentes externas, la transformación consiste en cualquier operación que se realice para que la información pueda ser subida al almacén o se migre desde una base de datos a otra y la carga que se encarga finalmente de almacenar. Todos son importantes ya que a través de los mismos, es posible que la información se guarde en un data Warehouse.

  • Middleware.

Ofrece servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas y prácticamente es el encargado de asegurar que haya conectividad entre todos los componentes de la estructura de un almacén de datos.

Diseño de un Data Warehouse.

Un almacén de datos requiere de herramientas que ayuden a la migración y a su transformación, su diseño va depender de las necesidades que requiera una compañía para mover grandes volúmenes de información, para crear una data warehouse de deben tomar en cuenta los siguientes aspectos.

  • Estado actual del negocio.

Al diseñarse un data warehouse, el mismo debe satisfacer las necesidades de la compañía por lo que su arquitectura técnica debe ser compatible con la misma y estar orientado a su solución.

  • Aplicación del tipo de negocio.

Es fundamental saber exactamente acerca del tipo de negocios de la organización para así comprender el soporte que requiere la información durante todo el proceso de toma de decisiones.

  • Entorno técnico

Se debe tomar en cuenta aplicaciones, herramientas y el hardware como servidores y redes para darle énfasis a los sistemas de soporte a decisiones (DSS), y la forma en que operan en la actualidad.

  • Expectativas de los clientes.

Un data Warehouse no solo se trata de un proyecto tecnológico sino de un estilo de vida de las organizaciones en el que también se debe considerar las expectativas del cliente y si éste cuenta con el apoyo y la aprobación de la compañía.

  • Etapas de desarrollo y prototipo.

Con todo el conocimiento anterior se comienza desarrollar el modelo conceptual para la fabricación el data warehouse, creando un prototipo que simule el manejo del almacén de datos y en donde se hagan todas las pruebas necesarias hasta obtener el producto final.

  • Producto final y puesta en marcha.

Después de realizar las pruebas, se llega al prototipo, el cual es llamado en muchos casos “beta o piloto” donde los usuarios interactúan con esta versión y detectan en todo caso algunas fallas ya sea de funcionamiento o estética, estos aportes son utilizados para finalmente construir el producto final.

Razones para poner en marcha un data wharehouse

Para saber si un negocio necesita aplicar un data warehouse, existen varias razones que permiten detectar cuando se debe implementar.

  1. Volumen de datos. Cuando se tiene un gran contenido de datos a procesar y analizar y para manejarlo se requiere de un buen plan de gestión.
  2. Control de la calidad, cuando no se tiene dominio de los datos es necesario utilizar un Data Wharehouse
  3. Operatividad reducida, cuando se tienen problemas de agilidad, confiabilidad o sobrecarga de datos en las hojas de cálculo es oportuno un data Wharehouse.
  4. Archivos duplicados, sino se tiene control sobre la aparición de datos repetidos es justificable optar por un data Wharehouse centralizado, donde se unifican y simplifican.

Articulos relacionadas

Deja un comentario