¬ŅQu√© es un Data Warehouse?

Kimball vs Inmon

La definici√≥n de Data Warehouse (DW) lleg√≥ de la mano de Bill Inmon y Ralph Kimball. los dos pensaron en un √ļnico repositorio de informaci√≥n para poder integrar y explotar informaci√≥n de m√ļltiples sistemas de origen. Pero, m√°s all√° de esta generalizaci√≥n conceptual, cada uno decidi√≥ hacerlo a su manera. Entonces, veamos qu√© es lo que propone cada uno de ellos:

Kimball sugiere utilizar una metodología Bottom-Up, donde la información se extrae de los sistemas transaccionales para ser cargada en diferentes Data Marts cada uno de los cuales son independientes, están modelados en forma dimensional y tienen foco departamental. Estos Data Marts podrían ser implementados con tecnología ROLAP o MOLAP.

Bill Inmon vs. Ralph Kimball

B√°sicamente para una empresa un Data Warehouse es un almac√©n electr√≥nico donde se guarda una gran cantidad de informaci√≥n, sin embargo muchos autores se√Īalan que representa m√°s relevancia dentro de sus funciones, ya que no solo es un dep√≥sito permanente, sino que es el lugar en cual que se recopilan los datos elementales de manera integrada para organizar, comprender y sustentar la generaci√≥n y presentaci√≥n de informes que favorecen la toma de decisiones, as√≠ como su posterior an√°lisis todo en relaci√≥n a la inteligencia de negocio.

Cuando se tienen vol√ļmenes de datos que requieren un procesamiento y gran an√°lisis, es en donde entra en juego tener un potente plan de informaci√≥n obteniendo una data warehouse, a trav√©s de la cual se garantiza que los datos de cada sistema se almacenen de una forma confiable, segura, con f√°cil recuperaci√≥n y buena administraci√≥n.

Com√ļnmente una data warehouse se instala para migrar la informaci√≥n en un servidor corporativo o en la nube, siendo esta √ļltima la m√°s utilizada por los beneficios que brinda, ofreciendo mayor protecci√≥n, as√≠ como mejor consolidaci√≥n, racionalizaci√≥n y lo m√°s importante es que monetiza r√°pidamente los datos dentro de la nube.

porque usar un data warehouse

¬ŅCuales son los Principales aportes o ventajas de un datawarehouse empresarial ?

  • Proporciona una herramienta fundamental basada en la informaci√≥n integrada y amplia de un negocio para que los ejecutivos puedan tomar decisiones en cualquier √°rea de trabajo.
  • Favorece la ejecuci√≥n de aplicaciones que suministran t√©cnicas estad√≠sticas de an√°lisis y modelizaci√≥n, hallando conexiones ocultas entre los datos almacenados que sin duda es una herramienta muy √ļtil para el manejo de esta informaci√≥n.
  • Facilita la capacidad de comparar y aprender de los datos recabados antiguamente y proyecta situaciones venideras en diversos escenarios.
  • Reduce la creaci√≥n de sistemas de gesti√≥n integral dentro de la empresa que favorecen la relaci√≥n profesional con el cliente.

¬ŅComo es la estructuras o arquitectura de un Data Warehouse?

Arquitectura Data Warehouse - Curso DW + BI
Data Warehouse + Business Intelligence

La Data Warehouse est√° compuesta por tres estructuras simples que se dividen de la siguiente forma.

  • Estructura B√°sica.

Mediante este componente, los archivos planos y los sistemas operativos facilitan datos e información en bruto que inmediatamente se guardan en el almacén o Data Warehouse junto a los metadatos, luego son analizados directamente por el consumidor final generando informes y minería.

  • Estructura con un √°rea de ensayo.

Cuando se incorpora un área de ensayo, la información que se recoge tiene un espacio entre la fuente de datos y la Data Warehouse donde se resguardan y pasan por un proceso de limpieza antes de ingresar al almacén, adicional a esto se puede aplicar una configuración que puede ser personalizada para clasificar la información de grupos internos de acuerdo a la organización.

  • Estructura con √°rea de ensayo y data marts.

Un data marts es un subconjunto que aglomera datos para facilitar que un espacio en particular descifre las mejores decisiones, pudiendo obtener grupos individuales de distintas √°reas como inventarios, compra y ventas entre otros, logrando que los usuarios directos ingresen de forma ordenada seg√ļn sean sus necesidades.

¬ŅCuales son las caracter√≠sticas del Data warehouse?

Definición, elementos y características de Datawarehouse

El t√©rmino Data warehouse traducido literalmente del ingles significa ‚Äúalmac√©n de datos‚ÄĚ, obviamente esta descripci√≥n se queda corta para todo lo que ofrece dentro de una organizaci√≥n, a continuaci√≥n te detallamos las caracter√≠sticas que cumple para ser un almac√©n de datos.

  • Integrado, los datos almacenados en el Data Warehouse se integra en una estructura estable, la cual elimina todas las inconsistencias existentes autom√°ticamente entre los diversos sistemas operacionales, adaptando a las necesidades de cada usuario la informaci√≥n bajo diferentes niveles de detalle.
  • Tem√°tico, los datos se clasifican por temas para mejorar el acceso y el manejo por parte de los beneficiarios finales. Un ejemplo claro es cuando la informaci√≥n acerca de los clientes se consolida en una √ļnica tabla del almac√©n de datos, con esto es mas f√°cil conseguir las solicitudes de la informaci√≥n de clientes ya que todo estar√≠a resguardado en el mismo lugar.
  • Variable en el tiempo, autom√°ticamente queda un registro en relaci√≥n al tiempo en que los datos fueron modificados, mostrando esos cambios en los informes que se puedan generar posteriormente.
  • No vol√°til, los datos son guardados de forma permanente, una vez almacenado no es posible modificarse ni eliminarse, convirti√©ndose en informaci√≥n de s√≥lo lectura, que puede ser consultado a futuro.

Elementos que integran un Data warehouse.

Existen tres elementos que componen un almacén de datos que garantizan y hacen posible que este funcione adecuadamente.

  • Metadatos.

Los metadatos permiten conocer la procedencia y toda la información de los datos, siendo los encargados de simplificar y computar la información desde los sistemas operacionales sabiendo cuál es la estructura, su relación y donde se van a almacenar. El metadato registra qué tipo de tablas existen, así como la relación entre ellas, jerarquías y dimensiones de datos, entidades y realiza comparaciones entre las columnas de tablas que hay en la base de datos y las almacena de acuerdo a su lugar de origen.

  • Funciones ETL.

Compuesto a su vez por los procesos que son extracción, trasformación y carga, siendo el primero el encargado de obtener los datos deseados provenientes de fuentes externas, la transformación consiste en cualquier operación que se realice para que la información pueda ser subida al almacén o se migre desde una base de datos a otra y la carga que se encarga finalmente de almacenar. Todos son importantes ya que a través de los mismos, es posible que la información se guarde en un data Warehouse.

  • Middleware.

Ofrece servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas y prácticamente es el encargado de asegurar que haya conectividad entre todos los componentes de la estructura de un almacén de datos.

Dise√Īo de un Data Warehouse.

Un almac√©n de datos requiere de herramientas que ayuden a la migraci√≥n y a su transformaci√≥n, su dise√Īo va depender de las necesidades que requiera una compa√Ī√≠a para mover grandes vol√ļmenes de informaci√≥n, para crear una data warehouse de deben tomar en cuenta los siguientes aspectos.

  • Estado actual del negocio.

Al dise√Īarse un data warehouse, el mismo debe satisfacer las necesidades de la compa√Ī√≠a por lo que su arquitectura t√©cnica debe ser compatible con la misma y estar orientado a su soluci√≥n.

  • Aplicaci√≥n del tipo de negocio.

Es fundamental saber exactamente acerca del tipo de negocios de la organización para así comprender el soporte que requiere la información durante todo el proceso de toma de decisiones.

  • Entorno t√©cnico

Se debe tomar en cuenta aplicaciones, herramientas y el hardware como servidores y redes para darle énfasis a los sistemas de soporte a decisiones (DSS), y la forma en que operan en la actualidad.

  • Expectativas de los clientes.

Un data Warehouse no solo se trata de un proyecto tecnol√≥gico sino de un estilo de vida de las organizaciones en el que tambi√©n se debe considerar las expectativas del cliente y si √©ste cuenta con el apoyo y la aprobaci√≥n de la compa√Ī√≠a.

  • Etapas de desarrollo y prototipo.

Con todo el conocimiento anterior se comienza desarrollar el modelo conceptual para la fabricación el data warehouse, creando un prototipo que simule el manejo del almacén de datos y en donde se hagan todas las pruebas necesarias hasta obtener el producto final.

  • Producto final y puesta en marcha.

Despu√©s de realizar las pruebas, se llega al prototipo, el cual es llamado en muchos casos ‚Äúbeta o piloto‚ÄĚ donde los usuarios interact√ļan con esta versi√≥n y detectan en todo caso algunas fallas ya sea de funcionamiento o est√©tica, estos aportes son utilizados para finalmente construir el producto final.

Razones para poner en marcha un data wharehouse

Para saber si un negocio necesita aplicar un data warehouse, existen varias razones que permiten detectar cuando se debe implementar.

  1. Volumen de datos. Cuando se tiene un gran contenido de datos a procesar y analizar y para manejarlo se requiere de un buen plan de gestión.
  2. Control de la calidad, cuando no se tiene dominio de los datos es necesario utilizar un Data Wharehouse
  3. Operatividad reducida, cuando se tienen problemas de agilidad, confiabilidad o sobrecarga de datos en las hojas de c√°lculo es oportuno un data Wharehouse.
  4. Archivos duplicados, sino se tiene control sobre la aparición de datos repetidos es justificable optar por un data Wharehouse centralizado, donde se unifican y simplifican.

Deja un comentario