Solutian Consulting | Bases de Datos Multidimensionales: Conceptos fundamentales
15575
post-template-default,single,single-post,postid-15575,single-format-standard,ajax_fade,page_not_loaded,,qode-title-hidden,qode-theme-ver-13.0,qode-theme-bridge,wpb-js-composer js-comp-ver-5.4.4,vc_responsive

Bases de Datos Multidimensionales: Conceptos fundamentales

Introducción.

La mayoría de las soluciones analíticas de información están construidos en bases de datos OLAP.

En este artículo presentamos los conceptos fundamentales para que la función financiera pueda tener un mejor entendimiento de sus bondades y ventajas.

¿Qué significa OLAP?

OLAP es un acrónimo para “On-Line Analytical Processing”. Las bases de datos OLAP son las bases de datos utilizadas para el almacenamiento de datos y ejecución de los procesos de planeación, monitoreo y análisis.

Existen tres tipos de tecnologías OLAP.

  • ROLAP Que significa OLAP Relaciona Los Datos están almacenados en BD relacionales
  • MOLAP que significa OLAP Multidimensional Se explica más adelante.
  • HOLAP Es una combinación de las dos anteriores. El propósito es combinar las ventajas de ambas.

La tecnología MOLAP ha demostrado ser la más eficiente. Cuando se habla de bases de datos OLAP, usualmente se está haciendo referencia a bases de datos MOLAP.

Comparación BD Relacionales vs. BD Multidimensionales

La siguiente TABLA muestra un conjunto de datos almacenados de manera relacional. En la TABLA se muestra la relación entre PRODUCTOS y REGIONES. Para cada relación existe un registro con la cantidad de producto vendido.

Tomando como base la TABLA anterior respondamos la siguiente pregunta:

  • ¿Cuántas unidades se vendieron de cada producto?

La respuesta a estas preguntas implicaría crear 3 registros adicionales en la TABLA como se muestra en la Figura siguiente:

Otra alternativa comúnmente utilizada es la creación de una tabla adicional en la que e almacenen, en este caso, lo totales para cada tipo de producto, por ejemplo.

Veamos ahora como aparecerían los datos si se utilizara un almacenamiento multidimensional:

Esta organización es mucho más fácil de leer y para responder a la pregunta ¿Cuántas unidades se vendieron de cada producto? Solo se requiere adicionar una columna o tres celdas a la TABLA.

Esta diferencia tiene gran impacto en el tamaño del almacenamiento tanto en disco como en memoria. El menor tamaño requerido por la base de datos MOLAP hace que su almacenamiento y manejo en memoria sea mucho más eficiente.

El sistema MOLAP utiliza una arquitectura de dos componentes: la base de datos multidimensional (repositorio) y el motor analítico que es el encargado de ingresar, operar sobre los datos y recuperar los datos desde la base de datos.

Cubos, Dimensiones y métricas

¿Qué es un cubo OLAP?

Es la estructura utilizada para lograr la funcionalidad multidimensional de una base de datos OLAP. El cubo OLAP permite almacenar y ver los datos de manera multidimensional. El cubo es comparable con la tabla en un base de datos relacional.

El diseño de las bases de datos relacionales para el procesamiento transaccional garantiza la eficiencia en el almacenamiento de los datos en tanto que el diseño de los cubos OLAP garantiza la eficiencia en la recuperación de los datos. En otras palabras, los cubos OLAP hacen más eficiente y fácil la generación de reportes. Una base de datos relacional trata toda la data de la misma manera. Los cubos OLAP tiene categorías de datos denominadas DIMENSIONES y métricas.

El término CUBO viene del objeto geométrico e implica tres dimensiones, pero en la práctica los cubos pueden tener más de tres dimensiones.

La siguiente ilustración representa gráficamente el concepto de un cubo OLAP.

Figura 1. Estructura de un Cubo OLAP

Dimensiones

Las dimensiones representan categorías descriptivas de datos tales como tiempo, producto y ubicación. En otras palabras, una dimensión son agrupaciones amplias de datos descriptivos acerca de aquellos aspectos relevantes de los negocios tales como mercados, clientes y productos. El valor agregado del OLAP en la generación de reportes es que tiene niveles dentro de la dimensión. Cada dimensión tiene diferentes niveles o categorías. Los niveles de las dimensiones permiten ver los datos agrupados y detalles de esos datos.

Pensemos en los niveles de categorías como jerarquías. Por ejemplo, el cubo OLAP tiene una dimensión que es la ubicación. Podemos tener continentes, regiones, países y ciudades. Y dentro de cada continente los países y dentro de cada país las ciudades principales

Un concepto muy importante de OLAP es drilling, concepto que significa perforar pero que en este contexto significa “bajar de nivel”.  Se refiere a la habilidad de bajar o subir en los niveles de categorías o jerarquías. Cuando se baja en una dimensión se incrementa el nivel de detalle de los datos. Por ejemplo, se inicia con los continentes y mediante el drill-down se despliegan los datos para cada región y los países de una región en particular.

Como se explica más adelante, cada categoría tiene atributos. Ejemplo: en la categoría regiones un atributo de cada región puede ser el nombre, la población, y en general datos característicos importantes con relación a la categoría.

Métricas

Las métricas son también una dimensión. Sus elementos son los valores que se desea analizar o visualizar. Ocupan las celdas de intersección de los elementos de las dimensiones. Ejemplos de métricas son: la cantidad de producto, el costo de cada producto, etc.

Por ejemplo, el fabricante de teléfonos celulares desea saber cuántos (métrica) teléfonos (dimensión producto) se fabricaron en las plantas de Europa (dimensión ubicación) durante el año 2000 (dimensión tiempo). De acuerdo con la Figura 1, la repuesta es 174.

Es importante anotar que la dimensión que agrupa las métricas (cada métrica es un elemento de la dimensión) no tiene jerarquía propia. La dimensión métrica adopta las jerarquías de las dimensiones con las cuales está relacionada.

La cantidad de producto por mes en una planta determinada se agrega en cantidad de producto por trimestre y por año y la planta se consolida por país, región etc. según sea la jerarquía definida.

Algunas métricas son muy simples: cantidad de producto vendido de cada modelo, costo de cada modelo. Otras requieren algún cálculo adicional para su obtención: El costo total de los productos vendidos requiere multiplicar la cantidad por el costo que es un atributo del modelo, por ejemplo.

Las métricas están en la celda donde se cruzan todas las dimensiones del cubo: en la figura 1, 174 corresponde a las ventas de celulares en la región euro en el año 2000.

Cada métrica en una base de datos multidimensional corresponde a la intersección de todas las dimensiones contenidas en el modelo de datos respectivo. En Excel, puede haber básicamente dos dimensiones (Filas y Columnas) en un cubo OLAP puede haber múltiples DIMENSIONES.

Este tipo de almacenamiento se denomina almacenamiento de estrella tal como lo describe la gráfica de la Figura 2

Ingreso de datos al modelo OLAP

De acuerdo con lo que hemos descrito hasta el momento, las dimensiones crean la estructura del cubo OLAP y para ingresar los datos al cubo debe utilizarse la misma estructura definida en el cubo. La Tabla de la Figura 3 muestra un ejemplo de los datos organizados para su ingreso al cubo. Muy importante es que las columnas de la tabla tengan el mismo nombre con el cual se creó la dimensión en el cubo.

Figura 3. Tabla de Ingreso de datos

El ingreso de los datos se realiza normalmente mediante extracción desde las BD transaccionales utilizando la funcionalidad incorporada en las soluciones denominada ETL (Extracción, Transformación y Carga).

Vistas de datos

La estructura multidimensional ofrece la posibilidad de diferentes vistas de los datos entre las cuales se destacan:

  • Slicing
  • Dicing
  • up
  • Drill-down
  • Pivot

Describimos aquí las funciones de slicing y dicing.

Slicing

Un slice es un subconjunto del arreglo multidimensional y corresponde a un valor específico de uno de los elementos de una dimensión.

Por ejemplo, si se selecciona el elemento “ratón inalámbrico” en la dimensión “producto”, la acción de slicing genera un sub conjunto (subcubo) con todas las dimensiones restantes. En la Figuras 4 y 5, el área con color azul es la “rebanada” o sub cubo seleccionado.

Figuras 4 y 5

Dicing

En esta acción, se define un sub-cubo del espacio original con todos los elementos de menor jerarquía para todas las dimensiones. La Figura 6 provee una representación gráfica de la acción “dicing”.

Figura 6

Conclusión

Para funcionarios del área financiera no expertos en temas tecnológicos, es muy importante conocer los conceptos presentados en este artículo.

La mayor parte de las soluciones tecnológicas analíticas de planeación comercial, operativa y financiera están construidas sobre bases de datos MOLAP.

Con estos conceptos los funcionarios tendrán los elementos necesarios para:

  • Participar en el diseño integrado de los sistemas de planeación de las diferentes áreas de la organización.
  • Plantear sus requerimientos analíticos de planeación financiera (Presupuesto operacional, flujo de caja, costos, etc,) a los proveedores de las soluciones.
  • Conocer las diferencias y expectativas en la integración de datos entre los sistemas transaccionales (contabilidad, por ejemplo) y las soluciones analíticas.
No Comments

Post A Comment