miércoles, 4 de abril de 2012

TABLA DE HECHOS

  • Las tablas de hechos contienen hechos. 
  • Los hechos o medidas son los valores de datos que se analizan (son numéricos). 
  • La tabla de hechos tiene una clave primaria compuesta por las claves primarias de las tablas de dimensiones relacionadas a este. 
  • Los hechos son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a través de sumarizaciones preestablecidas al momento de crear un cubo multidimensional.



Las tablas de hechos contienen los hechos, medidas o indicadores que serán utiliza-dos por los analistas de negocio para apoyar el proceso de toma de decisiones.Los hechos son datos instantáneos en el tiempo, que son filtrados, agrupados y ex-plorados a través de condiciones definidas en las tablas de dimensiones.Los datos presentes en las tablas de hechos constituyen el volumen de la bodega,y pueden estar compuestos por millones de registros dependiendo de su granularidad  y delosintervalosdetiempodelosmismos.Losmásimportantessonlosdetiponumérico.El registro del hecho posee una clave primaria que está compuesta por las claves pri-marias de las tablas de dimensiones relacionadas a este.En la siguiente imagen se puede apreciar un ejemplo de lo antes mencionado:
 
  

MEDIDAS


Las medidas representan los valores que son analizados:

–Cantidad de pacientes admitidos

–Llamadas efectuadas.
–ImporteTotal = precioProducto * cantidadVendida
–Rentabilidad = utilidad / PN
–CantidadVentas = cantidad
–PromedioGeneral = AVG(notasFinales)

Valores numéricos porque estos valores son las bases de las cuales el usuario puede realizar cálculos.


Si la medida es no numérica debemos codificarla a un valor numérico y cuando tengamos que exponerla decodificarla para mostrarla con el valor original.


Características de las medidas:

–Deben ser numéricas.
–Cruzan todas las dimensiones en todos los niveles. 


Las medidas pueden clasificarse en:

Naturales
–Estas formas de agregación pueden ser:
–Suma: es la operación que suma los valores de las columnas
–Cuenta: realiza un conteo de los valores
–Mínima: devuelve un valor mínimo
–Máxima: proporciona el mayor de los valores
–Cuenta de Distintos: cuenta los valores diferentes

Calculadas
–Cálculos Matemáticos
–Expresiones condicionales
–Alertas
 

DIMENSIONES

El modelo dimensional es una adaptación especializada del modelo relacional, solía representar datos en depósitos de datos, en un camino que los datos fácilmente pueden ser resumidos usando consultas OLAP. En el modelo dimensional, una base de datos consiste en una sola tabla grande de hechos que son descritos usando dimensiones y medidas.

Una dimensión proporciona el contexto de un hecho (como quien participó, cuando y donde pasó, y su tipo). Las dimensiones se toman en cuenta en la formulación de las consultas para agrupar hechos que están relacionados. Las dimensiones tienden a ser discretas y son a menudo jerárquicas; por ejemplo, la ubicación podría incluir el edificio, el estado, y el país.

Una medida es una cantidad que describe el hecho, tales como los ingresos. Es importante que las medidas puedan ser agregados significativamente - por ejemplo, los ingresos provenientes de diferentes lugares pueden sumarse.
En una consulta (OLAP), las dimensiones son escogidas y los hechos son agrupados y añadidos juntos para crear un reporte.

El modelo dimensional a menudo es puesto en práctica sobre la cima del modelo emparentado que usa un esquema de estrella, consistiendo en una mesa que contiene los hechos y mesas circundantes que contienen las dimensiones. Dimensiones en particular complicadas podrían ser representadas usando múltiples mesas, causando un esquema de copo de nieve.
Un almacen de datos (data warehouse) puede contener múltiples esquemas de estrella que comparten tablas de dimensión, permitiéndoles para ser usadas juntas. La llegada levanta un conjunto de dimensiones estándar y es una parte importante del modelado dimensional.


TABLA DE DIMENSIONES

Definen la organización lógica de los datos.

Tiene una PK (única) y columnas de referencia:
Clave principal (PK) o identificador único.
Clave foráneas.
Datos de referencia primarios (identifican la dimensión)
Datos de referencia secundarios (complementan la descripción).