Lo que todos debemos tener claro es que para trabajar eficientemente con PowerBI debemos utilizar un modelo de datos dimensional (Modelo en estrella), pero también sabemos que no siempre todos los atributos dimensionales que tenemos en nuestros modelos están claramente relacionados con alguna de nuestras dimensiones.
Si necesitamos un atributo como Categoría, Familia o Color, probablemente estemos hablando de una dimensión Producto, si tenemos que trabajar con filtros de mes, trimestre o Año, estaremos hablando de una dimensión Calendario pero ¿Qué ocurre con el atributo TipoPago, FormaPago o con el atributo Comisión? Pues probablemente, no tengamos tan claro a qué dimensión pertenecen…
En nuestros modelos a veces existen una serie de atributos dimensionales, generalmente de muy baja cardinalidad (pocos valores distintos), que no tenemos muy claro a que dimensión pertenecen (o directamente no existe dimensión donde guardarlos). En el ejemplo que acabamos de comentar, los atributos TipoDePago, FormaDePago y Comisión son claramente 3 ejemplos de ellos.
Bien, pues para solucionar este problema no es una buena opción crear 3 dimensiones distintas, una para cada atributo. Lo que nos va a ayudar a solucionarno van a ser las JunkDimension o Dimensión Basura (a mi personalmente también me gusta identificarlas como Dimesión OtrosAtributos).
Esta dimensión lo que hará será crear el producto cartesiano (es decir, crear todas las combinaciones) de los valores que queramos agrupar en esta dimensión, tal como muestra la siguiente imagen de ejemplo donde convertimos 3 dimensiones de un atributo en una JunkDimension de 3 atributos.
La combinación de las 3 tablas anteriores nos dará 2 x 3 x 2 = 12 registros distintos para la JunkDimension
A partir de aquí, con la dimensión creada, reemplazaremos los valores existentes de estos 3 atributos en la tabla de hechos por el idSubrogado correspondiente de la nueva dimensión. Esto lo podremos hacer por ejemplo combinando las tablas en PowerQuery.
Como resultado, obtendremos una FactTable donde se habrán sustituido 3 columnas de texto por el idSubrogado de una dimensión.
De esta forma, simplificamos el modelo reduciendo las relaciones y dimensiones y además mejoramos la eficiencia y le facilitamos la vida a nuestros usuarios. !Todo ventajas! 🙂
#SigueElCaminoDeLaEstrella #DataModeling FundamentosDeModelado
FECHA | LUGAR | CURSO | DURACIÓN | PRECIO | INSCRIPCIÓN |
---|---|---|---|---|---|
15, 17, 22 y 24 de octubre de 2024 | Streaming Directo. Grabación disponible finalizado el curso | PowerBI iniciación Temario | Mañanas de 09:30 a 12:30 (GMT+1) curso de 12 horas | 175€ | Inscribirme |
5, 7, 12 y 14 de noviembre de 2024 | Streaming Directo. Grabación disponible finalizado el curso | PowerBI Avanzado Temario | Mañanas de 9:30 a 12:30 (GMT+1) curso de 12 horas | 175€ | Inscribirme |
03, 05, 10 y 12 de diciembre de 2024 | Streaming Directo. Grabación disponible finalizado el curso | Optimizando tus datos con Modelado y DAX Temario | Mañanas de 9:30 a 12:30 (GMT+1) curso de 12 horas | 175€ | Inscribirme |
A convenir | Presencial o Streaming Directo | Curso a medida para empresas | A convenir | A convenir | + Info |
Excelente contenido. Muchas gracias por compartir.