Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Earn a 50% discount on the DP-600 certification exam by completing the Fabric 30 Days to Learn It challenge.

Reply
Syndicate_Admin
Administrator
Administrator

Crear tabla de búsqueda a partir de datos de origen

Hola

Para algunos he estado tratando y luchando con el siguiente dilema.

La siguiente es una versión simplificada de mi informe powerbi real.

La fuente real es > 100 GB de archivos csv. Los archivos PowerBI resultantes actuales tienen un tamaño de más de 1 GB.

Me gustaría reducir la huella (y posiblemente hacer que el informe tenga un rendimiento un poco mejor).

Una vez que se ingieren los datos, se encuentran en una sola tabla.

Como puede ver en el siguiente ejemplo, hay una columna llamada "ServiceSKU" que es un identificador único para los valores en colums "Acción de servicio", "Producto de servicio", "Componente de servicio" y "Descripción del servicio".

Mi idea sería dividir esas 5 columnas de la tabla en una nueva tabla. Luego ejecute "Único" en ellos para dejar una buena tabla de búsqueda. Esto debería ayudar a reducir el tamaño. Una tabla de búsqueda clásica de 1 a muchos como lo haría en el diseño de bases de datos.

Aunque... eso solo ayuda si puedo eliminar las columnas 4x ("Acción de servicio", "Producto de servicio", "Componente de servicio" y "Descripción de servicio") de la tabla original.

He probado la tabla de "referencia", aunque cuando eliminas la columna de la tabla original, la tabla a la que se hace referencia ya no funciona.
Hacer una tabla "duplicada" se convierte en una operación muy costosa, mientras que tendría que leer todos los datos dos veces.

¿Hay alguna manera de lograr esto (aparte de usar duplicados)?

2x círculos con el 1: dividir la tabla en dos tablas. Donde la tabla naranja tendrá valores únicos y la tabla verde solo tiene la clave de búsqueda (ServiceSKU) para encontrar la información del servicio en la tabla naranja a través de una relación de 1 a muchos (círculo con 2).

fmasselink_0-1639477875021.png

2 REPLIES 2
Syndicate_Admin
Administrator
Administrator

@fmasselink, creo que resumir DAX puede ser una buena opción en este caso, por si no lo has intentado. Por favor, pruebe que

@amitchandak gracias por la rápida respuesta. ¿Eso también disminuiría el tamaño general del informe resultante?

¿No crearía DAX Summarize simplemente una tabla/vista adicional? ¿No eliminaría la información de la tabla original?
Reducir el tamaño de mi informe es el objetivo principal.

Utilicé Agrupación en PowerQuery, aunque en lugar de ~ 8 horas para leer los datos, tomó > 48 horas. Así que estoy buscando mejores maneras.

Helpful resources

Announcements
LearnSurvey

Fabric certifications survey

Certification feedback opportunity for the community.

PBI_APRIL_CAROUSEL1

Power BI Monthly Update - April 2024

Check out the April 2024 Power BI update to learn about new features.

April Fabric Community Update

Fabric Community Update - April 2024

Find out what's new and trending in the Fabric Community.