Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Get inspired! Check out the entries from the Power BI DataViz World Championships preliminary rounds and give kudos to your favorites. View the vizzies.

Reply
Syndicate_Admin
Administrator
Administrator

Grandes conjuntos de datos

¿Cómo manejar grandes conjuntos de datos durante el modo de importación?

3 REPLIES 3
Syndicate_Admin
Administrator
Administrator

Yo añadiría a Eliminar todas las columnas no utilizadas para optimizar su modelo.

Syndicate_Admin
Administrator
Administrator

El manejo de grandes volúmenes de datos en Power BI, especialmente en modo de importación dentro de un área de trabajo de capacidad premium, requiere varias técnicas para garantizar un rendimiento y una eficiencia óptimos. Más allá de la actualización incremental y la optimización del modelo de datos, estas son algunas estrategias adicionales:

1. Partición de datos

  • Partición: Divida sus datos en particiones más pequeñas y manejables. Esto puede mejorar tanto los tiempos de procesamiento como el rendimiento de las consultas. En Power BI Premium, puede usar puntos de conexión XMLA para crear y administrar particiones.

2. Compresión y agregación de datos

  • Compresión: Power BI comprime automáticamente los datos durante la importación. Asegúrese de que las columnas tengan el tipo adecuado y evite las columnas de cardinalidad alta siempre que sea posible.
  • Agregaciones: cree tablas agregadas para reducir la cantidad de datos procesados en consultas de nivel de detalle. Use la característica de agregaciones para agregar previamente datos en diferentes niveles y permitir que Power BI cambie automáticamente entre datos detallados y agregados en función de los requisitos de la consulta.

3. Optimizar las consultas DAX

  • Optimización de DAX: escriba consultas de DAX eficaces. Evite cálculos complejos sobre la marcha y calcule previamente cuando sea posible. Utilice variables para almacenar resultados intermedios y reducir el número de cálculos.

4. Reducir la cardinalidad

  • Reducción de cardinalidad: las columnas de cardinalidad alta (columnas con muchos valores únicos) pueden afectar significativamente al rendimiento. Utilice técnicas como la discretización (agrupar valores numéricos o de fecha en intervalos) o reducir la granularidad de los datos.

5. Rendimiento de carga de datos

  • Tipos de datos: asegúrese de que los tipos de datos estén optimizados. Por ejemplo, use números enteros en lugar de cadenas siempre que sea posible.
  • Índice de almacén de columnas: para tablas más grandes, use la característica de índice de almacén de columnas de SQL Server para mejorar la compresión de datos y el rendimiento de las consultas antes de importarlas a Power BI.

6. Rendimiento de la fuente de datos

  • Optimizar consultas de origen: optimice las consultas SQL o las vistas utilizadas para extraer datos. Asegúrese de que sean eficientes y solo devuelvan los datos necesarios.
  • DirectQuery o modelos híbridos: para conjuntos de datos extremadamente grandes, considere la posibilidad de usar DirectQuery o un modelo híbrido en el que algunos datos se importan y otros se consultan en tiempo real.

7. Gestión de la memoria

  • Configuración de memoria: en capacidades premium, administre los ajustes de configuración de memoria y supervise el uso de memoria para asegurarse de que los grandes conjuntos de datos no agoten los recursos disponibles.
  • Límite de tamaño del conjunto de datos: tenga en cuenta el límite de tamaño del conjunto de datos en Power BI Premium y planifique los modelos de datos en consecuencia.

8. Uso de modelos de datos agregados

  • Modelos de datos agregados: cree modelos de datos que agreguen datos en diferentes niveles de granularidad. Use la característica de modelos compuestos de Power BI para combinar datos de importación y DirectQuery, lo que permite el uso de datos agregados y detallados de forma eficaz.

9. Optimización del flujo de datos

  • Flujos de datos: use flujos de datos para preprocesar datos fuera de los conjuntos de datos de Power BI. Los flujos de datos pueden transformar, limpiar y agregar datos antes de importarlos a Power BI, lo que reduce la carga del conjunto de datos y mejora el rendimiento.

10. Mantenimiento y monitoreo regulares

  • Mantenimiento regular: Mantenga y actualice regularmente su modelo de datos. Elimine las columnas y tablas no utilizadas, y revise y optimice periódicamente las medidas de DAX.
  • Supervisión y diagnóstico: use las herramientas de supervisión y diagnóstico de Power BI para identificar cuellos de botella de rendimiento y optimizar en consecuencia.

Recursos adicionales:

  • Documentación de Power BI: La documentación oficial de Microsoft proporciona instrucciones detalladas sobre el manejo de grandes conjuntos de datos.
  • Procedimientos recomendados para administrar grandes conjuntos de datos de Power BI: consulte los artículos detallados de procedimientos recomendados y las notas del producto disponibles en el sitio de la comunidad de Power BI.

Al implementar estas técnicas, puede administrar y optimizar de manera eficaz grandes volúmenes de datos en Power BI, lo que garantiza modelos de datos e informes eficientes y de alto rendimiento.

Hola, realmente necesito con la mejora del rendimiento, ¿podríamos conectarnos y pueden guiarme en esto?

Helpful resources

Announcements
Las Vegas 2025

Join us at the Microsoft Fabric Community Conference

March 31 - April 2, 2025, in Las Vegas, Nevada. Use code MSCUST for a $150 discount!

FebPBI_Carousel

Power BI Monthly Update - February 2025

Check out the February 2025 Power BI update to learn about new features.

March2025 Carousel

Fabric Community Update - March 2025

Find out what's new and trending in the Fabric community.

Top Solution Authors
Top Kudoed Authors