Don't miss your chance to take the Fabric Data Engineer (DP-700) exam on us!
Learn moreWe've captured the moments from FabCon & SQLCon that everyone is talking about, and we are bringing them to the community, live and on-demand. Starts on April 14th. Register now
Hola
He visto varias otras publicaciones con un problema similar, sin embargo, todas las publicaciones que encontré usaban medidas, lo cual no es el caso con mi problema.
He encontrado una discrepancia entre un recuento distinto y un recuento de filas. La columna utilizada es una columna de número de referencia, por lo que esperaba que todas las filas contuvieran valores únicos. La discrepancia es menor (2), pero aun así fue inesperada y alarmante.
Logré perforar la discrepancia en los meses de septiembre y diciembre, pero cualquier perforación adicional (por ejemplo, para el año) da como resultado que la discrepancia desaparezca en la tabla pero permanezca en los totales de la tabla.
Estoy embaulado, por decir lo menos.
Como se indicó antes, no he usado ninguna medida, solo un simple arrastrar y soltar en la tabla y no tengo filtros activos con la excepción del mes (filtrado en septiembre y diciembre).
Por supuesto, puedo (y lo haré) usar el total final que sea correcto, pero ¿alguien se ha encontrado con un problema como este antes y sabe qué lo causa?
Gracias de antemano por la respuesta.
Hola @dk_dk ,
Gracias por recordarme la opción de visualización en el Editor de Power Query. Después de investigarlo más a fondo, parece que he encontrado más preguntas que respuestas.
Para contextualizar, la tabla de la que conté las filas se realiza a partir de 3 consultas que se anexaron como una nueva tabla (cada consulta es para cada año fiscal).
Ahora, de hecho había duplicados en la tabla adjunta, sin embargo, resulta que había 3 duplicados y no 2 como parecía por la discrepancia inicial.
3 duplicados encontrados (en la tabla adjunta):
Busqué en la fuente de datos original (listas de SharePoint) para resolver esto , pero no encontré duplicados. Pensando que los duplicados debían haber aparecido de alguna manera en el Editor de Power Query, miré las tablas originales (antes de anexarlas) y, de nuevo, no encontré duplicados en las consultas originales.
Consulta 1 (paso final antes de anexar):
Consulta 2 (paso final antes de anexar):
Consulta 3 (paso final antes de anexar):
Tabla anexada (paso de origen):
Los 3 duplicados no tienen similitudes y todos parecen estar fechados aproximadamente un año después de sus contrapartes originales.
Por favor, hágamelo saber si necesita cualquier otra información o tiene alguna otra sugerencia.
Muchas gracias
Hola @Jerzy ,
En la consulta de la tabla anexada, ¿son válidos los 3 duplicados, casos de uso esperados? En caso afirmativo, no debe hacer nada más y, según el caso de uso, utilice el recuento normal o el recuento distinto en el informe. Ahora comprende por qué el recuento distinto no se suma correctamente, y puede proporcionar esa explicación a cualquier usuario final en caso de que cuestione el motivo.
Si las 3 ocurrencias duplicadas no son intencionadas, debe eliminarlas (ya sea con el paso Quitar duplicados o filtrando manualmente el valor de referencia no deseado de las consultas originales (de modo que después de anexarlas solo ocurran una vez). Si esta referencia proviene de un sistema de origen, donde de acuerdo con las reglas de negocio no debería producirse duplicación, debe investigar la base de datos/proceso que contiene o crea estas referencias, para evitar que ocurran duplicaciones en el futuro.
No hay mucho más que hacer en Power BI en sí, ya que el recuento normal y las medidas de recuento distintas parecen funcionar según lo previsto, en función de los datos que tiene en la consulta.
¡Avísame si tienes más preguntas!
Saludos
Daniel
Hola @dk_dk
Estoy de acuerdo en que Power BI está contando como se esperaba, lo único que no entiendo es de dónde vienen los duplicados y qué está causando que aparezcan.
Los datos se obtienen de la lista de SharePoint, donde después de la comprobación, no hay duplicados. Tampoco hay duplicados al importar las tablas individuales de las listas de SharePoint a Power Query. Los duplicados solo aparecen después de anexar las tablas, lo que se hace en Power Query.
Además, algo que no dejé claro antes es que la única similitud que comparten las filas duplicadas es el número de referencia, ya que (casi) todas las demás columnas tienen valores diferentes (por ejemplo, categoría, fechas). Teniendo en cuenta que los duplicados son inesperados, parecen aleatorios y no tienen una explicación clara, ahora me preocupa la validez de toda la tabla adjunta. Además, no tengo forma de garantizar que la eliminación de números duplicados eliminará las entradas falsas en lugar de las originales y reales.
¿Conoce alguna posible explicación de cómo aparecen los duplicados después de agregarlos, cuando estos no existían antes?
Muchas gracias,
@dk_dk Gracias por tu contribución en este hilo.
Hola @Jerzy ,
Para obtener más información sobre la solución de problemas, ¿puedo molestarlo para obtener la siguiente información?
1. ¿Podría proporcionar algunos datos de ejemplo (excluir datos confidenciales) para la tabla que está involucrada en la operación de adición con formato de texto?
2. La captura de pantalla de los datos en la tabla después de anexar.
3. La fórmula de las métricas que obtienen el conteo
Saludos
Hola @dk_dk y @v-yiruan-msft
La semana pasada había pensado que era imposible duplicar la ref nLos números de referencia de cada tabla van seguidos de letras distintas. Sin embargo, al mirar este problema con un nuevo par de ojos, me di cuenta de que el número de referencia se ingresa manualmente y, he aquí, había dos letras incorrectas en una de las tablas.
Así que gracias de nuevo Daniel, no podría haberlo descubierto sin ti.
Atentamente
Jerzy
¡Feliz de ayudar y me alegro de que hayas podido resolverlo!
Hola @Jerzy ,
Si puede inspeccionar los datos en el editor de consultas, en la pestaña de vista puede activar el perfil de columna, la distribución de columnas y la calidad de las columnas, y ver si todos los valores de la columna del número de referencia son realmente únicos.
Yo empezaría por ahí. Normalmente, lo que causaría esta discrepancia es que tenga el mismo número de referencia presente en dos meses/años diferentes. En el conteo normal se contarán dos veces, en el conteo distinto una vez.
Puede ver que la suma de distintos recuentos no se suma al total de la segunda tabla. Esto se debe a que es distinto contando cada mes/año, así como el total.
Por ejemplo, con estos datos ficticios:
| Mes | ID de referencia |
| Enero | a |
| Enero | b |
| Febrero | a |
| Febrero | c |
| Marzo | b |
| Marzo | c |
Los recuentos se verían así:
| Mes | Recuento distinto | Contar |
|
Enero |
2 | 2 |
| Febrero | 2 | 2 |
| Marzo | 2 | 2 |
| Total | 3 | 6 |
Porque hay dos valores distintos en enero, dos en febrero, dos en marzo, pero solo 3 en total debido a los valores duplicados.
Si desea solucionar este problema, puede crear un objeto Measure = COUNTROWS(Table) y colocar la columna de referencia y la medida countrows en un objeto visual de tabla. Debe haber una o dos columnas de referencia en las que la medida countrows sea mayor que uno, lo que significa que la columna no es única.
Espero que esto ayude.
If you have recently started exploring Fabric, we'd love to hear how it's going. Your feedback can help with product improvements.
A new Power BI DataViz World Championship is coming this June! Don't miss out on submitting your entry.
Share feedback directly with Fabric product managers, participate in targeted research studies and influence the Fabric roadmap.