Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Power BI is turning 10! Let’s celebrate together with dataviz contests, interactive sessions, and giveaways. Register now.

Reply
Syndicate_Admin
Administrator
Administrator

Desviación estándar - Desafío con puntajes Z. y Consideraciones de equidad.

Hola a todos,

Cualquier ayuda con la desviación estándar es apreciada.


Estoy tratando de ver qué ubicaciones tienen los puntajes Z más bajos / más altos. Estoy haciendo esto porque cuando las personas miran a Rankx, a menudo no aprecian la gravedad de las ubicaciones con altos recuentos de R (también conocidos como valores atípicos). En esta situación, estoy examinando que algunas ubicaciones tienen altos recuentos de R, en comparación con su recuento total. Estoy trabajando con datos en vivo para no poder crear nuevas tablas o columnas como en Excel. A continuación se muestra una captura de pantalla, pero no la tabla completa, algunas ubicaciones tienen recuentos mucho más bajos, pero recuentos R más altos.

Los puntajes Z (en esta tabla a continuación está la medida {'* Medir Z # s Puntaje'} y sus resultados deberían estar aproximadamente entre +2 y -2 (también conocido como +/- 2 Desviaciones estándar) para que pueda decir que los números están desactivados.

Sé que el recuento R es correcto. Sé que el recuento promedio de R (333.8) es correcto, pero no creo que la desviación estándar sea correcta.

SO_0-1654466683965.png
Aquí están mis Medidas y he ajustado los nombres de campo porque estoy en una organización del sector público.

* Measure Count =COUNTROWS ('SAchievement' ) // renombrado "Count"

*Recuento R = CALCULAR ( [* Recuento de medidas],'SAchievement'[NumericEquivalent] < 50 ) // renombrado "R Count"

* Medir R promedio en #s =
PROMEDIOX ( TODOSSELECCIONADOS( 'Ubicación'[NombreDeLa ubicación] ), [* Medir Rs] )

* Medir Std Dev R2s =CALCULAR(STDEV. P(SAchievement[NumericEquivalent]), TODOSEXCEPTO(Logro, Logro[año], Logro[InformePeriod]), SAchievement[NumericEquivalent] <50)

* Medir Z#s Puntuación = DIVIDIR ([* Medir Rs] - [* Medir R promedio en #s], [* Medir Std Dev R2s])

Cualquier ayuda sería apreciada. Las personas a menudo descuentan el rango de datos porque ven las últimas entradas como cercanas a las siguientes entradas. Estos valores atípicos deben tenerse en cuenta para garantizar que se asignen recursos equitativos.
Muchas gracias







6 REPLIES 6
Syndicate_Admin
Administrator
Administrator

@v-chenwuz-msft gracias de nuevo por el apoyo. Como estoy trabajando con datos en vivo, algunas de las funciones esenciales de PBI para admitir estadísticas, por ejemplo, percentil no funcionan (por ejemplo, Percentile.inc o anterior). ¿Hay una solución simple para lograr el percentil? Puedo usar rankx, pero no la función Anterior que a menudo se usa en las soluciones para calcular manualmente los percentiles. Gracias y por favor hágame saber si esta debería ser una nueva discusión?

@SO ,

Le sugiero que comience una nueva discusión.

O puede consultar esta función PERCENTILEX. INC

Saludos

Equipo de apoyo a la comunidad _ chenwu zhu

Syndicate_Admin
Administrator
Administrator

También traté de derivar la fórmula de desviación estándar desde cero, pero la rueda PBI sigue girando sin dar un resultado. Tenemos 32 ubicaciones, así que acabo de escribir en el total N = 32


*SD = //Fórmula de desviación estándar (desde cero) VAR _PopVal = [* Medida Rs] VAR _Mean = [* Medida Media R en #s] RETURN SQRT ( DIVIDE ( SUMX ( ALLEXCEPT( 'SAchievement', SAchievement[Year], SAchievement[ReportPeriod]), ( _PopVal - _Mean ) ^ 2 ), 32))

Los datos de las medidas figuran en el cuadro anterior.

Cuando intento producir una sola tarjeta para *SD, eventualmente dará un resultado de 7.25 millones.

¿Alguna idea sobre por qué esto no funcionaría? Al colocar esta medida en mi tabla, pensé que pasaría por cada valor: por ejemplo, para la ubicación 1: (483-333.8) ^ 2/32 y luego SQRTed = 26.37, luego la ubicación 2, .... etc...

@SO ,

De acuerdo con su descripción, he escrito la siguiente fórmula para que la pruebe.

*SD =
VAR _sum =
    SUMMARIZE (
        ALLSELECTED ( 'SAchievement' ),
        SAchievement[Location],
        SAchievement[Year],
        "_xn", CALCULATE ( [* Measure Count], 'SAchievement'[NumericEquivalent] < 50 ),
        "_x",
            AVERAGEX (
                FILTER (
                    ALLEXCEPT ( SAchievement, SAchievement[Location], SAchievement[Year] ),
                    [NumericEquivalent] < 50
                ),
                [* Measure Count]
            )
    )
RETURN
    SQRT ( DIVIDE ( SUMX ( _sum, ( [_xn] - [_x] ) ^ 2 ), 32 ) )

Saludos

Equipo de apoyo a la comunidad _ chenwu zhu

Si esta publicación ayuda, considere Aceptarla como la solución para ayudar a los otros miembros a encontrarla más rápidamente.

Hola de nuevo,

@v-chenwuz-msft

Así que lo siento de nuevo.

Estaba mirando mis resultados y comparando Excel y PBI con diferentes resultados. La medida mostraba Cero o el número a que no era posible. Simplemente los datos solo estaba mirando 3 líneas. Tengo segmentaciones de datos que filtran el Año, el Administrador y la Ubicación, y el Tipo de ubicación

En Excel tengo

Ubicación R12FTE#%# R12/FTEMedia de R12/FTE*StandDev {STDEV. P(D2:D4)}Puntuación Z {STANDARDIZE(D2,E2,$F$2)}
BR1952260.86280.7322666670.0932439571.399911986
MG2613820.68320.7322666670.093243957-0.526218193
ML1922950.65080.7322666670.093243957-0.873693793

En PowerBi puedo generar la Desviación Estándar, pero para obtener la Puntuación Z, tengo que escribir físicamente el valor 0.0932.

Ubicación R12FTE#%# R12/FTEPuntuación Z Media para R12/FTE*SD Puntuación Z
BR1952260.86280.7322666670
MG2613820.68320.7322666670
ML1922950.65080.7322666670
0.093243957

También para que la desviación estándar funcionara, necesitaba alterar el código, de lo contrario PBI no dejaría de girar.

Primero necesitaba crear una medida para contar las ubicaciones. Me doy cuenta de que había escrito esto manualmente en mi primer ejemplo (32). Hay cientos de ubicaciones, pero solo estaba mirando 32. En el caso anterior, estoy cortando a 3.

* Location count =
CALCULATE(COUNTA('Location'[Location]), ALLSELECTED('Location'[Location]))

*SD = 
VAR _sum =
SUMMARIZE ('AProfile',
Location[Location],
"_xn", [#%# R12/FTE],
"_x",[** Z score Mean for $/FTE]
)
RETURN

//SQRT ( DIVIDE ( SUMX ( _sum, ( [_xn] - [_x] ) ^ 2 ) ,2 )) // not working
SQRT ( DIVIDE ( SUMX ( _sum, ( [#%# R12/FTE] - [** Z score Mean for $/FTE] ) ^ 2 ), [* location count]))


Lo siento de nuevo... Creo que mi problema fue con el allexcept, o que estoy trabajando en servicio? ? Aquí está el código que utilicé. He modificado los nombres de los campos para mayor confidencialidad.

SD = 

Var _sum = SUMMARIZE (
        ALLSELECTED ( 'AProfile' ),
        Location[Location],
        A[Year],
        "_xn", [#%# R12/FTE] ,
        "_x",
            AVERAGEX (
                FILTER (
                    ALLEXCEPT( AProfile, Location[Location], AProfile[Year]), AProfile[NumericEquivalent] <70  // In this scenario the value [#%# R12/FTE] has already taken into account <70 so this is not needed here.  I've tried with it in and out.
                ),
                [#%# R12/FTE]
            )
    )

RETURN

SQRT ( DIVIDE ( SUMX ( _sum, ( [_xn] - [_x] ) ^ 2 ), 3 ) )



¡¡Muchas gracias!! ¡Esto es genial! Todavía estoy tratando de llegar a un punto en el que pueda usar la función de desviación estándar, pero este parece ser mi único trabajo. ¡Eres muy amable (y hábil)!

Helpful resources

Announcements
June 2025 Power BI Update Carousel

Power BI Monthly Update - June 2025

Check out the June 2025 Power BI update to learn about new features.

June 2025 community update carousel

Fabric Community Update - June 2025

Find out what's new and trending in the Fabric community.

Top Solution Authors