Check your eligibility for this 50% exam voucher offer and join us for free live learning sessions to get prepared for Exam DP-700.
Get StartedDon't miss out! 2025 Microsoft Fabric Community Conference, March 31 - April 2, Las Vegas, Nevada. Use code MSCUST for a $150 discount. Prices go up February 11th. Register now.
Tengo una tabla que tiene las siguientes columnas:
SampleID - Fecha/Hora - Atributo - Valor - Marca - RunID
Tomamos muestras en grupos de 4. Me gustaría encontrar el promedio de los valores en cada grupo de 4. A veces, si una prueba falla, terminamos con un grupo de 2 o 3. En estos casos, me gustaría calcular solo el promedio si tenemos un mínimo de 3 puntos de datos.
SampleID es un número consecutivo para cada prueba. RunID es el identificador único de la ejecución del empaquetado.
¿Alguna idea?
Hola @cbruhn42 ,
¿La respuesta ofrecida le ayudó a resolver el problema, si ayuda, puede considerar aceptarla como una solución para que más usuarios puedan consultarla, o si tiene otros problemas, puede ofrecer información para que pueda brindarle más sugerencias.
Saludos
Lucy Chen
Son algunos datos de muestra.
Id. de muestra | SampleDateTime (Hora) | Comment1_ValveNumber | Atributo | Valor | RunID combinado | Línea de Empaque | Promedio de atributos |
153243 | 12/18/2024 18:11 | 9 | TPO2 | 36 | 4695 | Conservero | |
153244 | 12/18/2024 18:14 | 10 | TPO2 | 47 | 4695 | Conservero | |
153245 | 12/18/2024 18:18 | 11 | TPO2 | 42 | 4695 | Conservero | 41.66666667 |
153116 | 12/18/2024 20:35 | 1 | TPO2 | 40 | 10561 | Embotellado | |
153117 | 12/18/2024 20:39 | 2 | TPO2 | 34 | 10561 | Embotellado | |
153118 | 12/18/2024 20:42 | 3 | TPO2 | 31 | 10561 | Embotellado | |
153119 | 12/18/2024 20:45 | 4 | TPO2 | 40 | 10561 | Embotellado | 36.25 |
153250 | 12/18/2024 21:15 | 13 | TPO2 | 57 | 4695 | Conservero | |
153251 | 12/18/2024 21:19 | 14 | TPO2 | 53 | 4695 | Conservero | |
153252 | 12/18/2024 21:22 | 15 | TPO2 | 51 | 4695 | Conservero | |
153253 | 12/18/2024 21:26 | 16 | TPO2 | 38 | 4695 | Conservero | 49.75 |
153120 | 12/18/2024 21:35 | 5 | TPO2 | 32 | 10561 | Embotellado | |
153121 | 12/18/2024 21:39 | 6 | TPO2 | 27 | 10561 | Embotellado | |
153122 | 12/18/2024 21:43 | 7 | TPO2 | 29 | 10561 | Embotellado | |
153123 | 12/18/2024 21:46 | 8 | TPO2 | 38 | 10561 | Embotellado | 31.5 |
153254 | 12/18/2024 22:35 | 17 | TPO2 | 68 | 4695 | Conservero | |
153255 | 12/18/2024 22:38 | 18 | TPO2 | 63 | 4695 | Conservero | |
153256 | 12/18/2024 22:42 | 19 | TPO2 | 61 | 4695 | Conservero | |
153257 | 12/18/2024 22:51 | 20 | TPO2 | 63 | 4695 | Conservero | 63.75 |
153124 | 12/18/2024 22:55 | 9 | TPO2 | 9 | 10561 | Embotellado | |
153125 | 12/18/2024 22:58 | 10 | TPO2 | 43 | 10561 | Embotellado | |
153126 | 12/18/2024 23:12 | 11 | TPO2 | 47 | 10561 | Embotellado | |
153127 | 12/18/2024 23:15 | 12 | TPO2 | 40 | 10561 | Embotellado | 34.75 |
153258 | 12/18/2024 23:51 | 21 | TPO2 | 63 | 4695 | Conservero | |
153259 | 12/18/2024 23:54 | 22 | TPO2 | 48 | 4695 | Conservero | |
153260 | 12/18/2024 23:57 | 23 | TPO2 | 42 | 4695 | Conservero | |
153261 | 12/19/2024 0:01 | 24 | TPO2 | 49 | 4695 | Conservero | 50.5 |
Puede ver que cambiamos entre los runID de empaquetado / línea de empaquetado dentro de nuestro conjunto de datos. El primer conjunto solo tenía 3 muestras, pero el resto tiene 4. La última columna de la derecha es el promedio de los valores del atributo TPO2. Necesito calcular en función del atributo porque hay alrededor de otros 9 atributos para los que querría calcular el promedio.
Esto parece que debería funcionar, pero ¿funcionará cuando no tengo la tabla filtrada por atributo? Tengo varios atributos en el conjunto de datos principal.
Por favor, pruébalo tú mismo y házmelo saber.
Está muy cerca de funcionar. Por lo tanto, siempre que mis subconjuntos de datos tengan un cambio en el runID combinado, funciona muy bien. Pero, por ejemplo, si ejecuto subconjuntos consecutivos bajo el mismo RunID combinado, agrupa los dos subconjuntos como uno solo. Entonces, en lugar de un conjunto de 4 muestras, obtengo un conjunto de 8.
He aquí un ejemplo:
Las filas resaltadas deben promediar y las siguientes 3 filas deben promediar juntas. Lo sé mirando las marcas de fecha y hora. Puedes ver cómo se agrupan muy juntos. ¡Oh, tan cerca!
No se me ocurre una solución a esto. Mi solución funcionará si no están espalda con espalda. Alternativamente, tiene que haber otra columna que asigne un número a las primeras 4 filas y otro número a las siguientes 4.
¿Se le ocurre una manera de comparar la fila SampleDateTime con la fila anterior SampleDateTime y, a continuación, usar esa diferencia para agrupar las muestras? Por ejemplo, simplemente agruparía muestras que están a menos de 30 minutos entre sí y tienen más de 2 muestras en la agrupación.
Comparta algunos datos para trabajar con la factorización en este y todos los demás escenarios poco convencionales que puedan ser. No tengas prisa por publicar. Revise cuidadosa y minuciosamente todos los escenarios que se le ocurran y en ese conjunto de datos muestre el resultado esperado con mucha claridad. Comparta datos en un formato que se pueda pegar en un archivo de MS Excel.
Hola
Comparta algunos datos y muestre el resultado esperado. Comparta datos en un formato que se pueda pegar en un archivo de MS Excel.
Publicado algunos datos arriba. Esperemos que tengas algunas ideas.
@cbruhn42 , Suponga que necesita una medida , Promedio por encima del nivel de grupo
Promediox(Valores(Tabla[grupo]), calcular(Suma(Tabla[Valor])) )
o Promedio por encima del nivel de la muestra
Promediox(Valores(Tabla[muestra]), calcular(Suma(Tabla[Valor])) )
March 31 - April 2, 2025, in Las Vegas, Nevada. Use code MSCUST for a $150 discount! Prices go up Feb. 11th.
Check out the January 2025 Power BI update to learn about new features in Reporting, Modeling, and Data Connectivity.