Re: Promediar datos tomados en X minutos

Syndicate_Admin · ‎01-10-2025

Tengo una tabla que tiene las siguientes columnas:

SampleID - Fecha/Hora - Atributo - Valor - Marca - RunID

Tomamos muestras en grupos de 4. Me gustaría encontrar el promedio de los valores en cada grupo de 4. A veces, si una prueba falla, terminamos con un grupo de 2 o 3. En estos casos, me gustaría calcular solo el promedio si tenemos un mínimo de 3 puntos de datos.

SampleID es un número consecutivo para cada prueba. RunID es el identificador único de la ejecución del empaquetado.

¿Alguna idea?

Syndicate_Admin · ‎01-16-2025

Hola @cbruhn42 ,

¿La respuesta ofrecida le ayudó a resolver el problema, si ayuda, puede considerar aceptarla como una solución para que más usuarios puedan consultarla, o si tiene otros problemas, puede ofrecer información para que pueda brindarle más sugerencias.

Saludos

Lucy Chen

Syndicate_Admin · ‎01-14-2025

Son algunos datos de muestra.

Id. de muestra	SampleDateTime (Hora)	Comment1_ValveNumber	Atributo	Valor	RunID combinado	Línea de Empaque	Promedio de atributos
153243	12/18/2024 18:11	9	TPO2	36	4695	Conservero
153244	12/18/2024 18:14	10	TPO2	47	4695	Conservero
153245	12/18/2024 18:18	11	TPO2	42	4695	Conservero	41.66666667
153116	12/18/2024 20:35	1	TPO2	40	10561	Embotellado
153117	12/18/2024 20:39	2	TPO2	34	10561	Embotellado
153118	12/18/2024 20:42	3	TPO2	31	10561	Embotellado
153119	12/18/2024 20:45	4	TPO2	40	10561	Embotellado	36.25
153250	12/18/2024 21:15	13	TPO2	57	4695	Conservero
153251	12/18/2024 21:19	14	TPO2	53	4695	Conservero
153252	12/18/2024 21:22	15	TPO2	51	4695	Conservero
153253	12/18/2024 21:26	16	TPO2	38	4695	Conservero	49.75
153120	12/18/2024 21:35	5	TPO2	32	10561	Embotellado
153121	12/18/2024 21:39	6	TPO2	27	10561	Embotellado
153122	12/18/2024 21:43	7	TPO2	29	10561	Embotellado
153123	12/18/2024 21:46	8	TPO2	38	10561	Embotellado	31.5
153254	12/18/2024 22:35	17	TPO2	68	4695	Conservero
153255	12/18/2024 22:38	18	TPO2	63	4695	Conservero
153256	12/18/2024 22:42	19	TPO2	61	4695	Conservero
153257	12/18/2024 22:51	20	TPO2	63	4695	Conservero	63.75
153124	12/18/2024 22:55	9	TPO2	9	10561	Embotellado
153125	12/18/2024 22:58	10	TPO2	43	10561	Embotellado
153126	12/18/2024 23:12	11	TPO2	47	10561	Embotellado
153127	12/18/2024 23:15	12	TPO2	40	10561	Embotellado	34.75
153258	12/18/2024 23:51	21	TPO2	63	4695	Conservero
153259	12/18/2024 23:54	22	TPO2	48	4695	Conservero
153260	12/18/2024 23:57	23	TPO2	42	4695	Conservero
153261	12/19/2024 0:01	24	TPO2	49	4695	Conservero	50.5

Puede ver que cambiamos entre los runID de empaquetado / línea de empaquetado dentro de nuestro conjunto de datos. El primer conjunto solo tenía 3 muestras, pero el resto tiene 4. La última columna de la derecha es el promedio de los valores del atributo TPO2. Necesito calcular en función del atributo porque hay alrededor de otros 9 atributos para los que querría calcular el promedio.

Syndicate_Admin · ‎01-16-2025

Hola

Archivo PBI adjunto.

Espero que esto ayude.

Syndicate_Admin · ‎01-17-2025

Esto parece que debería funcionar, pero ¿funcionará cuando no tengo la tabla filtrada por atributo? Tengo varios atributos en el conjunto de datos principal.

Syndicate_Admin · ‎01-17-2025

Por favor, pruébalo tú mismo y házmelo saber.

Syndicate_Admin · ‎01-17-2025

Está muy cerca de funcionar. Por lo tanto, siempre que mis subconjuntos de datos tengan un cambio en el runID combinado, funciona muy bien. Pero, por ejemplo, si ejecuto subconjuntos consecutivos bajo el mismo RunID combinado, agrupa los dos subconjuntos como uno solo. Entonces, en lugar de un conjunto de 4 muestras, obtengo un conjunto de 8.

He aquí un ejemplo:

Las filas resaltadas deben promediar y las siguientes 3 filas deben promediar juntas. Lo sé mirando las marcas de fecha y hora. Puedes ver cómo se agrupan muy juntos. ¡Oh, tan cerca!

Syndicate_Admin · ‎01-17-2025

No se me ocurre una solución a esto. Mi solución funcionará si no están espalda con espalda. Alternativamente, tiene que haber otra columna que asigne un número a las primeras 4 filas y otro número a las siguientes 4.

Syndicate_Admin · ‎01-17-2025

¿Se le ocurre una manera de comparar la fila SampleDateTime con la fila anterior SampleDateTime y, a continuación, usar esa diferencia para agrupar las muestras? Por ejemplo, simplemente agruparía muestras que están a menos de 30 minutos entre sí y tienen más de 2 muestras en la agrupación.

Syndicate_Admin · ‎01-17-2025

Comparta algunos datos para trabajar con la factorización en este y todos los demás escenarios poco convencionales que puedan ser. No tengas prisa por publicar. Revise cuidadosa y minuciosamente todos los escenarios que se le ocurran y en ese conjunto de datos muestre el resultado esperado con mucha claridad. Comparta datos en un formato que se pueda pegar en un archivo de MS Excel.

Syndicate_Admin · ‎01-11-2025

Hola

Comparta algunos datos y muestre el resultado esperado. Comparta datos en un formato que se pueda pegar en un archivo de MS Excel.

Syndicate_Admin · ‎01-15-2025

Publicado algunos datos arriba. Esperemos que tengas algunas ideas.

Syndicate_Admin · ‎01-10-2025

@cbruhn42 , Suponga que necesita una medida , Promedio por encima del nivel de grupo

Promediox(Valores(Tabla[grupo]), calcular(Suma(Tabla[Valor])) )

o Promedio por encima del nivel de la muestra

Promediox(Valores(Tabla[muestra]), calcular(Suma(Tabla[Valor])) )

Promediar datos tomados en X minutos

Helpful resources

Join us at the Microsoft Fabric Community Conference

Power BI Monthly Update - January 2025

Fabric Community Update - January 2025

New Offer! Become a Certified Fabric Data Engineer

Promediar datos tomados en X minutos

Helpful resources

Join us at the Microsoft Fabric Community Conference

Power BI Monthly Update - January 2025

Fabric Community Update - January 2025