Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Level up your Power BI skills this month - build one visual each week and tell better stories with data! Get started

Reply
Syndicate_Admin
Administrator
Administrator

Lidiar con los valores faltantes

Por favor, ayúdenos.

¿Cómo puedo lidiar con los datos que faltan en una https://drive.google.com/file/d/1w_-i4JvdcYApxtI3QD3MUOE52NYYvcxx/view?usp=sharing fuente de datos, algún consejo o truco?

Mi análisis hasta ahora:

Reports To Code tiene 462 valores faltantes.
El estado de la hoja de horas tiene 90 valores faltantes.
Los valores que faltan en las columnas "Informes al código" y "Estado de la hoja de horas" pueden ser especialmente preocupantes porque sugieren datos administrativos faltantes que probablemente se espera que estén presentes para cada registro.

Las estadísticas de resumen de las columnas numéricas proporcionan la siguiente información:

Horas facturables reales por semana: La media es de alrededor de 14,23 horas con un máximo de 58,34 horas, lo que sugiere algunas variaciones elevadas en las horas facturables, que pueden esperarse en función de la carga de trabajo y los contratos.
Horas reales de la semana: el promedio es más alto que las horas facturables en aproximadamente 26,85 horas, con un máximo de 74,33 horas, que pueden incluir el trabajo no facturable.
Aprobado por: parece ser un campo categórico que podría codificarse como numérico, representando diferentes aprobadores o departamentos con identificadores que van de 4 a 172.
Horas facturables por semana: En promedio, alrededor de 19.15 horas, con un máximo de 93.5 horas, lo cual es bastante alto y puede justificar una mayor investigación para garantizar la precisión.
Capacidad diaria: La mayoría de los valores rondan entre 7,5 y 8 horas, lo que se alinea con las expectativas típicas de un día de trabajo.
Capacidad semanal: Generalmente de 37,5 a 40 horas, que es el estándar para una semana laboral a tiempo completo.
Licencia semanal: El promedio es de aproximadamente 3.68 horas, con un máximo de 40 horas, lo que indica que algunas entradas representan una semana completa de licencia.
Las columnas relacionadas con servicios específicos, como Servicios de datos y desarrollo: horas facturables reales semanales y Servicios profesionales: horas facturables reales semanales, tienen valores medios que sugieren un seguimiento activo de las horas de estos servicios, con una distribución razonable.

Tasa de utilización:

Utilización facturable: el porcentaje de horas facturables reales con respecto al total de horas disponibles.
Utilización general: el porcentaje del total de horas reales (facturables y no facturables) con respecto al total de horas disponibles.
Horas facturables:

Total de horas facturables: el número total de horas facturadas a los clientes.
Promedio de horas facturables por empleado: el número promedio de horas facturables por empleado o por función.
Utilización de la capacidad:

Utilización media diaria de la capacidad: Número medio de horas trabajadas al día dividido por la capacidad diaria.
Utilización semanal de la capacidad: total de horas reales de la semana dividido por la capacidad semanal total.
Eficiencia de ingresos:

Ingresos por hora facturable: ingresos totales divididos por el total de horas facturables.
Ingresos por empleado: ingresos totales divididos por el número de empleados.
Vacaciones y ausentismo:

Promedio de vacaciones semanales: El promedio de horas de licencia tomadas por semana.
Tasa de licencias: El porcentaje de horas tomadas como vacaciones del total de horas disponibles.
Desempeño del proyecto:

2 REPLIES 2
Syndicate_Admin
Administrator
Administrator

Hola, @Yrstruly2021


¿Puedo pedirle que resuelva su problema, puede consultar @danextian sugerencia, si todavía hay confusión, puede consultar la siguiente sugerencia sobre cómo lidiar con los valores faltantes


1. Identifique los tipos de datos faltantes (hay tres tipos principales de datos faltantes)
MCAR (Missing Completely at Random): En este escenario, la falta se produce aleatoriamente en todas las variables y observaciones. Es como perder piezas de Lego durante un juego: cada pieza que falta no afecta a la información sobre otras piezas.
MAR (Missing at Random): En este caso, la probabilidad de que falten datos depende de otras variables del conjunto de datos. Por ejemplo, en una encuesta, los científicos de datos que no actualizan sus habilidades con frecuencia pueden omitir ciertas preguntas relacionadas con las nuevas tecnologías.
MNAR (Missing Not at Random): Este es el escenario más desafiante. La probabilidad de que falten datos varía para diferentes valores de la misma variable, y las razones pueden ser desconocidas para nosotros (por ejemplo, parejas con una mala relación que evitan ciertas preguntas en una encuesta).
2. Técnicas para manejar los datos faltantes:
Imputación: Imputar valores faltantes con valores estimados o pronosticados. Los métodos comunes incluyen la imputación media, la imputación mediana o la imputación basada en regresión.
Eliminación de filas: si los datos que faltan son mínimos, considere la posibilidad de eliminar las filas con valores que faltan. Sin embargo, tenga cuidado de no perder demasiada información.
Variables categóricas:
En el caso de las variables categóricas, considere la posibilidad de crear una nueva categoría para los valores que faltan.
Como alternativa, utilice modelos predictivos para imputar los valores categóricos que faltan.
Variables numéricas:
En el caso de las variables numéricas, imputar los valores faltantes utilizando medidas estadísticas (media, mediana, etc.).
Considere la posibilidad de utilizar modelos de aprendizaje automático (por ejemplo, k vecinos más cercanos) para la imputación.
Técnicas avanzadas:
Imputación múltiple: genere varios conjuntos de datos imputados y combine los resultados.
Interpolación: utilice datos de series temporales para interpolar los valores que faltan.
Aprendizaje profundo: entrene las redes neuronales para predecir los valores que faltan.
3. Consejos y trucos:
Limitar los seguimientos: Minimice el número de seguimientos durante la recopilación de datos para reducir los datos que faltan.
Formularios fáciles de usar: Diseñe formularios de recopilación de datos fáciles de usar para fomentar respuestas completas.
Validación de datos: Implemente técnicas de validación para detectar errores durante la entrada de datos.
Ofrecer incentivos: Ofrezca incentivos a los participantes para que envíen datos precisos y completos.

Saludos
Yang
Equipo de apoyo a la comunidad

Si hay alguna publicación que ayude, considere Aceptarla como la solución para ayudar a los otros miembros a encontrarla más rápidamente.
Si no entiendo sus necesidades o aún tiene problemas al respecto, no dude en hacérnoslo saber. ¡Muchas gracias!

Cómo obtener respuestas rápidas a sus preguntas : cómo proporcionar datos de ejemplo en el foro de Power BI

Syndicate_Admin
Administrator
Administrator

Hola @Yrstruly2021 ,

Varias cosas que puedes hacer:

Al final del día, es su decisión qué enfoque seguir. Si esto está relacionado con el trabajo, por lo general hay pautas de la empresa sobre qué hacer con los datos faltantes. Si no es así, ¿por qué no se lo preguntas a tu superior inmediato?

Helpful resources

Announcements
April Power BI Update Carousel

Power BI Monthly Update - April 2026

Check out the April 2026 Power BI update to learn about new features.

Fabric SQL PBI Data Days

Data Days 2026 coming soon!

Sign up to receive a private message when registration opens and key events begin.

New to Fabric survey Carousel

New to Fabric Survey

If you have recently started exploring Fabric, we'd love to hear how it's going. Your feedback can help with product improvements.

Power BI DataViz World Championships carousel

Power BI DataViz World Championships - June 2026

A new Power BI DataViz World Championship is coming this June! Don't miss out on submitting your entry.