.
ALTA GERENCIA

Cuídese de la trampa del “sobreajuste” en el análisis de datos

lunes, 30 de enero de 2017
La República Más
  • Agregue a sus temas de interés

LR

Puede ser emocionante cuando el análisis de datos sugiere una predicción sorprendente. Pero el resultado podría deberse a sobreajuste, que ocurre cuando un modelo estadístico describe ruido aleatorio en lugar de la relación subyacente que debe registrar. Puede protegerse contra esta trampa manteniendo simple su análisis. Protéjase de correlaciones espurias, y busque relaciones que midan efectos importantes relacionados con hipótesis claras. Pruebe la existencia de sobreajuste dividiendo los datos aleatoriamente en un conjunto de prueba, con el que estimará el modelo, y un conjunto de validación, con el que probará la veracidad de las predicciones del modelo. Un modelo sobreajustado pudiera ser excelente para hacer predicciones dentro del conjunto de prueba pero enciende focos de alarma al desempeñarse deficientemente en el conjunto de validación. También pudiera considerar narrativas alternativas: ¿hay otra explicación que pudiera dar con los mismos datos?

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA