Foto por en

Desarrollar un modelo preciso y simple (e interpretable) en el aprendizaje automático puede ser una tarea muy desafiante. Dependiendo del enfoque de modelado (p. Ej., Redes neuronales frente a regresión logística), tener demasiadas características (es decir, predictores) en el modelo podría aumentar la complejidad del modelo o provocar otros problemas como multicolinealidad y sobreajuste¹. Además, con un modelo muy complejo, podría ser más difícil adquirir (o mantener) un gran conjunto de características para futuras predicciones. Por tanto, es importante seleccionar óptimo caracteristicas.

A veces menos es más. -William Shakespeare

Eliminación de características recursivas², o en breve RFE, es un algoritmo ampliamente utilizado para seleccionar características que son más relevantes en la predicción de la variable objetivo en un modelo predictivo, ya sea regresión o clasificación. RFE aplica un proceso de selección hacia atrás para encontrar la combinación óptima de características. Primero, crea un modelo basado en todas las características y calcula la importancia de cada característica en el modelo. Luego, clasifica las características y elimina las que tienen la menor importancia de manera iterativa en función de las métricas de evaluación del modelo (por ejemplo, RMSE, precisión y Kappa). La importancia de la característica se puede calcular basándose en el modelo (por ejemplo, el criterio de importancia aleatoria del bosque) o usando una métrica independiente del modelo (por ejemplo, análisis de curvas ROC) ⁴. Este proceso continúa hasta que menor El subconjunto de características se conserva en el modelo (técnicamente, RFE aún puede mantener todas (o la mayoría) de las características en el modelo final). …


#classev #relnoopener #href5minutemachinelearningnaivebayesf48472670fddsourcecollectionhome0Aprendizaje #automático #minutosa