Overfitting y Underfitting: Mis batallas con el equilibrio en Machine Learning (y por qué no es solo ajustar un parámetro)

Publicado el 2 de abril de 2026

Recuerdo la primera vez que un modelo que había entrenado rindió espectacularmente en mi entorno de desarrollo, con métricas de ensueño. Luego, al pasarlo a datos nuevos, ¡catástrofe! Los resultados eran peores que tirar una moneda. Ahí fue cuando el concepto de overfitting dejó de ser una teoría de los libros para convertirse en mi dolor de cabeza personal.

Overfitting: Cuando tu modelo es demasiado listo para su propio bien

Para mí, el overfitting es el modelo que se sabe la lección de memoria. Entendió tan a fondo los ejemplos que le di (los datos de entrenamiento), que no es capaz de generalizar cuando le pongo un problema nuevo. Es como si le pidieras a un estudiante que se aprenda de memoria las respuestas de un examen; sacará un 10 en ese examen, pero en uno con preguntas ligeramente diferentes, fallará estrepitosamente.

Lo he visto mil veces: curvas de entrenamiento que bajan sin parar, una precisión del 99% en tu conjunto de entrenamiento, y luego un 60% en el de validación. Eso es una señal clara. Pero no me quedo solo con los números. Me gusta investigar dónde está fallando. ¿Hay patrones en los errores? ¿Se equivoca en clases minoritarias? Esa introspección es clave antes de empezar a tocar cosas.

Underfitting: El modelo que no estudió suficiente

Por otro lado, el underfitting es el modelo que no entendió nada. O, para ser más precisos, entendió demasiado poco. Su hipótesis es tan simple que ni siquiera es capaz de capturar las relaciones básicas en los datos de entrenamiento. En mis proyectos, esto se manifiesta como un rendimiento pobre tanto en el entrenamiento como en la validación.

Es la pereza hecha modelo. Un clasificador lineal para un problema inherentemente no lineal, o un árbol de decisión con profundidad limitada para un dataset complejo. El modelo no tiene la capacidad de aprender la complejidad necesaria. Cuando veo esto, mi mente se va directamente a pensar si la Feature Engineering ha sido suficiente, o si el modelo que elegí es demasiado simple para la tarea.

Mis trucos para el equilibrio: Más allá de los parámetros

La batalla contra el overfitting y el underfitting no es solo una cuestión técnica; es una mentalidad. No hay una fórmula mágica, es un tira y afloja constante:

Validación Robusta, siempre: Nunca me fío de un solo número. Siempre uso validación cruzada. Además, un buen conjunto de validación que represente bien la realidad es mi mejor amigo para detectar estos problemas a tiempo. Es la base para poder fiarte de tus métricas de evaluación.
Visualización: Las curvas de aprendizaje son oro. Ver cómo se comportan las métricas en entrenamiento y validación a medida que el modelo aprende me da una pista visual instantánea del equilibrio. Si la brecha entre ellas se abre demasiado, sospecho de overfitting. Si ambas están estancadas en un valor bajo, underfitting.
No te lances a la solución: Mi primera reacción no es cambiar el modelo o ajustar hiperparámetros. Primero, intento entender la causa raíz. ¿Tengo suficientes datos para la complejidad de mi problema? ¿Son mis features realmente informativas? ¿Hay ruido excesivo en los datos?
Menos es más, a veces: Para el overfitting, a menudo, reducir la complejidad del modelo, simplificar las features o aplicar regularización son mis primeras líneas de defensa. Para el underfitting, necesito darle al modelo más potencia, más features, o probar una arquitectura más compleja.
El contexto es rey: Sé que suena a tópico, pero el conocimiento del dominio del problema es mi arma secreta. Me ayuda a entender qué patrones son reales y cuáles son solo ruido en los datos. Esto me guía a la hora de saber si un modelo está

Overfitting y Underfitting: Mis batallas con el equilibrio en Machine Learning (y por qué no es solo ajustar un parámetro)

Overfitting: Cuando tu modelo es demasiado listo para su propio bien

Underfitting: El modelo que no estudió suficiente

Mis trucos para el equilibrio: Más allá de los parámetros

Notas relacionadas

Aprendizaje por Refuerzo: Mis batallas con el paradigma (y cuándo, a pesar de todo, me ha salvado)

Interpretación vs. Rendimiento en IA: Mi guerra interna (y la tuya) al elegir un modelo

Bandidos Multi-Brazo: Mi arma secreta cuando el A/B testing es demasiado lento

Versionar Datos en Machine Learning: La Guerra Fría de la Reproducibilidad (y cómo la gano yo)

Hyperparameter Tuning: La pesadilla silenciosa que diferencia un modelo mediocre de uno decente (y cómo la afronto yo)

La Abstracción: Mi Superpoder Secreto contra el Caos en el Código (y en la IA)

El infierno del 'esto funcionaba ayer': Mi cruzada por el versionado de modelos y experimentos en ML

Regularización en ML: No es magia, es disciplina (y por qué siempre la tengo en mente)