Supervisado vs. No Supervisado: Por qué la 'etiqueta' no es siempre tu mejor amiga (y cuándo la ignoro de plano)

Supervisado vs. No Supervisado: Por qué la 'etiqueta' no es siempre tu mejor amiga (y cuándo la ignoro de plano)

Publicado el

La primera pregunta que me hacen cuando hablamos de un nuevo proyecto de Machine Learning casi siempre es: “¿Y tenemos datos etiquetados para esto?” Y mi respuesta, que a veces sorprende, es: “Quizás no los necesitemos tanto como crees”.

Me he pasado años luchando en las trincheras de la IA, y algo que aprendí a fuego es que no todos los problemas se resuelven a martillazos con aprendizaje supervisado. Sí, clasificar correos como spam o predecir el precio de una casa son el pan de cada día, y ahí las etiquetas son el rey. Pero esa obsesión por tener una X que prediga una Y nos hace ciegos a un mundo de posibilidades que el aprendizaje no supervisado abre.

El Dorado de las Etiquetas (y su coste oculto)

Cuando hablamos de aprendizaje supervisado, lo primero que me viene a la cabeza es el esfuerzo. Requiere un conjunto de datos donde cada entrada tiene una ‘respuesta correcta’ asociada. Un email es spam o no-spam. Una imagen contiene un gato o un perro. Esto suena sencillo, ¿verdad? Pues en la práctica, es una pesadilla.

Conseguir esas etiquetas es carísimo. Hablo de horas y horas de humanos revisando datos, etiquetando manualmente, discutiendo ambigüedades. Y no solo es el dinero; la calidad de esas etiquetas es crítica. Unas etiquetas ruidosas o inconsistentes son la receta perfecta para un modelo que aprenderá basura y te dará dolores de cabeza. Para mí, la calidad de los datos es sagrada; por eso siempre insisto en que Datos para IA: La verdad incómoda que nadie quiere oír (y por qué es mi prioridad número uno). Si no tienes presupuesto para etiquetar bien, mejor no etiquetes.

Mis modelos supervisados brillan cuando la relación entre entrada y salida es clara, cuando necesito una predicción muy específica. Un modelo de detección de fraude, por ejemplo, donde un falso negativo es un problema serio, necesita ese rigor y esas etiquetas. Pero incluso aquí, a menudo hago una primera pasada con métodos no supervisados.

Cuando el Modelo Habla por Sí Mismo: El Poder de lo No Supervisado

Aquí es donde me pongo cómodo. El aprendizaje no supervisado es mi socio para la exploración, para entender la estructura intrínseca de los datos sin ninguna guía externa. No le doy respuestas; le pido que encuentre patrones, que agrupe cosas similares, que señale lo que es diferente.

¿Para qué lo uso? Pues para un montón de cosas:

  • Segmentación de clientes: Quiero entender grupos naturales de usuarios sin decirles de antemano qué es un “cliente premium” o un “cliente ocasional”. Aquí el clustering es mi amigo. De hecho, a veces me fastidia lo mucho que la gente se complica, cuando Clustering: La verdad incómoda que no te cuentan de K-Means (y por qué lo sigo usando).
  • Detección de anomalías: Identificar transacciones bancarias sospechosas, lecturas de sensores fuera de lo normal, o incluso comportamientos inusuales en servidores. No tengo una etiqueta de “esto es una anomalía”; solo sé que “esto es diferente al resto”.
  • Reducción de dimensionalidad: Cuando tengo datos con cientos o miles de características, y el modelo supervisado empieza a ahogarse. PCA, t-SNE… me ayudan a simplificar la representación de los datos, a visualizar su estructura y, de paso, a hacer que los modelos posteriores sean más eficientes.
  • Creación de características (Feature Engineering): A veces, los clusters que encuentro con aprendizaje no supervisado se convierten en características muy potentes para un modelo supervisado posterior. ¡Es como si el modelo se creara sus propias etiquetas de alto nivel! Lo comento en Feature Engineering: Por qué no es un truco, sino el cerebro de tu modelo (y cómo me salva el pellejo).

Lo mejor del aprendizaje no supervisado es que puedo ponerlo a trabajar con cantidades masivas de datos sin preocuparme por el coste de etiquetado. Me da una visión inicial que luego puedo usar para diseñar experimentos de etiquetado mucho más eficientes y dirigidos, o incluso para no etiquetar nada.

Mi Aproximación Pragmatista

No es una cuestión de “o lo uno o lo otro”. En mi día a día, la realidad es un mix. A menudo, empiezo con una fase de exploración no supervisada para entender mis datos. Agrupo, busco outliers, reduzco dimensiones. Una vez que tengo una intuición de la estructura, y si el problema lo requiere, puedo entonces pensar en un modelo supervisado.

Si el negocio realmente necesita una clasificación o una predicción concreta, entonces sí, me arremango y trabajo en conseguir las etiquetas, pero ya con una base más sólida y una mejor comprensión de dónde estoy pisando. Es un enfoque que me ha ahorrado incontables horas de trabajo en vano y me ha permitido construir sistemas más robustos y, sobre todo, más inteligentes. No solo “más precisos” en una métrica arbitraria.

Así que la próxima vez que alguien te pregunte por las etiquetas, tómate un momento. Pregúntate: ¿Es la mejor forma de abordar este problema? ¿O estoy intentando forzar una solución supervisada donde el descubrimiento no supervisado podría darme más valor con menos dolor de cabeza? Mi experiencia me dice que la segunda opción, muchas veces, es la buena.