Clustering: La verdad incómoda que no te cuentan de K-Means (y por qué lo sigo usando)

Publicado el 26 de abril de 2026

Recuerdo la primera vez que apliqué K-Means a un dataset con la esperanza de que, como por arte de magia, me revelara patrones ocultos y segmentaciones de usuarios claras. Spoiler: no pasó. Terminé con un montón de puntos coloreados y una sensación de que había perdido el tiempo. El clustering, esa rama del aprendizaje no supervisado, se vende a menudo como una solución elegante para entender tus datos. Y lo es, pero tiene sus mañas, sus trampas, y, en mi experiencia, requiere más ojo crítico del que se suele enseñar.

K-Means: El martillo más popular (pero no el único clavo)

K-Means es el algoritmo de clustering por excelencia. Es rápido, fácil de entender y, si tus datos lo permiten, te da resultados decentes. Pero mis batallas con él han sido muchas. La limitación más obvia es que asume clusters esféricos, con una densidad similar, y que el número de clusters k lo tienes que saber de antemano. ¿Cómo voy a saber yo k si precisamente quiero descubrir patrones? Es un dilema clásico que me ha quitado el sueño. Los métodos como el del codo o la silueta ayudan, sí, pero no son infalibles y a veces me dejan más confundido que al principio.

Aun así, no lo abandono. Para prototipado rápido, o cuando tengo una idea a priori del número de grupos y sé que mis datos se comportan de forma relativamente “ordenada”, K-Means es mi herramienta de elección. Es como un cuchillo suizo: no es perfecto para todo, pero es práctico si sabes sus limitaciones.

Cuando K-Means te hace un flaco favor: Explorando otras vías

Mis datos rara vez son esféricos y bien separados. Por eso, he tenido que buscar alternativas, y mi preferida suele ser DBSCAN. La primera vez que lo usé en un dataset con clusters de formas extrañas y un montón de ruido, sentí que me había quitado un peso de encima. DBSCAN no asume formas específicas, puede encontrar clusters de cualquier forma y, lo mejor de todo, identifica los puntos de ruido. Para mí, el ruido es un problema serio. Antes de intentar aplicar cualquier algoritmo, soy un maniático de la limpieza y la preparación de los datos; si no lo hago, el modelo solo aprenderá basura. Como ya mencioné en Datos para IA: La verdad incómoda que nadie quiere oír, la calidad de la entrada es siempre más importante que la sofisticación del modelo.

Otro algoritmo que aprecio es el clustering jerárquico. Cuando no tengo la menor idea de cuántos clusters existen o quiero explorar la estructura de los datos a diferentes niveles de granularidad, los dendrogramas son mis mejores amigos. Me permiten visualizar cómo se agrupan los puntos y decidir dónde “cortar” para obtener los clusters que más sentido tienen. No es tan escalable como K-Means para datasets gigantes, pero para entender la estructura subyacente, me ha salvado varias veces.

Clustering con Agentes de IA: ¿Una locura?

Al principio, la idea de usar clustering con agentes de IA me parecía forzada. ¿Para qué? Pero, pensándolo bien, un agente necesita contextualizar y organizar la información. Imagina un agente que recibe constantemente feedback de usuarios o logs de errores. Aplicar clustering a estos textos (usando embeddings, claro) puede ayudarle a:

Identificar temas recurrentes: Agrupar comentarios similares para entender rápidamente cuáles son los problemas más reportados. Así, el agente puede priorizar tareas o generar respuestas más coherentes.
Detectar anomalías: Si un feedback es un outlier y no se agrupa con nada, podría indicar un problema nuevo o muy específico que requiere atención inmediata.
Generalizar el comportamiento: Al entender grupos de interacciones, un agente podría desarrollar estrategias más generales en lugar de tratar cada interacción como única.

No es un uso directo en el bucle de toma de decisiones del agente, pero sí en su fase de aprendizaje o análisis de su propio rendimiento o del entorno. Es una herramienta de preprocesamiento o análisis para el “cerebro” del agente, ayudándole a darle sentido a un mar de información no estructurada.

Mis reglas de supervivencia en el mundo del clustering

Si has llegado hasta aquí, probablemente ya te habrás dado cuenta de que el clustering no es una bala de plata. Aquí están mis mandamientos para no perder la cabeza:

Visualiza, visualiza, visualiza: Siempre. Antes, durante y después. PCA, t-SNE, UMAP… lo que sea, pero mira tus datos. Un gráfico te dirá más que diez métricas.
No te cases con un algoritmo: Como te he mostrado, hay más allá de K-Means. Prueba, experimenta y entiende por qué un algoritmo funciona mejor que otro para tu problema.
El “humano en el bucle” es indispensable: Especialmente en clustering, donde no hay una verdad objetiva. Necesitas a alguien (o a ti mismo) que valide si esos clusters tienen sentido en el mundo real. He hablado de esto extensamente en El ‘humano en el bucle’ no es un parche.
Define tu métrica de “éxito”: ¿Qué significa que tu clustering sea bueno? ¿Clusters compactos? ¿Bien separados? ¿Que la segmentación genere una acción de negocio concreta? Sin eso, solo estás moviendo datos de un lado a otro.

El clustering es una herramienta potente, pero cruda. No esperes milagros, espera trabajo. Entiende sus limitaciones, juega con diferentes algoritmos y, sobre todo, no confíes ciegamente en lo que te “dice” sin una validación externa. Así es como, al final del día, consigo que esta técnica me aporte valor y no más dolores de cabeza.

Clustering: La verdad incómoda que no te cuentan de K-Means (y por qué lo sigo usando)

K-Means: El martillo más popular (pero no el único clavo)

Cuando K-Means te hace un flaco favor: Explorando otras vías

Clustering con Agentes de IA: ¿Una locura?

Mis reglas de supervivencia en el mundo del clustering

Notas relacionadas

Optimizadores en Redes Neuronales: Por qué Adam no siempre es tu mejor amigo (y cuándo me fastidia)

Eficiencia Computacional en IA: Mi batalla para hacer que cada FLOP cuente (y por qué deberías lucharla tú también)

Aprendizaje Federado: Por qué tu IA no necesita mis datos para ser inteligente (y por qué me da una paz inmensa)

Feature Engineering: Por qué no es un truco, sino el cerebro de tu modelo (y cómo me salva el pellejo)

Sesgos en IA: la incómoda verdad de nuestros modelos (y por qué me obsesiona)

Más allá de la correlación: Mi obsesión con la causalidad en IA (y por qué deberías tenerla tú también)

¿Reforzamiento? A veces es un martillo para una tuerca (y cuándo me lo pienso dos veces)

Orquestación de Agentes de IA: Por qué encadenar prompts no es una estrategia (y cuándo necesitas un director)