Concurrencia vs. Paralelismo: Por qué a veces lo 'rápido' sale caro (y cuándo yo me abstengo)

Publicado el 12 de abril de 2026

Recuerdo un proyecto en mis inicios donde la obsesión por la ‘velocidad’ me llevó a complicar el código hasta límites ridículos. Estaba intentando hacer todo concurrente, pensando que más hilos o procesos eran la solución mágica. Resultado: un sistema imposible de debuggear, lleno de deadlocks y race conditions que solo yo, a las 3 de la mañana, intentaba descifrar. La mejora de rendimiento, si es que hubo alguna significativa, no compensó ni de lejos las horas perdidas y el estrés.

Para mí, la diferencia entre concurrencia y paralelismo es práctica, no teórica. La concurrencia es cómo organizas el trabajo para que parezca que varias cosas suceden a la vez, aunque a lo mejor solo tengas un trabajador haciendo malabares. El paralelismo es cuando tienes varios trabajadores reales haciendo cosas al mismo tiempo. Piensa en un chef (concurrencia) que corta verduras, revisa el horno y atiende la sartén casi simultáneamente. Y en una cocina con varios chefs (paralelismo) cada uno en su estación.

El precio de la velocidad

Y ese es el quid de la cuestión: tener más trabajadores es caro. No solo en recursos de máquina, sino en complejidad de código. De repente, tienes que preocuparte por:

Compartir estado: ¿Quién tiene acceso a qué dato? ¿Cuándo se modifica? Los locks, mutexes, y semáforos son tus nuevos ‘amigos’ (que en realidad son un dolor de muelas si no los usas con cuidado).
Sincronización: Que una tarea no pise a otra, que esperen el resultado correcto.
Debugging: Rastrear errores en un flujo lineal ya es un arte; en un flujo no determinista es una pesadilla. Me he salvado de muchas noches en vela gracias a mi filosofía para no perder la cabeza con el manejo de errores, pero la concurrencia es otra liga.

Cuándo me tiro de cabeza (y por qué)

A pesar de los desafíos, hay escenarios donde la concurrencia y el paralelismo son, sin excusas, indispensables.

Operaciones I/O Bound: Esto es pan comido para la concurrencia. Si tu código pasa la mayor parte del tiempo esperando una respuesta de red, una base de datos o un disco, ¿por qué no usar ese tiempo muerto para hacer otra cosa? Aquí es donde async/await en Python (o JavaScript, o C#) brilla. Tus hilos no están bloqueados; simplemente ‘ceden’ el control hasta que el dato llega. Esto no es paralelismo real, pero para el usuario, el efecto es el mismo: la aplicación sigue respondiendo.
Carga computacional intensa (CPU Bound): Aquí sí, necesitamos paralelismo de verdad. Si tengo que procesar un dataset enorme, entrenar un modelo de IA complejo (aunque esto lo delego a librerías optimizadas en C++ o CUDA), o realizar simulaciones matemáticas, entonces sí, quiero usar todos los núcleos de mi procesador. En Python, el módulo multiprocessing es mi goto. Cuidado: Los modelos de ML suelen estar optimizados para GPUs, por lo que intentar paralelizar con CPU a mano puede ser un esfuerzo inútil si la librería ya lo hace mejor o si tienes acceso a hardware especializado.
Agentes de IA y sistemas reactivos: Mis agentes de IA a menudo tienen que monitorizar varios sensores, procesar entradas, tomar decisiones y ejecutar acciones casi simultáneamente. No puedo permitirme que uno bloquee a los demás. Una máquina de estados bien diseñada, apoyada en concurrencia (como asyncio), es fundamental aquí. Si quieres entender por qué mis agentes de IA necesitan máquinas de estados, echa un ojo a ese post.

Cuándo no me molesto (y te recomiendo que tampoco lo hagas)

Mi regla de oro es: no optimices prematuramente. Si tu función tarda 100ms y el 99% del tiempo de ejecución está en otra parte, no la hagas concurrente. Es un desperdicio de esfuerzo y una inyección de complejidad innecesaria. El código concurrente es inherentemente más difícil de leer, de entender y de mantener.

Aplicaciones pequeñas o scripts de un solo uso: Ni me lo planteo. Simplicidad por encima de todo.
Problemas donde la mayoría del tiempo es de procesamiento ligero y secuencial: El overhead de la concurrencia (crear hilos/procesos, sincronización, cambio de contexto) puede ser mayor que el beneficio.
Cuando el problema no está bien definido: La modularidad ayuda mucho a aislar partes del sistema, pero si ni siquiera tienes claro qué necesita ser rápido, no te metas en berenjenales. Hablé de esto en Modularidad y Composición: Por qué mis sistemas no son un monolito pegado con cinta aislada. Un sistema monolítico bien estructurado y secuencial es, con frecuencia, más que suficiente y mucho más fácil de manejar.

Mi filosofía

Primero, haz que funcione. Luego, si demuestras que hay un cuello de botella evidente y que ese cuello de botella puede ser aliviado por la concurrencia o el paralelismo, entonces y solo entonces, considera implementarlo. Y hazlo con la mínima complejidad posible. La velocidad está bien, pero la mantenibilidad y la robustez del código valen su peso en oro. Me he quemado muchas veces para saber que no es una bala de plata.

Concurrencia vs. Paralelismo: Por qué a veces lo 'rápido' sale caro (y cuándo yo me abstengo)

El precio de la velocidad

Cuándo me tiro de cabeza (y por qué)

Cuándo no me molesto (y te recomiendo que tampoco lo hagas)

Mi filosofía

Notas relacionadas

Mi Manifiesto del Testing: Por qué no suelto código sin ponerlo a prueba (especialmente en IA)

Validación Cruzada: Por qué mis modelos siempre pasan por un 'examen sorpresa' (y por qué los tuyos deberían también)

Observabilidad: Por qué mirar solo logs es como pilotar a ciegas (y cómo evito estrellarme)

Modularidad y Composición: Por qué mis sistemas (y agentes de IA) no son un monolito pegado con cinta aislante

Máquinas de Estados: Mi antídoto contra el código espagueti (y por qué tus agentes de IA las necesitan más de lo que crees)

La Abstracción: Mi Superpoder Secreto contra el Caos en el Código (y en la IA)

El infierno del 'esto funcionaba ayer': Mi cruzada por el versionado de modelos y experimentos en ML

Manejo de Errores: Mi filosofía para no perder la cabeza (y dormir por las noches)