Loom: un harness open-source para orquestar agentes de código
Loom es un proyecto de código abierto que actúa como capa de entrega para agentes de programación, separando la lógica de orquestación del modelo subyacente.
Uno de los problemas más concretos al trabajar con agentes de código no es el modelo, sino la infraestructura que lo rodea: cómo se lanza una tarea, cómo se recoge el resultado, cómo se gestiona el fallo. Esta semana apareció en Hacker News Loom, un proyecto open-source de valkor-ai que intenta cubrir exactamente esa capa.
La propuesta es sencilla de enunciar: un delivery harness, es decir, un arnés de entrega que envuelve al agente de codificación y se encarga de todo lo que ocurre antes y después de que el modelo actúe. Según el repositorio, Loom no está acoplado a ningún proveedor específico, lo que en la práctica significa que puede utilizarse tanto con Claude Code como con otras herramientas de agentes.
Qué hace exactamente
El concepto de harness no es nuevo en ingeniería de software — se usa desde hace décadas en testing — pero aplicarlo a agentes de código tiene sentido propio. Loom define una capa que gestiona:
- La entrega de tareas: cómo se especifica qué debe hacer el agente, en qué repositorio y con qué restricciones.
- El ciclo de vida de la ejecución: arranque, monitorización y recogida de artefactos (diffs, logs, tests).
- El aislamiento: cada tarea corre en su propio entorno, evitando que los efectos secundarios de un agente contaminen el siguiente.
Por qué importa este enfoque
La tendencia dominante en el último año ha sido añadir capacidades al modelo — ventanas de contexto más amplias, mejor razonamiento, integración con MCP servers más complejos. Loom apunta en otra dirección: mejorar la infraestructura de entrega sin tocar el modelo.
Esto tiene implicaciones prácticas para equipos que ya ejecutan agentes de forma semi-automática. Cuando un agente de código falla a mitad de una tarea, la pregunta habitual es: ¿falló el modelo, falló el entorno, o falló la forma en que se entregó la tarea? Un harness estandarizado hace esa pregunta más fácil de responder porque separa cada responsabilidad.
También es relevante para quienes construyen pipelines de CI/CD aumentados con agentes. En lugar de incrustar la lógica de orquestación dentro del propio prompt o de scripts ad hoc, Loom ofrece una estructura reutilizable.
Para quién es útil ahora mismo
El proyecto tiene aún pocos puntos en HN y ningún comentario en el momento de publicación de esta pieza, lo que sugiere que está en fase muy temprana. El código en el repositorio es funcional pero la documentación es escueta. Dicho esto, el público natural es claro:
- Equipos de ingeniería que ya usan Claude Code o agentes equivalentes en flujos de trabajo reales y necesitan reproducibilidad.
- Investigadores de evaluación (evals) que quieren ejecutar el mismo agente sobre múltiples tareas de forma controlada.
- Integradores de MCP que construyen servidores o plugins y necesitan probarlos contra agentes reales sin montar infraestructura desde cero cada vez.
Una pieza del puzzle, no el puzzle completo
Es tentador leer proyectos como este como una solución integral a la complejidad de los agentes. No lo es, ni lo pretende. Loom no resuelve la alineación del agente, no mejora la calidad de los diffs que produce el modelo, ni sustituye una buena estrategia de prompting. Lo que sí hace — si cumple su promesa — es reducir el ruido de infraestructura para que los problemas que queden sean los que realmente importan.
La discusión en Hacker News está aún por arrancar, lo que hace difícil calibrar la recepción de la comunidad. Seguiremos el proyecto.
---
Desde ElephantPink vemos con buenos ojos que aparezcan capas de infraestructura agnósticas al modelo; la fragmentación actual de tooling para agentes hace que cada equipo reinvente el mismo arnés. Si Loom gana tracción y documenta bien sus interfaces, puede convertirse en una pieza de referencia — aunque el camino desde "Show HN" hasta herramienta consolidada es largo.
Fuentes
Seguir leyendo
COOCON entra en AAIF para conectar pagos y MCP en agentes IA
La fintech coreana COOCON se une a la fundación global AAIF con el objetivo de integrar pagos y negocio de datos basado en MCP dentro del ecosistema de agentes IA.
Webull lanza un servidor MCP para trading con IA
El bróker Webull integra el Model Context Protocol de Anthropic para que agentes de IA accedan a datos de mercado en tiempo real desde sus flujos de trabajo.
Vera: auditoría de smart contracts con IA, sin intermediarios
Vera es una herramienta open-source que permite auditar smart contracts usando IA de forma autónoma, sin depender de firmas de auditoría externas ni procesos de revisión manuales.