El substrato como cuerpo del agente: repensar la arquitectura AI
Un artículo técnico desafía el patrón dominante en papers de agentes AI: un LLM central más vector store. La propuesta invierte la lógica poniendo el substrato como núcleo.
La mayor parte de los papers académicos sobre agentes AI publicados en los últimos dos años comparten una misma receta estructural: un modelo de lenguaje central que coordina, y un almacén vectorial que hace de memoria. Es una arquitectura que funciona, que tiene precedentes claros y que es relativamente fácil de implementar sobre cualquier stack moderno. Pero su omnipresencia también ha empezado a parecerse más a inercia que a decisión razonada.
Eso es, en esencia, lo que plantea "Substrate is the Body", un artículo publicado a mediados de mayo por sbarron que generó conversación en Hacker News. La tesis central: si seguimos tratando el LLM como el «cerebro» del agente y el almacenamiento como un apéndice, estamos construyendo sistemas que imitan la metáfora equivocada.
La metáfora que condiciona el diseño
El argumento arranca desde un sitio filosófico antes que técnico. El autor sostiene que la forma en que conceptualizamos un agente —como entidad con un «centro pensante» rodeado de herramientas— determina las decisiones de arquitectura mucho antes de que abramos un editor de código. Si el LLM es el cuerpo y el substrato (almacenamiento, estado, entorno persistente) es el escenario, el agente acaba siendo fundamentalmente apátrida: existe en el momento de la inferencia y luego desaparece.
La inversión que propone es tratar el substrato como el cuerpo del agente: la entidad que persiste, que acumula estado, que tiene continuidad. El LLM pasa a ser algo más parecido a un órgano sensorial o motor, invocado puntualmente para procesar o actuar, pero no el locus de identidad del sistema. Es una distinción que, llevada a la práctica, cambia bastante cosas: dónde vive el estado, cómo se gestiona la memoria a largo plazo, cómo se modela la identidad del agente entre sesiones.
Por qué importa más allá del paper
Esta discusión no es puramente académica. En el ecosistema Claude, por ejemplo, la arquitectura habitual de un agente construido con Claude Code implica un modelo —Opus 4.7, Sonnet 4.6 o Haiku 4.5 según el caso de uso— que coordina subagentes, llama MCP servers y escribe o lee estado en herramientas externas. El substrato —bases de datos, sistemas de ficheros, APIs con estado— existe, pero queda fuera del diseño conceptual del agente. Es infraestructura, no identidad.
Si se acepta la premisa de sbarron, ese diseño tiene un coste: cada vez que el contexto se reinicia, el agente «muere» y renace sin continuidad real, aunque técnicamente se le inyecte memoria recuperada de un vector store. La diferencia entre recuperar recuerdos e haber tenido esa experiencia no es trivial cuando se diseñan agentes que deben mantener relaciones de trabajo estables con humanos o con otros sistemas a lo largo del tiempo.
Para equipos que construyen agentes a medida —el tipo de trabajo que hacemos desde ElephantPink con integraciones Claude— el artículo sirve de recordatorio útil: la decisión de dónde poner el estado no es solo una decisión de ingeniería de datos. Es una decisión de diseño de agente.
Las limitaciones del argumento
El artículo no es un paper con evaluaciones empíricas ni benchmarks. Es un ensayo de posicionamiento, y conviene leerlo como tal. La discusión en Hacker News fue breve —pocos comentarios en el momento de su publicación—, lo que sugiere que o bien la tesis es suficientemente obvia para quienes ya piensan en estos términos, o bien todavía no ha llegado a la audiencia que más podría beneficiarse de ella: equipos de producto que toman decisiones de arquitectura sin pasar por la literatura académica.
Tampoco hay una propuesta de implementación concreta. El autor no especifica qué tecnologías encarnan mejor esta idea de substrato-como-cuerpo, ni cómo se reconcilia con los patrones actuales de orquestación de agentes. Eso deja el trabajo más difícil —la traducción a sistemas reales— en manos del lector.
Opinión EP
El ensayo es más valioso como herramienta de pensamiento que como guía técnica, y está bien así. La industria necesita con cierta periodicidad que alguien se tome el tiempo de cuestionar los patrones que se han vuelto invisible por su frecuencia, y este artículo cumple esa función con economía de palabras.
Fuentes
Seguir leyendo
LLMs generalistas superan a la IA clínica especializada en benchmarks médicos
Un estudio publicado en Nature Medicine muestra que los modelos de lenguaje de propósito general obtienen mejores resultados que sistemas clínicos especializados en evaluaciones médicas estandarizadas.
ToolSense: cómo auditar lo que un LLM sabe sobre sus herramientas
Un nuevo framework de diagnóstico publicado en arXiv revela que los modelos que recuperan herramientas parametricamente pueden obtener buenas métricas sin entender realmente qué hace cada tool.
Business World Model: cuando los agentes AI aprenden a razonar sobre empresas
Un paper de arXiv propone una arquitectura formal para que los agentes AI no solo ejecuten tareas, sino que modelen el estado y la dinámica de un negocio completo antes de actuar.