BOHM: atribución jerárquica sin coste en sistemas de agentes IA
Un nuevo método publicado en arXiv extrae atribución de componentes en sistemas IA compuestos usando solo pesos de enrutamiento, sin evaluar subconjuntos ni acceder a APIs cerradas.
Cuando construyes un sistema de agentes con Claude Code —varios subagentes, MCP servers y herramientas encadenadas— y algo sale mal, la primera pregunta es: ¿qué componente ha fallado? SHAP, el método estándar de atribución basado en la teoría de Shapley, responde esa pregunta evaluando el sistema con miles de combinaciones de componentes. El problema es que muchas de esas combinaciones son literalmente imposibles de evaluar: APIs de terceros que no puedes modificar, orquestadores opacos, endpoints sin acceso interno. En ese escenario, SHAP no funciona.
Este lunes se publicó en arXiv BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems, un método que resuelve exactamente ese bloqueo de una forma bastante directa: en lugar de evaluar coaliciones de componentes, extrae la atribución directamente de los pesos de enrutamiento que el sistema ya mantiene por su propia arquitectura.
Qué hace BOHM y cómo funciona
La intuición central de BOHM es que un orquestador jerárquico —el tipo de sistema que construyes cuando encadenas subagentes o skills en Claude Code— ya codifica implícitamente cuánto confía en cada rama de su árbol de decisión. Esos pesos de enrutamiento son los que determinan qué herramienta o subagente recibe cada tarea.
BOHM los convierte en atribución formal de dos maneras:
- Atribución de hoja: producto de los pesos en el camino desde la raíz hasta ese componente. Si el enrutador pasa el 80% del tráfico a un subagente y este lo reenvía al 60% a una herramienta concreta, esa herramienta recibe una atribución de 0,48.
- Atribución de nivel k: distribución inducida sobre todos los nodos a esa profundidad. Esto permite ver el sistema a distintas resoluciones simultáneamente, algo que los métodos planos como SHAP no pueden ofrecer sin costes de evaluación adicionales.
Por qué importa para quienes trabajan con Claude
En mayo de 2026, los sistemas de agentes con Claude ya no son experimentos. Es habitual ver orquestadores con tres o cuatro niveles de subagentes, skills especializados y MCP servers conectados a servicios externos —bases de datos, APIs de negocio, herramientas de código. Cualquier equipo que opere este tipo de arquitecturas en producción tiene el mismo problema de depuración: cuando el output es incorrecto o el coste de tokens se dispara, ¿en qué rama del árbol está el origen?
Hasta ahora, las opciones eran instrumentar manualmente cada componente o confiar en logs de bajo nivel. BOHM ofrece una alternativa estructurada que no requiere modificar los componentes: basta con capturar los pesos de enrutamiento que el orquestador ya genera. En Claude Code, donde los hooks de ciclo de vida —`PreToolUse`, `PostToolUse`— ya exponen información sobre qué herramienta se invoca y con qué peso relativo, integrar algo similar a BOHM es técnicamente alcanzable sin tocar la lógica de los subagentes.
Los límites del método
Los propios autores son explícitos en que BOHM y SHAP responden preguntas distintas. SHAP mide la contribución causal de cada componente aislando su efecto; BOHM mide cuánto confía el enrutador en cada rama. Ambas convergen cuando el enrutador es casi óptimo —es decir, cuando enruta bien las tareas a los componentes más capaces— pero pueden divergir en sistemas mal calibrados.
En sus experimentos, los autores probaron 18 LLMs en una jerarquía de tres niveles sobre 880 problemas de LiveCodeBench. Los resultados de correlación de rangos (Kendall) favorecen a BOHM en condiciones de enrutamiento concentrado, que es precisamente el caso más habitual en producción: un orquestador que canaliza la mayor parte del tráfico a dos o tres herramientas principales.
La pregunta práctica que deja abierta el paper es cómo se comporta cuando el enrutamiento es aprendido de forma implícita —como en sistemas donde Claude decide qué herramienta invocar sin una capa de routing explícita con pesos accesibles. Ese es el caso más frecuente hoy con Claude Code en su configuración por defecto.
---
Desde EP, lo que nos parece relevante no es que BOHM sea la solución definitiva a la interpretabilidad de agentes, sino que plantea un camino de coste cero que encaja bien con la realidad de los sistemas en producción: opacos, encadenados y con componentes que no controlas. Vale la pena seguirlo cuando aparezca código de referencia.
Fuentes
Seguir leyendo
LLMs generalistas superan a la IA clínica especializada en benchmarks médicos
Un estudio publicado en Nature Medicine muestra que los modelos de lenguaje de propósito general obtienen mejores resultados que sistemas clínicos especializados en evaluaciones médicas estandarizadas.
ToolSense: cómo auditar lo que un LLM sabe sobre sus herramientas
Un nuevo framework de diagnóstico publicado en arXiv revela que los modelos que recuperan herramientas parametricamente pueden obtener buenas métricas sin entender realmente qué hace cada tool.
Business World Model: cuando los agentes AI aprenden a razonar sobre empresas
Un paper de arXiv propone una arquitectura formal para que los agentes AI no solo ejecuten tareas, sino que modelen el estado y la dinámica de un negocio completo antes de actuar.