BOHM: atribución jerárquica sin coste en sistemas de agentes IA

Cuando construyes un sistema de agentes con Claude Code —varios subagentes, MCP servers y herramientas encadenadas— y algo sale mal, la primera pregunta es: ¿qué componente ha fallado? SHAP, el método estándar de atribución basado en la teoría de Shapley, responde esa pregunta evaluando el sistema con miles de combinaciones de componentes. El problema es que muchas de esas combinaciones son literalmente imposibles de evaluar: APIs de terceros que no puedes modificar, orquestadores opacos, endpoints sin acceso interno. En ese escenario, SHAP no funciona.

Este lunes se publicó en arXiv BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems, un método que resuelve exactamente ese bloqueo de una forma bastante directa: en lugar de evaluar coaliciones de componentes, extrae la atribución directamente de los pesos de enrutamiento que el sistema ya mantiene por su propia arquitectura.

Qué hace BOHM y cómo funciona

La intuición central de BOHM es que un orquestador jerárquico —el tipo de sistema que construyes cuando encadenas subagentes o skills en Claude Code— ya codifica implícitamente cuánto confía en cada rama de su árbol de decisión. Esos pesos de enrutamiento son los que determinan qué herramienta o subagente recibe cada tarea.

BOHM los convierte en atribución formal de dos maneras:

Atribución de hoja: producto de los pesos en el camino desde la raíz hasta ese componente. Si el enrutador pasa el 80% del tráfico a un subagente y este lo reenvía al 60% a una herramienta concreta, esa herramienta recibe una atribución de 0,48.
Atribución de nivel k: distribución inducida sobre todos los nodos a esa profundidad. Esto permite ver el sistema a distintas resoluciones simultáneamente, algo que los métodos planos como SHAP no pueden ofrecer sin costes de evaluación adicionales.

El resultado es coste marginal cero: no hay llamadas extra al sistema, no necesitas acceso a los internos de ningún componente, y funciona aunque la mitad de tu stack sean cajas negras.

Por qué importa para quienes trabajan con Claude

En mayo de 2026, los sistemas de agentes con Claude ya no son experimentos. Es habitual ver orquestadores con tres o cuatro niveles de subagentes, skills especializados y MCP servers conectados a servicios externos —bases de datos, APIs de negocio, herramientas de código. Cualquier equipo que opere este tipo de arquitecturas en producción tiene el mismo problema de depuración: cuando el output es incorrecto o el coste de tokens se dispara, ¿en qué rama del árbol está el origen?

Hasta ahora, las opciones eran instrumentar manualmente cada componente o confiar en logs de bajo nivel. BOHM ofrece una alternativa estructurada que no requiere modificar los componentes: basta con capturar los pesos de enrutamiento que el orquestador ya genera. En Claude Code, donde los hooks de ciclo de vida —`PreToolUse`, `PostToolUse`— ya exponen información sobre qué herramienta se invoca y con qué peso relativo, integrar algo similar a BOHM es técnicamente alcanzable sin tocar la lógica de los subagentes.

Los límites del método

Los propios autores son explícitos en que BOHM y SHAP responden preguntas distintas. SHAP mide la contribución causal de cada componente aislando su efecto; BOHM mide cuánto confía el enrutador en cada rama. Ambas convergen cuando el enrutador es casi óptimo —es decir, cuando enruta bien las tareas a los componentes más capaces— pero pueden divergir en sistemas mal calibrados.

En sus experimentos, los autores probaron 18 LLMs en una jerarquía de tres niveles sobre 880 problemas de LiveCodeBench. Los resultados de correlación de rangos (Kendall) favorecen a BOHM en condiciones de enrutamiento concentrado, que es precisamente el caso más habitual en producción: un orquestador que canaliza la mayor parte del tráfico a dos o tres herramientas principales.

La pregunta práctica que deja abierta el paper es cómo se comporta cuando el enrutamiento es aprendido de forma implícita —como en sistemas donde Claude decide qué herramienta invocar sin una capa de routing explícita con pesos accesibles. Ese es el caso más frecuente hoy con Claude Code en su configuración por defecto.

---

Desde EP, lo que nos parece relevante no es que BOHM sea la solución definitiva a la interpretabilidad de agentes, sino que plantea un camino de coste cero que encaja bien con la realidad de los sistemas en producción: opacos, encadenados y con componentes que no controlas. Vale la pena seguirlo cuando aparezca código de referencia.

BOHM: atribución jerárquica sin coste en sistemas de agentes IA

Qué hace BOHM y cómo funciona

Por qué importa para quienes trabajan con Claude

Los límites del método

Fuentes

Seguir leyendo

AINTMA: seis agentes de IA para automatizar la gestión de pruebas de software

Los watermarks de LLMs degradan la calidad de textos médicos, según un estudio

SysAdmin, el test que mide si un modelo busca más poder