Personas de clickstream para agentes de compra con IA

Un agente de compra que no sabe quién es el usuario acaba recomendando lo mismo a todo el mundo. Es un problema conocido en ecommerce: los LLMs son capaces de razonar sobre catálogos y comparar productos, pero el momento en que se les pide que actúen como asistentes de compra personalizados, se quedan planos. No tienen contexto sobre los gustos, hábitos ni intención real de cada persona.

El paper publicado el 17 de mayo de 2026 en arXiv ataca ese problema de frente: en lugar de enriquecer el prompt con preferencias declaradas o valoraciones explícitas —que son caras de obtener y difíciles de escalar—, los autores proponen aprender personas directamente a partir de datos brutos de clickstream.

Qué propone el paper

La idea central es construir representaciones de usuario, lo que en el paper llaman personas, a partir de secuencias de clics, tiempo en página, scroll, navegación entre categorías y comportamientos similares que cualquier plataforma de ecommerce ya registra. Esos perfiles se usan después para condicionar al agente de compra: en lugar de que el LLM reciba solo la consulta («busco zapatillas para correr»), recibe también un perfil sintético derivado del historial de comportamiento del usuario.

El enfoque evita el etiquetado manual, que es el cuello de botella habitual en sistemas de recomendación supervisados. El modelo aprende qué patrones de navegación corresponden a qué tipo de comprador sin necesidad de que nadie clasifique los datos a mano.

Los autores evalúan el sistema en escenarios de conversación de compra y miden en qué medida las recomendaciones del agente se alinean mejor con la intención real del usuario cuando está anclado en la persona aprendida. Los resultados que reportan apuntan a mejoras consistentes frente a agentes sin ese contexto.

Por qué tiene sentido técnico ahora

Este tipo de propuesta no habría sido práctica hace tres años. Hay dos condiciones que la hacen viable en 2026:

Primero, las ventanas de contexto largas —Claude Opus 4.7 trabaja con hasta 1 millón de tokens— permiten incluir perfiles de usuario relativamente ricos sin sacrificar el resto del contexto de la tarea. Un perfil sintético detallado ya no es un lujo que el prompt no puede permitirse.

Segundo, la arquitectura de agentes con herramientas externas ha madurado. Con protocolos como MCP es posible que un agente de compra consulte en tiempo real un servicio que devuelva la persona actualizada del usuario antes de ejecutar cada acción. El grounding no tiene por qué ser estático ni estar hardcodeado en el sistema prompt.

Para quién es relevante

Este paper interesa principalmente a tres perfiles:

Equipos de producto en ecommerce que estén construyendo o evaluando agentes de compra conversacionales y necesitan una estrategia de personalización que no dependa de formularios ni encuestas.
Ingenieros de ML que trabajan en sistemas de recomendación y quieren explorar cómo integrar señales de comportamiento con razonamiento en lenguaje natural.
Desarrolladores de agentes que usan Claude Code o frameworks similares y buscan patrones concretos para inyectar contexto de usuario de forma estructurada.

La propuesta es especialmente útil en plataformas donde los usuarios raramente dejan valoraciones escritas pero sí generan grandes volúmenes de datos de navegación: retailers de moda, electrónica, alimentación o marketplaces generalistas.

Lo que queda abierto

El paper no aborda en profundidad los riesgos de privacidad asociados a construir perfiles a partir de clickstream. Es una omisión notable, porque en Europa el tratamiento de ese tipo de datos está regulado de forma estricta y la línea entre «comportamiento agregado» y «perfil individual identificable» puede ser fina. Cualquier implementación real necesitaría una capa de evaluación legal antes de producción.

Tampoco queda del todo claro cómo se comporta el sistema cuando el historial de un usuario es escaso —usuarios nuevos o con pocos registros— ni cómo de sensibles son los resultados a la calidad de los datos de clickstream, que en plataformas reales suelen estar llenos de ruido.

---

Desde EP, la dirección técnica del paper nos parece sólida: usar señales de comportamiento ya disponibles para mejorar el contexto de un agente es más pragmático que depender de datos explícitos que los usuarios raramente proporcionan. La brecha que falta cubrir está en la parte de privacidad y robustez, que en un entorno de producción no es opcional.

Personas de clickstream para agentes de compra con IA

Qué propone el paper

Por qué tiene sentido técnico ahora

Para quién es relevante

Lo que queda abierto

Fuentes

Seguir leyendo

AINTMA: seis agentes de IA para automatizar la gestión de pruebas de software

Los watermarks de LLMs degradan la calidad de textos médicos, según un estudio

SysAdmin, el test que mide si un modelo busca más poder