GitHub recorta el consumo de tokens para abaratar el uso de IA en Copilot

El coste de usar IA en el día a día de desarrollo no para de crecer, y GitHub lleva meses recibiendo presión de equipos que ven sus facturas de Copilot dispararse con cada sesión de agente o cada llamada a un servidor MCP. Según recoge i-programmer.info, publicado el 4 de junio de 2026, GitHub ha anunciado cambios concretos para reducir el consumo de tokens por sesión y aliviar así la presión económica sobre desarrolladores y organizaciones.

La noticia llega en un momento en que los flujos de trabajo con agentes —que encadenan múltiples llamadas al modelo, recuperan contexto de repositorios y consultan herramientas externas vía MCP— pueden multiplicar por cinco o por diez el gasto en tokens respecto a una simple autocompletación.

Qué ha cambiado exactamente

Aunque el anuncio oficial de GitHub no detalla públicamente todos los cambios internos, las optimizaciones reportadas apuntan a varias líneas de trabajo:

Compresión y truncado inteligente del contexto: en lugar de enviar el historial completo de conversación o la totalidad de un fichero al modelo, Copilot filtra y resume fragmentos menos relevantes antes de construir el prompt.
Caché de respuestas parciales: resultados de herramientas o fragmentos de código que no han cambiado entre llamadas consecutivas se reutilizan sin volver a consumir tokens.
Reducción del contexto de sistema: los prompts de sistema que definen el comportamiento del agente se han revisado para eliminar redundancias, algo que en sesiones largas tiene un impacto acumulado nada despreciable.

Estas medidas no alteran el modelo subyacente ni las capacidades visibles para el usuario, pero sí la cantidad de tokens que se facturan por cada interacción.

Por qué importa ahora

El problema de fondo no es exclusivo de GitHub. Cualquier plataforma que exponga agentes sobre modelos de lenguaje —Claude Code, Cursor, Continue o los propios pipelines internos de muchos equipos— lidia con la misma ecuación: más contexto significa respuestas más precisas, pero también facturas más altas.

La adopción de MCP ha acelerado este problema. Cuando un agente puede llamar a servidores MCP para consultar bases de datos, leer documentación o ejecutar búsquedas, el contexto que se acumula en cada turno de conversación crece de forma exponencial. Equipos que usan flujos con tres o cuatro servidores MCP encadenados reportan sesiones de trabajo que consumen fácilmente cientos de miles de tokens en una sola tarde.

Para las organizaciones con planes de empresa, esto se traduce en partidas presupuestarias difíciles de estimar y aún más difíciles de justificar ante dirección. La optimización que está implementando GitHub apunta directamente a ese dolor.

Para quién tiene impacto real

Las mejoras son especialmente relevantes para tres perfiles:

1. Equipos medianos y grandes que usan Copilot con agentes activados y tienen varios desarrolladores trabajando simultáneamente. El ahorro por sesión individual puede parecer modesto, pero escala.
2. Desarrolladores que trabajan con repositorios grandes: el contexto de un monorepo con miles de ficheros es uno de los principales culpables del consumo disparado. La compresión inteligente les beneficia de forma directa.
3. Organizaciones que han integrado servidores MCP propios dentro de sus flujos de Copilot: cada llamada a herramienta externa incluye su propia carga de contexto, y reducirla sin perder precisión es el reto técnico más delicado.

Para el desarrollador individual con un plan estándar el impacto es menor, porque los planes de tarifa plana absorben el coste de tokens de forma opaca. El ahorro real se percibe en los planes de pago por uso y en las integraciones API.

La dirección que toman las herramientas

El movimiento de GitHub no es aislado. En los últimos meses hemos visto a varios proveedores de herramientas sobre LLMs —desde IDEs hasta plataformas de CI/CD con IA— añadir capas de gestión de contexto que antes dejaban enteramente al modelo. La tendencia apunta a que la eficiencia en el uso de tokens se convertirá en una métrica de producto tan importante como la precisión de las sugerencias.

Desde la perspectiva de ElephantPink, es una señal positiva que las herramientas empiecen a responsabilizarse de la gestión del contexto en lugar de delegar ese problema al usuario o al administrador del sistema. Que lo haga GitHub, con la base de usuarios que tiene, debería acelerar que otros actores del ecosistema sigan el mismo camino.

GitHub recorta el consumo de tokens para abaratar el uso de IA en Copilot

Qué ha cambiado exactamente

Por qué importa ahora

Para quién tiene impacto real

La dirección que toman las herramientas

Fuentes

Seguir leyendo

MCP se consolida como estándar para construir agentes

AI Toolbox presume de soportar un modelo de Claude fuera de catálogo

Un clic en el navegador, contexto para cualquier agente