How Long Contexts Fail Complete
Taking care of your context is the key to building successful agents. Just because there’s a 1 million token context window doesn’t mean you should fill it.
Extended Summary
Resumen Principal
El artículo desafía la creencia popular de que las ventanas de contexto cada vez más grandes en los modelos de lenguaje de vanguardia, que ahora pueden manejar hasta 1 millón de tokens, son la clave para desarrollar agentes de IA avanzados. Contrario a las expectativas, simplemente "lanzar todo" a un prompt no garantiza mejores resultados; de hecho, la sobrecarga de contexto puede provocar fallos inesperados en agentes y aplicaciones. El texto identifica tres problemas principales: el Envenenamiento del Contexto (Context Poisoning), donde errores o alucinaciones se incrustan y repiten, llevando a metas imposibles; la Distracción del Contexto (Context Distraction), donde un contexto extenso hace que el modelo se fije en repetir acciones pasadas en lugar de generar estrategias novedosas; y la Confusión del Contexto (Context Confusion), donde la información superflua, como un exceso de definiciones de herramientas, disminuye la calidad de la respuesta y fomenta el uso irrelevante de funciones. Esto subraya que la gestión estratégica del contexto es fundamental, más allá de su mera capacidad.
Elementos Clave
- Grandes Ventanas de Contexto y Rendimiento: La creencia de que ventanas de contexto de hasta 1 millón de tokens desbloquearán agentes de ensueño ha generado entusiasmo, pero el análisis revela que no producen necesariamente mejores respuestas. En cambio, la sobrecarga puede llevar a fallos, contrarrestar el entusiasmo por el RAG (Generación Aumentada por Recuperación) y complicar el desarrollo de Plataformas Masivamente Conectadas (MCPs).
- Envenenamiento del Contexto (Context Poisoning): Este problema ocurre cuando una alucinación o error se introduce en el contexto y es referenciado repetidamente. El informe técnico de Gemini 2.5 de DeepMind lo destacó en su agente de Pokémon, donde el "envenenamiento" de las secciones de objetivos con información errónea hacía que el modelo desarrollara estrategias sin sentido y persiguiera metas in