Elimina tus archivos de contexto

🗑️ Elimina tus archivos de contexto

¿Qué rayos es un CLAUDE.md o un AGENTS.md?

Cuando usas un agente de IA para programar (como Claude Code, Codex o similares), puedes meterle un archivo especial en tu repositorio con instrucciones: cómo está estructurado el proyecto, qué convenciones seguir, cómo correr los tests, etc.

Claude Code lo llama CLAUDE.md. OpenAI Codex usa AGENTS.md. La idea suena genial: le das contexto al agente para que trabaje como si fuera un desarrollador senior que ya conoce tu codebase.

Los grandes proveedores de IA llevan tiempo recomendando que los uses. Mucha gente los cuida como si fueran documentación sagrada.

📄 El experimento que nadie quería ver

Un grupo de investigadores se preguntó lo obvio: ¿pero realmente sirven?

Crearon AGENTbench, un benchmark con 138 tareas reales de 12 repositorios Python que ya tenían archivos de contexto escritos por sus propios desarrolladores. Luego probaron los agentes en tres condiciones:

Sin archivo de contexto
Con archivo generado por un LLM
Con archivo escrito por humanos (los devs reales del repo)

Comparación de rendimiento entre agentes con y sin archivos de contexto

💸 Los resultados duelen

Los archivos generados por IA reducen el éxito de las tareas en un –3% y aumentan el costo de inferencia en más de un 20%
Los archivos escritos por humanos mejoran el rendimiento apenas un +4% — con mayor costo también
En ningún caso los archivos ayudaron a los agentes a encontrar los archivos relevantes más rápido

Análisis del comportamiento del agente con y sin contexto

🤔 ¿Por qué fallan?

Aquí está la parte contraintuitiva: el problema no es que los agentes ignoren las instrucciones. Es que las siguen demasiado bien.

Cuando el archivo dice "corre los tests", "sigue esta convención", "revisa esta carpeta primero"... el agente añade pasos extra, explora más de lo necesario y se complica solo. Más requisitos = tareas más difíciles de completar.

Los archivos generados por LLMs son aún peores porque básicamente repiten lo que ya está en el README o en la documentación — puro ruido.

Ejemplos de instrucciones en archivos de contexto y su impacto

✂️ La conclusión de los investigadores

"Los requisitos innecesarios de los archivos de contexto hacen las tareas más difíciles, no más fáciles."

Su recomendación: si vas a tener un CLAUDE.md o AGENTS.md, que sea mínimo y esencial. Solo lo que el agente no puede inferir por sí mismo. Nada de documentación de relleno.

Irónicamente, los propios proveedores de IA (Anthropic, OpenAI) han estado empujando estos archivos como buenas prácticas. Este estudio dice que, al menos por ahora, son más placebo que solución.

🔗 Lee el paper completo