Arnold Moya
Newsletter
February 27, 2026
Elimina tus archivos de contexto
¿Pasas horas perfeccionando tu CLAUDE.md para que tus agentes de IA trabajen mejor? Un nuevo estudio acaba de demostrar que probablemente estás perdiendo el tiempo — y encima pagando más.
🗑️ Elimina tus archivos de contexto
¿Qué rayos es un CLAUDE.md o un AGENTS.md?
Cuando usas un agente de IA para programar (como Claude Code, Codex o similares), puedes meterle un archivo especial en tu repositorio con instrucciones: cómo está estructurado el proyecto, qué convenciones seguir, cómo correr los tests, etc.
Claude Code lo llama CLAUDE.md. OpenAI Codex usa AGENTS.md. La idea suena genial: le das contexto al agente para que trabaje como si fuera un desarrollador senior que ya conoce tu codebase.
Los grandes proveedores de IA llevan tiempo recomendando que los uses. Mucha gente los cuida como si fueran documentación sagrada.
📄 El experimento que nadie quería ver
Un grupo de investigadores se preguntó lo obvio: ¿pero realmente sirven?
Crearon AGENTbench, un benchmark con 138 tareas reales de 12 repositorios Python que ya tenían archivos de contexto escritos por sus propios desarrolladores. Luego probaron los agentes en tres condiciones:
- Sin archivo de contexto
- Con archivo generado por un LLM
- Con archivo escrito por humanos (los devs reales del repo)

💸 Los resultados duelen
- Los archivos generados por IA reducen el éxito de las tareas en un –3% y aumentan el costo de inferencia en más de un 20%
- Los archivos escritos por humanos mejoran el rendimiento apenas un +4% — con mayor costo también
- En ningún caso los archivos ayudaron a los agentes a encontrar los archivos relevantes más rápido

🤔 ¿Por qué fallan?
Aquí está la parte contraintuitiva: el problema no es que los agentes ignoren las instrucciones. Es que las siguen demasiado bien.
Cuando el archivo dice "corre los tests", "sigue esta convención", "revisa esta carpeta primero"... el agente añade pasos extra, explora más de lo necesario y se complica solo. Más requisitos = tareas más difíciles de completar.
Los archivos generados por LLMs son aún peores porque básicamente repiten lo que ya está en el README o en la documentación — puro ruido.

✂️ La conclusión de los investigadores
"Los requisitos innecesarios de los archivos de contexto hacen las tareas más difíciles, no más fáciles."
Su recomendación: si vas a tener un CLAUDE.md o AGENTS.md, que sea mínimo y esencial. Solo lo que el agente no puede inferir por sí mismo. Nada de documentación de relleno.
Irónicamente, los propios proveedores de IA (Anthropic, OpenAI) han estado empujando estos archivos como buenas prácticas. Este estudio dice que, al menos por ahora, son más placebo que solución.