Getting Started - SWE-agent documentation
Resumen
Resumen Principal
SWE-agent es una herramienta de vanguardia que dota a modelos de lenguaje avanzados, como GPT-4o o Claude Sonnet 3.7, con la capacidad de operar de forma autónoma en repositorios reales de GitHub. Su funcionalidad principal se centra en la resolución de problemas, la identificación proactiva de vulnerabilidades de ciberseguridad y la ejecución de tareas personalizadas. Este sistema ha logrado consistentemente el estatus de State of the Art (SoTA) en el riguroso benchmark SWE-bench, destacándose entre proyectos de código abierto y logrando éxitos con múltiples configuraciones y versiones, incluyendo SWE-agent 1.0 y SWE-agent-LM-32b. Diseñado para ofrecer una máxima agencia al modelo de lenguaje, SWE-agent es intrínsecamente fluido y generalizable, permitiendo una amplia gama de aplicaciones. Es además altamente configurable a través de un único archivo YAML y está completamente documentado, lo que facilita su implementación y adaptación. Desarrollado por investigadores de la Universidad de Princeton y Stanford, su arquitectura es intencionadamente simple y modificable, lo que lo posiciona como una herramienta ideal para la investigación y el desarrollo continuo en la automatización inteligente de software.
Elementos Clave
- Capacidad Autónoma y Aplicaciones Reales: SWE-agent empodera a los modelos de lenguaje para interactuar autónomamente con repositorios reales de GitHub. Esto se traduce en la habilidad de solucionar problemas de código, detectar vulnerabilidades de seguridad y ejecutar tareas personalizadas, lo que lo hace una herramienta práctica y de alto impacto en el ciclo de vida del desarrollo de software.
- Rendimiento Líder en Benchmarks: La herramienta ha demostrado ser State of the Art (SoTA) en el benchmark SWE-bench. Esta validación se ha logrado de manera consistente en diversas categorías, como en proyectos de código abierto y con configuraciones específicas (ej. SWE-agent 1.0 con Claude 3.7), y su versión SWE-agent-LM-32b, consolidando su posición como una solución de alto rendimiento en la automatización de tareas de ingeniería de software.
- Diseño Modular y Orientado a la Investigación: SWE-agent está concebido para ser fluido y generalizable, otorgando una gran agencia al modelo de lenguaje subyacente
Contenido
SWE-agent enables your language model of choice (e.g. GPT-4o or Claude Sonnet 3.7) to autonomously use tools to fix issues in real GitHub repositories, find cybersecurity vulnerabilities, or perform any custom task.
- ✅ State of the art on SWE-bench among open-source projects
- ✅ Free-flowing & generalizable: Leaves maximal agency to the LM
- ✅ Configurable & fully documented: Governed by a single
yamlfile - ✅ Made for research: Simple & hackable by design
SWE-agent is built and maintained by researchers from Princeton University and Stanford University.
-
Installation
Installing SWE-agent.
-
Hello world
Solve a GitHub issue with SWE-agent.
-
User guides
Dive deeper into SWE-agent's features and goals.
-
Background & goals
Learn more about the project goals and academic research.
📣 News
- May 2: SWE-agent-LM-32b achieves open-weights SOTA on SWE-bench
- Feb 28: SWE-agent 1.0 + Claude 3.7 is SoTA on SWE-Bench full
- Feb 25: SWE-agent 1.0 + Claude 3.7 is SoTA on SWE-bench verified
- Feb 13: Releasing SWE-agent 1.0: SoTA on SWE-bench light & tons of new features
- Dec 7: An interview with the SWE-agent & SWE-bench team