Un equipo de Hugging Face, dirigido por Thomas Wolf, ha creado con éxito una versión de código abierto del sistema Deep Research de OpenAI en 24 horas. Su objetivo es democratizar el acceso a esta tecnología replicando el marco del agente. Al diseñar su sistema para escribir código de programa en lugar de utilizar JSON, Hugging Face ha conseguido reducir los pasos de procesamiento en aproximadamente un 30%, mejorando tanto el coste como el rendimiento con respecto a los modelos tradicionales.

La implementación utiliza componentes del marco Magentic-One de Microsofts, incorporando un navegador web basado en texto y un inspector de texto para varios formatos de archivo. En la evaluación comparativa GAIA, el sistema de Hugging Face obtuvo una puntuación del 55,15%, superando a Magentic-One, pero por debajo del 67% de OpenAI. El equipo reconoce que son necesarias más mejoras, sobre todo en las interacciones con el navegador. Una diferencia crucial radica en el uso de modelos de código abierto en comparación con el modelo patentado o3 de OpenAI, entrenado específicamente para tareas web.
A pesar de las dificultades, los avances de Hugging Face sugieren una reducción de la brecha entre las soluciones de IA de código abierto y las propietarias, lo que plantea interrogantes sobre la sostenibilidad empresarial de los modelos propietarios. El equipo aspira a crear agentes GUI para interactuar directamente con interfaces informáticas y ha hecho público su código en GitHub, al tiempo que planea estudiar los proyectos de código abierto de otros desarrolladores.