Noticias
IA, al ritmo de la redacción.
Tres grandes benchmarks inflan las puntuaciones de agentes de código, descubre auditoría
RESEARCH
El Entrenamiento de AutoMem Duplica el Desempeño del Agente en Tareas de Largo Horizonte
RESEARCH
BrowserBC Eleva la Tasa de Éxito de Agentes de Navegador al 81% Utilizando Trazas Humanas
RESEARCH
Las Explicaciones de Modelos de Lenguaje Rastrean Cambios de Comportamiento Automáticamente
RESEARCH
Los Baselines de Prompting Simple Superan los Métodos de Supervisión Compleja
RESEARCH
Una Capa Coincide con el Entrenamiento Completo de RL en Modelos Qwen
RESEARCH
ChatGPT cruza 1 mil millones de usuarios mensuales activos, el hito de aplicativo de consumidor más rápido en la historia
RESEARCH
TRIAGE Reduce Acciones de Agentes 14.8% Mientras Aumenta Tasas de Éxito
RESEARCH
Investigadores Cierran la Brecha entre Agentes de IA y Habilidades Curadas Manualmente