Notícias
A IA, em ritmo de redação.
Três grandes benchmarks inflacionam escores de agentes de código, auditoria descobre
RESEARCH
Treinamento do AutoMem Duplica Desempenho de Agentes em Tarefas de Longo Horizonte
RESEARCH
BrowserBC Eleva Taxa de Sucesso de Agentes de Navegador para 81% Usando Rastreamentos Humanos
RESEARCH
Explicações de Modelos de Linguagem Rastreiam Mudanças de Comportamento Automaticamente
RESEARCH
Baselines de Prompting Simples Superam Métodos de Supervisão Complexa
RESEARCH
Uma Camada Equivale ao Treinamento Completo com RL em Modelos Qwen
RESEARCH
ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história
RESEARCH
TRIAGE Reduz Ações de Agentes em 14.8% Enquanto Aumenta Taxas de Sucesso
RESEARCH
Pesquisadores Fecham Lacuna Entre Agentes de IA e Habilidades Curadas Manualmente