§ BEAT
Pesquisa
Pesquisadores Fecham Lacuna Entre Agentes de IA e Habilidades Curadas Manualmente
Agentes de IA Dobram o Atrito de Merge em Nível de Repositório
Pipeline de Código Aberto Alcança 68% de Precisão na Extração de Redes Políticas de Notícias
Dataset OpenThoughts-Agent Atinge 44.8% em Benchmarks de Agentes
Modelo Moebius Chega ao Navegador via ONNX+WebGPU em Sessão de Agente Paralelo
Princeton Lança LOCUS, Corpus de Ordenações Locais dos EUA Legível por Máquina
Um único modelo pode hospedar centenas de personagens de agentes como máscaras leves
Interação de Componentes, Não Qualidade, Determina Desempenho do Agente
Agents-K1 Substitui Fatias de Texto RAG por Grafos de Conhecimento Científico Digitados
Sistema Tahoe Text-to-SQL Reduz Retroalimentação do Compilador em 96%
EEVEE Vence Agentes de Auto-Melhoria com Margem de 48% em Inferência Multi-Domínio
Compilador Piper Elimina a Codificação Manual para Treinamento Distribuído
FASE Reduz Detecção de Alucinações para 333x Velocidade
SIGA Acelera Agentes de Codificação em Simuladores Científicos por 36×
Formato de Saída Leva à Perda de Precisão Mais Rápida do que a Mudança de Domínio em LLM Multimodais
Conjunto de Dados GPIC Desbanca ImageNet-1K como Corpus Padrão de Treinamento
Omega-QVLA Reduz Memória do Modelo de Visão de Robô em 71% Sem Retreinamento
Testes de Hardware de Produção Necessários Antes que OFT Substitua LoRA em Escala
Metadados Schema.org Reduzem Erros de Busca por Agentes em Duas Terças
Meta Reduz Mixture-of-Experts para Smartphones Sem Offloading na Nuvem
Framework IBM Classifica Mudanças de Código com 84% de Recall
Cinco Bugs Mataram agentmemory em Sete Dias
SkillOpt da Microsoft Eleva Precisão de Agentes em 24 Pontos via Refinamento Automático de Skills
CARV da NVIDIA reduz computação de destilação 3D em 2–3×
OlmoEarth v1.1 da Allen AI reduz computação em inferência de satélite em 3x
Sistema Autônomo de Previsão de Doenças Supera Ensemble do CDC em Testes Cegos
Grep Supera Busca Vetorial em Recuperação Inline de Agentes
TFlow reduz tokens de inferência multi-agente em 83% via injeção de pesos
IBM Aumenta Precisão de Busca Zero-Shot 25% Com Refinamento de Query via LLM