§ BEAT
Pesquisa
Explicações de Modelos de Linguagem Rastreiam Mudanças de Comportamento Automaticamente
Modelos de visão-linguagem roteiam conhecimento através de apenas 2,5% da rede
Modelos Esquecem Regras Aprendidas Durante o Treinamento
Modelos Multimodais Trocam Respostas Quando a Ordem de Evidências Muda
DiffusionGemma do Google DeepMind é 28,6X mais difícil de interpretar que modelos autorregressivos
MIT Extrai Lógica de Atenção em Código Python Intercambiável
Cabeçalhos de Atenção Esparsos Redirecionam Modelos de Visão-Linguagem com 83% de Precisão
Teste Sem Rótulo Captura Falhas de Raciocínio de LLM Melhor do Que Auto-consistência
Nova Ferramenta Identifica 1.060 Dependências de Treinamento Ocultas em Principais LLMs
Diagrama de Fases de Kamai Prevê Falhas Multimodais Antes do Investimento em GPU
Real EHR Benchmark Exposta Limites dos LLMs em Ações Clínicas
Echo-Memory Mostra que Modelos de Mundo Falham no Teste de Revisão
64 Por cento dos Conflitos de Áudio-Texto nos Modelos de IA São Corrigíveis
Quadro de Stanford Mantém Agentes IA Dentro dos Alvos de Violação
Reprodução Autogenerada Reduz o Esquecimento Catastrófico em Modelos Ajustados
Estudo: IA Aumenta Confiança, Não Precisão do Usuário
Framework DelTA Melhora Raciocínio ao Corrigir Atribuição de Crédito em Nível de Token
RELEX reconstrói checkpoints RLVR a partir de 15% dos dados de treinamento
Métricas do SAEBench Classificam SAEs de Forma Invertida, Auditoria Constata
Prova Matemática Mostra que Atenção em Transformers Estabiliza Previsivelmente
SLIM melhora performance de agentes LLM em 7 pontos percentuais
Shepherd Aumenta Precisão de Agentes em 90% Com Rastreamento por Bifurcação
Modelos Sparse MoE Emparelham com Transformers Densos a 3× Mais Rápido em Inferência
Modelos Congelados Codificam Papéis Semânticos Sem Fine-Tuning
Pesquisadores de Rice e Apple reduzem FID 22% na geração de imagens com correção de tokens
Entropia do Primeiro Token Rival Detecção de Alucinação Multi-Amostra
Purdue e Georgia Tech Provam que Transformers Extraem Features Não-lineares em Contexto
Testes de Segurança Falham Quando o Modelo do Claude Esconde Suspeitas no Seu Interior
Detector de IA com Limite Fixo Demonstra Robustez Além de Domínios