AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14647.00 ARTIGOS HOJE 5 TOKENS TOTAL 9.28B
aiexpert
§ BEAT

Pesquisa

30 stories Interpretabilidade ×

Explicações de Modelos de Linguagem Rastreiam Mudanças de Comportamento Automaticamente

Modelos de visão-linguagem roteiam conhecimento através de apenas 2,5% da rede

Modelos Esquecem Regras Aprendidas Durante o Treinamento

Modelos Multimodais Trocam Respostas Quando a Ordem de Evidências Muda

DiffusionGemma do Google DeepMind é 28,6X mais difícil de interpretar que modelos autorregressivos

MIT Extrai Lógica de Atenção em Código Python Intercambiável

Cabeçalhos de Atenção Esparsos Redirecionam Modelos de Visão-Linguagem com 83% de Precisão

Teste Sem Rótulo Captura Falhas de Raciocínio de LLM Melhor do Que Auto-consistência

Nova Ferramenta Identifica 1.060 Dependências de Treinamento Ocultas em Principais LLMs

Diagrama de Fases de Kamai Prevê Falhas Multimodais Antes do Investimento em GPU

Real EHR Benchmark Exposta Limites dos LLMs em Ações Clínicas

Echo-Memory Mostra que Modelos de Mundo Falham no Teste de Revisão

64 Por cento dos Conflitos de Áudio-Texto nos Modelos de IA São Corrigíveis

Quadro de Stanford Mantém Agentes IA Dentro dos Alvos de Violação

Reprodução Autogenerada Reduz o Esquecimento Catastrófico em Modelos Ajustados

Estudo: IA Aumenta Confiança, Não Precisão do Usuário

Framework DelTA Melhora Raciocínio ao Corrigir Atribuição de Crédito em Nível de Token

RELEX reconstrói checkpoints RLVR a partir de 15% dos dados de treinamento

Métricas do SAEBench Classificam SAEs de Forma Invertida, Auditoria Constata

Prova Matemática Mostra que Atenção em Transformers Estabiliza Previsivelmente

SLIM melhora performance de agentes LLM em 7 pontos percentuais

Shepherd Aumenta Precisão de Agentes em 90% Com Rastreamento por Bifurcação

Modelos Sparse MoE Emparelham com Transformers Densos a 3× Mais Rápido em Inferência

Modelos Congelados Codificam Papéis Semânticos Sem Fine-Tuning

Pesquisadores de Rice e Apple reduzem FID 22% na geração de imagens com correção de tokens

Entropia do Primeiro Token Rival Detecção de Alucinação Multi-Amostra

Purdue e Georgia Tech Provam que Transformers Extraem Features Não-lineares em Contexto

Testes de Segurança Falham Quando o Modelo do Claude Esconde Suspeitas no Seu Interior

Detector de IA com Limite Fixo Demonstra Robustez Além de Domínios

Algoritmo PLACE Garante Desempenho de Percepção Autônoma Sem Redes Neurais