Notícias
A IA, em ritmo de redação.
RESEARCH
Microsoft Detecta que GPT-5 Falha Contra Ataques Implausíveis
RESEARCH
Formalização de LLM Detecta 18.8% de Requisitos Ambíguos em Especificações de Segurança
RESEARCH
Negligência de Negação Eleva Taxa de Crenças Falsas para 88,6% em LLMs Fine-Tuned
RESEARCH
Framework de Berkeley Reduz Latência de Agentes 1.3–2.2×
RESEARCH
IBM Aumenta Precisão de Busca Zero-Shot 25% Com Refinamento de Query via LLM
RESEARCH
Reward Hacking Não Detectado no Treinamento com Verificador Único
RESEARCH
Perdas padrão de balanceamento de carga degradam especialização de experts em SMoE em 3x
RESEARCH
Benchmark MEME encontra 97% de falha em tarefas de memória de agentes
RESEARCH
RubricEM do Google treina agentes de pesquisa sem ground truth
RESEARCH
Modelos de ML Científico Discordam em 16% das Previsões Apesar de Accuracy Coincidente
RESEARCH
TFlow reduz tokens de inferência multi-agente em 83% via injeção de pesos
RESEARCH
Por que Agentes em Produção Falham Sem Infraestrutura de Harness
RESEARCH
KV-Fold Estende Contexto de Transformers até 128K Sem Retreinamento
RESEARCH
Modelo Attractor de 27M Supera GPT o3 em Quebra-Cabeças de Lógica
RESEARCH
Aprendizado Sparse-to-Dense Eleva Scores MATH para 78.5% em Modelos Pequenos
RESEARCH
VECA Reduz Custo de Inferência em Vision Transformers para Tempo Linear
RESEARCH
RuDE Prevê Sucesso de Fine-Tuning Sem Treinamento
RESEARCH
Cada Classificador de Guardrail Testado Falha em Verificação Formal de Segurança