Noticias
IA, al ritmo de la redacción.
RESEARCH
Microsoft Detecta que GPT-5 Falla Contra Ataques Implausibles
RESEARCH
Formalización de LLM Detecta 18.8% de Requisitos Ambiguos en Especificaciones de Seguridad
RESEARCH
Negligencia de Negación Eleva Tasa de Creencias Falsas a 88,6% en LLMs Fine-Tuned
RESEARCH
Framework de Berkeley Reduce Latencia de Agentes 1.3–2.2×
RESEARCH
IBM Aumenta Precisión de Búsqueda Zero-Shot 25% Con Refinamiento de Consulta Mediante LLM
RESEARCH
Reward Hacking No Detectado en Entrenamiento con Verificador Único
RESEARCH
Las pérdidas estándar de equilibrio de carga degradan la especialización de expertos en SMoE en 3x
RESEARCH
Benchmark MEME encuentra 97% de fallos en tareas de memoria de agentes
RESEARCH
RubricEM de Google entrena agentes de investigación sin ground truth
RESEARCH
Modelos de ML Científico Discrepan en 16% de Predicciones Pese a Accuracy Coincidente
RESEARCH
TFlow reduce tokens de inferencia multi-agente 83% mediante inyección de pesos
RESEARCH
Por Qué los Agentes en Producción Fallan Sin Infraestructura de Harness
RESEARCH
KV-Fold Extiende el Contexto de Transformers a 128K sin Reentrenamiento
RESEARCH
Modelo Attractor de 27M Supera GPT o3 en Rompecabezas de Lógica
RESEARCH
Aprendizaje Sparse-to-Dense Eleva Scores MATH a 78.5% en Modelos Pequeños
RESEARCH
VECA Reduce el Costo de Inferencia en Vision Transformers a Tiempo Lineal
RESEARCH
RuDE Predice Éxito de Fine-Tuning Sin Entrenamiento
RESEARCH
Cada Clasificador de Guardrail Probado Falla en Verificación Formal de Seguridad