EN VIVO · JUE, 25 JUN 2026 --:--:-- ET
Edición Nº 65 GASTO TOTAL $14517.72 ARTÍCULOS HOY 5 TOKENS TOTAL 9.11B
aiexpert
En vivo
Breaking GP Visionaries Judith Dada se une a Langdock como co-CEO; plataforma de modelo de IA alcanza $40M ARR, apuntando a levantamiento de fondos de 2026 Market Anthropic expande agresivamente centros de datos de Asia-Pacífico: contratando 13 roles de computación en Australia, Japón en medio de tensión de infraestructura Chips OpenAI, Broadcom revelan Jalapeño: chip de inferencia LLM personalizado diseñado en 9 meses Funding Banco de Negocios Británico se compromete con £90M a 10 primeros VC del Reino Unido apoyando deeptech, defensa, clima en pre-seed/seed Funding SK Hynix presenta solicitud para listaje Nasdaq ADR récord de $29,4B; acciones suben 12% en señal de restricción de oferta Micron Market Micron alcanza margen bruto récord de 84,9% mientras escasez de memoria sostiene poder de precios Breaking Anthropic acusa a Alibaba del mayor ataque de destilación en Claude, 28,8M consultas de modelo via 25K cuentas falsas Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Breaking GP Visionaries Judith Dada se une a Langdock como co-CEO; plataforma de modelo de IA alcanza $40M ARR, apuntando a levantamiento de fondos de 2026 Market Anthropic expande agresivamente centros de datos de Asia-Pacífico: contratando 13 roles de computación en Australia, Japón en medio de tensión de infraestructura Chips OpenAI, Broadcom revelan Jalapeño: chip de inferencia LLM personalizado diseñado en 9 meses Funding Banco de Negocios Británico se compromete con £90M a 10 primeros VC del Reino Unido apoyando deeptech, defensa, clima en pre-seed/seed Funding SK Hynix presenta solicitud para listaje Nasdaq ADR récord de $29,4B; acciones suben 12% en señal de restricción de oferta Micron Market Micron alcanza margen bruto récord de 84,9% mientras escasez de memoria sostiene poder de precios Breaking Anthropic acusa a Alibaba del mayor ataque de destilación en Claude, 28,8M consultas de modelo via 25K cuentas falsas Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas
Research

Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura

GKE Labs de Google lanzó OpenRL, una API de entrenamiento auto-hospedada de código abierto para ejecutar workflows de post-entrenamiento de aprendizaje por refuerzo en clusters Kubernetes. OpenRL abstrae la complejidad de infraestructura de RL de la investigación de IA, permitiendo a investigadores desarrollar bucles RL agenénicos en compute estándar (e.g., una MacBook) mientras que ingenieros de infraestructura manejan escalado, orquestación y asignación de hardware en clusters compartidos. El diseño desacopla dos preocupaciones que están "estrechamente mezcladas" en frameworks actuales como TRL y DeepSpeed: lógica de investigación de IA (bucle RL, diseño de recompensa) y ejecución de infraestructura (aprovisionamiento, gestión de memoria, programación de hardware).

Los bucles de entrenamiento RL tradicionales son estrictamente secuenciales: el entrenador espera al muestreador, el muestreador espera a la puntuación de recompensa (a menudo vinculado a CPU/red), las GPU permanecen inactivas. OpenRL permite que trabajos RL concurrentes saturen la utilización de GPU. Ejecutar 1 trabajo deja brechas; ejecutar 3 trabajos concurrentes logra ciclos de duty GPU casi continuos. El sistema utiliza el patrón Tinker (cuatro APIs: I/O de datos, actualizaciones de pesos, muestreo, guardado de punto de control) e integra con Tinker-Cookbook. OpenRL soporta fine-tuning LoRA de Gemma y otros modelos base. Google incluyó una "receta autoresearch" (inspirada en el trabajo de Karpathy) que permite experimentos paralelos para barrido de hiperparámetros y refinamiento de señal de recompensa en tareas text-to-sql.

La arquitectura es vista previa de investigación, enfocada en fine-tuning solo LoRA por ahora. El roadmap futuro incluye soporte de modelo más amplio e integración más cercana con pipelines KubeFlow. OpenRL se ejecuta en macOS, GPUs NVIDIA y GKE, permitiendo a investigadores iterar localmente mientras escalan el post-entrenamiento de producción a despliegues Kubernetes multi-nodo.

Para arquitectos: OpenRL es una capa de abstracción en fase inicial que desbloquea dos flujos de trabajo: (1) investigadores pueden prototipar RL agenénico sin hardware de GPU, apuntando a APIs de cluster remoto; (2) equipos de ops pueden empaquetar múltiples trabajos RL concurrentes para amortizar costos de infraestructura. La limitación: solo LoRA (basado en adaptadores, no sintonización de modelo completo). Si se adopta, este modelo (preocupaciones separadas de investigación e infraestructura) podría estandarizar cómo las empresas ejecutan post-entrenamiento multi-agente a escala. Observe si este patrón se extiende a otros frameworks RL (NVIDIA NeMo RL, Hugging Face TRL) o permanece céntrico a Google.

Fuentes