EN VIVO · JUE, 02 JUL 2026 --:--:-- ET
Edición Nº 72 GASTO TOTAL $14649.01 ARTÍCULOS HOY 6 TOKENS TOTAL 9.28B
aiexpert
En vivo
Research Anthropic lanza Claude Science, workbench de IA para investigación científica Chips Amazon diseña chips de IA personalizados para Echo y Fire TV Breaking Anthropic lanza Claude Science, workbench de IA integrando 60+ bases de datos científicos para descubrimiento de fármacos Market OpenAI propone participación del gobierno estadounidense del 5% por valor de ~$43B para aliviar presión en Washington Funding Ramp recauda $750M Serie F en valuación de $44B, apuntando a gestión de gastos de token e IA Chips NVIDIA Abre Computación de AI Factory a Socios Capitalistas Mediante Modelo de Compartición de Ingresos DSX Breaking Tribunal sueco otorga a Klarna PriceRunner $1.97B en daños de antitrust de Google; mayor sentencia de competencia sueca Breaking Cloudflare abre Monetization Gateway para micropagos x402 en stablecoin; agentes pagan por solicitud sin inscripción Breaking Hugging Face + Cerebras desbloquean IA de voz en tiempo real para robots; Gemma 4 a 1.800 TPS permite discurso-a-discurso de baja latencia en 7.500+ unidades Reachy Mini Funding Wayve lanza tender de US$ 85 millones de empleados en plataforma Pisces de LSE, primera gran prueba del sistema de mercados privados del Reino Unido Funding Ant Group lidera ronda de financiamiento de US$ 73,58 millones en startup de robot humanoide Zeroth; 12ª apuesta en robótica en 18 meses Market Samsung, SK Hynix caen 7%+ en apertura de Nasdaq con inquietudes de mercado mientras fabricantes de chips sufren en venta general de tecnología Breaking Google lanza el modelo de video Gemini Omni Flash a $0,10/seg y Nano Banana 2 Lite para imágenes en disponibilidad general Chips Tesla contrata a Gary Jiang, veterano de Intel de 17 años, como Director del proyecto de chips Terafab Market Meta lanza negocio de cloud para vender capacidad de IA en exceso; acciones +8% Market NVIDIA proyecta $1 trillón en demanda de infraestructura de IA hasta 2027; duplica pronóstico anterior Chips Samsung HBM4 supera $1B en ventas en 4 meses; proyecta tasa anual de $10B Funding Oxmiq Labs recauda $35M en Series A para GPU IP licenciable, buscando arquitectura similar a Arm Research ChatGPT cruza 1 mil millones de usuarios mensuales activos, el hito de aplicativo de consumidor más rápido en la historia Chips NVIDIA y TSMC marcan primer obligo Blackwell hecho en EE.UU. en Phoenix, planean gasto de $500B en infraestructura en 4 años Research Anthropic lanza Claude Science, workbench de IA para investigación científica Chips Amazon diseña chips de IA personalizados para Echo y Fire TV Breaking Anthropic lanza Claude Science, workbench de IA integrando 60+ bases de datos científicos para descubrimiento de fármacos Market OpenAI propone participación del gobierno estadounidense del 5% por valor de ~$43B para aliviar presión en Washington Funding Ramp recauda $750M Serie F en valuación de $44B, apuntando a gestión de gastos de token e IA Chips NVIDIA Abre Computación de AI Factory a Socios Capitalistas Mediante Modelo de Compartición de Ingresos DSX Breaking Tribunal sueco otorga a Klarna PriceRunner $1.97B en daños de antitrust de Google; mayor sentencia de competencia sueca Breaking Cloudflare abre Monetization Gateway para micropagos x402 en stablecoin; agentes pagan por solicitud sin inscripción Breaking Hugging Face + Cerebras desbloquean IA de voz en tiempo real para robots; Gemma 4 a 1.800 TPS permite discurso-a-discurso de baja latencia en 7.500+ unidades Reachy Mini Funding Wayve lanza tender de US$ 85 millones de empleados en plataforma Pisces de LSE, primera gran prueba del sistema de mercados privados del Reino Unido Funding Ant Group lidera ronda de financiamiento de US$ 73,58 millones en startup de robot humanoide Zeroth; 12ª apuesta en robótica en 18 meses Market Samsung, SK Hynix caen 7%+ en apertura de Nasdaq con inquietudes de mercado mientras fabricantes de chips sufren en venta general de tecnología Breaking Google lanza el modelo de video Gemini Omni Flash a $0,10/seg y Nano Banana 2 Lite para imágenes en disponibilidad general Chips Tesla contrata a Gary Jiang, veterano de Intel de 17 años, como Director del proyecto de chips Terafab Market Meta lanza negocio de cloud para vender capacidad de IA en exceso; acciones +8% Market NVIDIA proyecta $1 trillón en demanda de infraestructura de IA hasta 2027; duplica pronóstico anterior Chips Samsung HBM4 supera $1B en ventas en 4 meses; proyecta tasa anual de $10B Funding Oxmiq Labs recauda $35M en Series A para GPU IP licenciable, buscando arquitectura similar a Arm Research ChatGPT cruza 1 mil millones de usuarios mensuales activos, el hito de aplicativo de consumidor más rápido en la historia Chips NVIDIA y TSMC marcan primer obligo Blackwell hecho en EE.UU. en Phoenix, planean gasto de $500B en infraestructura en 4 años
Research

DeepSeek V4 DSpark decodificación especulativa reduce latencia de inferencia 85%, llega a Together AI

DeepSeek lanzó DSpark, un framework de decodificación especulativa para V4-Pro y V4-Flash, el 27 de junio de 2026, afirmando una reducción de hasta 85% en la latencia de inferencia sin requerir nuevo hardware o reentrenamiento de modelo. La decodificación especulativa genera tokens de borrador de bajo costo usando un modelo más pequeño, luego los verifica contra el modelo completo, intercambiando costo de prefill más alto por tokens de decodificación reducidos y latencia general más baja. DeepSeek afirma que la técnica funciona tanto en su API alojada como en pesos abiertos auto-hospedados, aunque los puntos de referencia independientes no se habían publicado hasta el 28 de junio. Las cifras de aceleración derivan de los propios puntos de referencia de DeepSeek en la infraestructura de DeepSeek contra su propia línea base anterior (MTP-1), por lo que las afirmaciones merecen verificación de terceros antes de la planificación del despliegue en producción.

Together AI lanzó DeepSeek V4 Pro en su plataforma Serverless Inference el 27-28 de junio de 2026, con precios de entrada en caché para razonamiento de contexto largo económico. V4 Pro es un modelo MoE de 1.6T (49B activado) con soporte de contexto de 512K en Together (expandible a 1M en dedicado), ofreciendo tres modos de razonamiento (Non-Think, Think High, Think Max) y rendimiento de 90.1% GPQA-Diamond + 95.2% HMMT-2026 en matemáticas. La disponibilidad refleja un cambio estructural en la economía de inferencia de código abierto: modelos como V4-Pro ahora rivalizan o superan alternativas de código cerrado en tareas agentes y de codificación, con costo por token competitivo con ofertas propietarias más pequeñas una vez que se optimizan los costos de servicio.

Para equipos que evalúan modelos de razonamiento de código abierto para agentes de producción y bases de código de documentos largos, la disponibilidad de V4-Pro en Together (más opcionalidad de auto-hospedaje) es un cambio material en el cálculo de construir versus comprar. La combinación de arquitectura de atención híbrida (reduciendo caché KV 90% vs V3.2 en contexto de 1M), cuantización agresiva (FP4+FP8 mixto) y decodificación especulativa DSpark sugiere que el costo de inferencia por token para V4 podría ser menor que las cargas de trabajo de código cerrado comparable en 2027. Observe puntos de referencia de latencia de terceros; si la confirmación independiente valida la afirmación de aceleración del 85% en patrones de inferencia de producción, reforma el ROI tanto en silício personalizado (Jalapeño, B200) como en decisiones de compra de infraestructura de inferencia.

Fuentes