AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14650.64 ARTIGOS HOJE 7 TOKENS TOTAL 9.29B
aiexpert
Na linha
Policy Tribunal superior da UE mantém multa Android do Google de €4,1B—acordos pré-instalados julgados anti-competítivos Funding Quantum Systems levanta €600M com avaliação de €7–8B, dobrando fabricante de drones em 8 meses Market Apple planeja cinco novos iPhones até 2027, aumenta meta de dobrável para 10M de unidades em meio à escassez de memória Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Policy Tribunal superior da UE mantém multa Android do Google de €4,1B—acordos pré-instalados julgados anti-competítivos Funding Quantum Systems levanta €600M com avaliação de €7–8B, dobrando fabricante de drones em 8 meses Market Apple planeja cinco novos iPhones até 2027, aumenta meta de dobrável para 10M de unidades em meio à escassez de memória Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral
Chips

Cerebras e OpenAI assinam acordo de $20B+ para implantação de capacidade de inferência de IA de alta velocidade de 750MW

Cerebras Systems e OpenAI anunciaram um acordo multi-ano em 23 de junho para OpenAI implantar 750 megawatts de computação de inferência wafer-scale de Cerebras ao longo dos próximos anos. O acordo é avaliado em mais de $20 bilhões, com lançamento começando em 2026. Esta é a maior implantação de inferência de alta velocidade de IA anunciada até agora e reflete um pivô estratégico em direção ao silício de inferência dedicado de baixa latência—diferente da infraestrutura de treinamento centrada em GPU que dominou capex de IA.

<cite index="42-2">OpenAI afirma que "Cerebras adiciona uma solução de inferência dedicada de baixa latência ao nosso plataforma. Isso significa respostas mais rápidas, interações mais naturais e uma base mais forte para dimensionar IA em tempo real para muitas mais pessoas."</cite> <cite index="44-2">Cerebras simultaneamente lançou uma parceria multi-ano com AWS que traz uma estratégia de inferência desagregada: os chips Trainium 3 da AWS realizam o prefill, e CS-3 de Cerebras executa inferência de velocidade relampejante para decodificação.</cite> Esta abordagem de dois provedores sublinham que OpenAI e AWS estão desacoplando geração de tokens da codificação de contexto.

<cite index="44-2">Cerebras co-lançou Codex-Spark, um modelo projetado para codificação quase instantânea e otimizado para trabalho interativo onde latência importa, entregando mais de 1.000 tokens por segundo.</cite> <cite index="44-2">Kimi K2.6, o modelo de peso aberto líder e o primeiro modelo de trilhões de parâmetros servido em Cerebras, alcançou desempenho aproximando-se de 1.000 tokens por segundo como independentemente medido por Análise Artificial.</cite> Estes benchmarks validam silício wafer-scale para cargas de trabalho agentic sensíveis à latência.

Para profissionais, este acordo sinaliza uma inversão estratégica em infraestrutura de IA: treinamento era o recurso escasso em 2023-2024; inferência agora é a restrição. <cite index="47-2">O acordo de implantação de 750MW é aproximadamente 23 vezes o ponto médio da orientação de receita de ano completo de 2026 da Cerebras</cite>, dando à empresa clareza de receita contratada rara entre fornecedores de hardware. O compromisso de $20B+ de OpenAI também valida que provedores de modelos de fronteira manterão tiers de inferência dedicados separados de ofertas de commodities de hiperscaler. Espere por mais anunçios de capacidade de fab de concorrentes (Groq, CoreWeave, outros) e mais anunçios de co-otimização hardware-software à medida que velocidades de inferência se tornam um diferenciador de produto visível para agentes de IA em tempo real.

Fontes