AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14649.97 ARTIGOS HOJE 7 TOKENS TOTAL 9.29B
aiexpert
Na linha
Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior
Chips

MLPerf Training v6.0: NVIDIA Blackwell varre, AMD dentro de 5-6% no treinamento de LLM denso

O conjunto de benchmarks MLPerf Training v6.0, lançado pelo MLCommons em 16 de junho de 2026, mostra que NVIDIA Blackwell alcançou o tempo de treinamento mais rápido em todos os workloads testados, com a empresa submetendo resultados em todos os sete benchmarks—o único fornecedor a fazer isso. O sistema GB300 NVL72 (Blackwell Ultra) da NVIDIA alcançou desempenho líder por acelerador e em escala completa nos workloads LLM densos legados e nos novos modelos de mistura de especialistas (MoE) de 671 bilhões de parâmetros adicionados nesta rodada: DeepSeek-V3 e GPT-OSS-20B. CoreWeave, executando infraestrutura de nuvem, alcançou o tempo mais rápido do DeepSeek-V3 em 8.192 GPUs: 2,02 minutos.

O MI355X da AMD ficou dentro de 5% no fine-tuning do Llama 2-70B e 6% no pré-treinamento do Llama 3.1-8B versus NVIDIA B200 usando receitas de precisão FP4 comparáveis (MXFP4 vs. NVFP4). No entanto, AMD não submeteu resultados nos novos benchmarks MoE; todas as entradas para DeepSeek-V3 eram apenas NVIDIA, deixando a imagem competitiva incompleta no treinamento de modelos esparsos em escala. Microsoft Azure escalou Llama 3.1 405B (denso, 405B parâmetros) para 8.192 GPUs Blackwell em 7,07 minutos, um trabalho de treinamento em escala recorde.

Para profissionais, o título abrange duas camadas: hardware e software. No nível de hardware, a limpeza de stack completo da NVIDIA e o status de único fornecedor em todos os testes sinalizam maturidade de plataforma para treinamento de grande escala em produção. No nível de software, NVIDIA relata que GB300 entregou ganhos de throughput de 1,3x no DeepSeek-V3 versus GB200 em seis meses impulsionados puramente por otimização de software (gráficos CUDA, fusões de kernel, melhorias de roteador MoE)—nenhuma mudança de hardware. Isso indica que empresas com GPUs NVIDIA atuais podem esperar ganhos de desempenho entre ciclos de geração de hardware. Submissões em nuvem dobraram versus a rodada anterior (v5.1), sinalizando uma mudança estrutural em direção ao treinamento como serviço em vez de aquisição de GPU no local. Para equipes de aquisição de chips e planejamento de provedor de inferência, a paridade de 5-6% da AMD em modelos densos a torna uma alternativa de nó, mas a falta de resultados MoE deixa incerteza sobre competitividade nos workloads de arquitetura esparsa se tornando padrão da indústria.

Fontes