AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14649.97 ARTIGOS HOJE 7 TOKENS TOTAL 9.29B
aiexpert
Na linha
Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Research Blueprint de Armazenamento de IA da Meta: Arquitetura BLOB Redesenhada para Cortar GPU Stalls, Reduzir Latência de I/O Funding Europa H1 2026 M&A: 324 Saídas em Queda 27%; Top Deals—Dream Games €1,1B, Oxford Ionics €968M, TTTech Auto €568M Funding M&A Europeia H1 escorrega 11% em volume; venda de quantum Oxford Ionics €968M para IonQ lidera deals divulgados Market Ações de chips sul-coreanos caem 6%+ com plano de nuvem da Meta levantando temores de oversupply Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior
Chips

Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia

d-Matrix anunciou que sua plataforma acelerador de inferência Corsair entrou em produção total em 9 de junho, com envios em volume começando para hiperscalers prioritários, neoclouds e laboratórios de IA de fronteira. O acelerador de chiplet baseado em SRAM, fabricado no processo N6 da TSMC via Alchip Technologies, é projetado especificamente para a fase de decodificação de cargas de inferência em clusters de computação hetero gêneos emparelhados com GPUs. A empresa cita testes independentes do Gimlet Labs mostrando que configurações Corsair + GPU emparelhadas reduzem tempos de resposta de inferência de aproximadamente 24 segundos para menos de dois segundos, aproximadamente 10x aceleração versus abordagens apenas com GPU.

Corsair contorna o muro de memória integrando computação rigidamente com SRAM on-chip, evitando restrições de oferta de DRAM e memória de banda larga alta (HBM) que afligem arquiteturas concorrentes. Cada cartão PCIe empacota 4 GB de Memória de Desempenho com largura de banda de 300 TB/s, atingindo computação de pico de 4.800 TFLOPs para MXINT8 e 19.200 TFLOPs para MXINT4. d-Matrix posiciona Corsair como complementar a GPUs em vez de um substituto, visando aplicações de IA agentic sensativas à latência incluindo Claude Code, agentes de voz e assistentes de codificação interativa que exigem geração rápida de tokens.

O tempo se alinha com a demanda crescente por arquiteturas de inferência disagregadas conforme cargas de trabalho agentic empurram infraestrutura apenas com GPU aos seus limites. d-Matrix garantiu serviços plurianuais de oferta e fabricação; a empresa também adquiriu o negócio de data center da GigaIO em abril, trazendo expertise de sistemas em escala de rack que culmina em SquadRack, um design de referência pronto para produção construido com Arista, Broadcom e Supermicro. O braço de risco M12 da Microsoft e Temasek são investidores; a startup levantou $275 milhões em Série C.

Para equipes de infraestrutura, o Corsair entrando em produção em volume marca uma mudança na economia de inferência: clusters hetero gêneos dividindo prefill para GPUs e decodificar para aceleradores especializados agora têm uma alternativa validada em produção, com oferta previsível de N6 e arquitetura SRAM. Os operadores agora têm um ponto de diferenciação tático ao evitar gargalos de alocação de HBM em deslocamentos de inferência restritos por latência.

Fontes