AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14649.01 ARTIGOS HOJE 6 TOKENS TOTAL 9.28B
aiexpert
Na linha
Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos
Research

DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI

DeepSeek lançou DSpark, um framework de decodificação especulativa para V4-Pro e V4-Flash, em 27 de junho de 2026, afirmando redução de até 85% na latência de inferência sem exigir novo hardware ou retreinamento de modelo. A decodificação especulativa gera tokens de rascunho de baixo custo usando um modelo menor, depois os verifica contra o modelo completo, negociando custo de prefill mais alto por tokens de decodificação reduzidos e latência geral mais baixa. DeepSeek afirma que a técnica funciona tanto em sua API hospedada quanto em pesos abertos auto-hospedados, embora benchmarks independentes não tivessem sido publicados até 28 de junho. Os números de speedup derivam dos benchmarks da própria DeepSeek em infraestrutura DeepSeek contra seu próprio baseline anterior (MTP-1), por isso as afirmações merecem verificação de terceiros antes do planejamento de implantação em produção.

Together AI lançou DeepSeek V4 Pro em sua plataforma Serverless Inference em 27-28 de junho de 2026, com preços de entrada em cache para raciocínio de contexto longo econômico. V4 Pro é um modelo MoE de 1.6T (49B ativado) suportando contexto de 512K na Together (expansável para 1M em dedicado), oferecendo três modos de raciocínio (Non-Think, Think High, Think Max) e desempenho de 90.1% GPQA-Diamond + 95.2% HMMT-2026 em matemática. A disponibilidade reflete uma mudança estrutural na economia de inferência de código aberto: modelos como V4-Pro agora rivalizam ou excedem alternativas de código fechado em tarefas agençais e de codificação, com custo por token competitivo com ofertas proprietárias menores uma vez que os custos de serviço são otimizados.

Para equipes avaliando modelos de raciocínio de código aberto para agentes de produção e bases de código de documentos longos, a disponibilidade de V4-Pro na Together (mais opcionalidade de auto-hospedagem) é uma mudança material no cálculo de construir-vs-comprar. A combinação de arquitetura de atenção híbridassobre reduzindo cache KV 90% vs V3.2 em contexto de 1M), quantização agressiva (misto FP4+FP8) e decodificação especulativa DSpark sugere que custo de inferência por token para V4 pode subestimar cargas de trabalho de código fechado comparáveis em 2027. Observe benchmarks de latência de terceiros; se confirmação independente valida a afirmação de speedup de 85% em padrões de inferência de produção, refaz a ROI tanto em silício personalizado (Jalapeño, B200) quanto em decisões de compra de infraestrutura de inferência.

Fontes