AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14649.01 ARTIGOS HOJE 6 TOKENS TOTAL 9.28B
aiexpert
Na linha
Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos
Chips

Claude no Microsoft Foundry agora é executado em NVIDIA GB300 Blackwell Ultra no Azure

Os modelos Claude de Anthropic no Microsoft Foundry, hospedados no Azure e executados em GPUs NVIDIA GB300 Blackwell Ultra, estão agora disponíveis em geral. Microsoft implantou o primeiro cluster de produção em larga escala do mundo com mais de 4.600 GPUs Blackwell Ultra conectadas via NVIDIA Quantum-X800 InfiniBand, integrando cada rack 72 GPUs Blackwell Ultra e 36 CPUs NVIDIA Grace em uma unidade coerente otimizada para modelos de raciocínio, IA agentica e IA generativa multimodal.

O cluster oferece largura de banda de memória excepcional: 37 terabytes de memória rápida unificada por rack (20 TB HBM3E GPU + 17 TB LPDDR5X CPU), largura de banda NVLink de 130 TB/s dentro de cada rack, e até 1,44 exaflops de desempenho FP4 Tensor Core por VM. Entre racks, 800 Gb/s de interconexão por GPU via Quantum-X800 InfiniBand permite escala não bloqueadora para dezenas de milhares de GPUs. A Microsoft diz que essa infraestrutura reduz o treinamento de modelos de meses para semanas e oferece suporte ao treinamento de modelos excedendo 100 trilhões de parâmetros.

Nos recentes benchmarks MLPerf Inference v5.1, o GB300 NVL72 entregou até 5x maior taxa de transferência por GPU em DeepSeek-R1 (671B parâmetros) versus NVIDIA Hopper, com desempenho liderança em Llama 3.1 405B e outros benchmarks mais novos. A arquitetura é construída propositalmente para escala no tempo de teste e raciocínio agentico, onde cadeias de pensamento mais longas e chamadas de ferramentas impulsionam variância de computação mais alta.

Para arquitetos implantando modelos Anthropic em escala, isso marca uma mudança na pilha de inferência: o Blackwell Ultra com memória e rede redesenhadas é otimizado para cargas de trabalho de raciocínio com contexto alto e saídas de longa forma. Empresas no Azure agora obtêm Claude apoiado pelo tecido NVIDIA mais denso disponível, tornando viável executar modelos de raciocínio com trilhões de parâmetros em produção sem depender de truques de batching. Esta é a inflexão de infraestrutura para raciocínio competitivo de custo por token.

Fontes