AO VIVO · QUI., 25 DE JUN. DE 2026 --:--:-- ET
Edição Nº 65 GASTO TOTAL $14517.72 ARTIGOS HOJE 5 TOKENS TOTAL 9.11B
aiexpert
Na linha
Breaking GP Visionaries Judith Dada se une a Langdock como co-CEO; plataforma de modelo de IA atinge $40M ARR, olhando para levantamento de fundos de 2026 Market Anthropic expande agressivamente data centers da Ásia-Pacíf: contratando 13 funções de cálculo na Austrália, Japão em meio à tensão de infraestrutura Chips OpenAI, Broadcom revelam Jalapeño: chip customizado de inferência LLM projetado em 9 meses Funding Banco de Negócios Britânico se compromete com £90M a 10 primeiros VCs do Reino Unido apoiando deeptech, defesa, clima em pré-seed/seed Funding SK Hynix apresenta pedido para listagem Nasdaq ADR recorde de $29,4B; ação sobe 12% em sinal de aperto de oferta Micron Market Micron atinge margem bruta recorde de 84,9% enquanto escassez de memória sustenta poder de preço Breaking Anthropic acusa Alibaba do maior ataque de destilação em Claude, 28,8M consultas de modelo via 25K contas falsas Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Breaking GP Visionaries Judith Dada se une a Langdock como co-CEO; plataforma de modelo de IA atinge $40M ARR, olhando para levantamento de fundos de 2026 Market Anthropic expande agressivamente data centers da Ásia-Pacíf: contratando 13 funções de cálculo na Austrália, Japão em meio à tensão de infraestrutura Chips OpenAI, Broadcom revelam Jalapeño: chip customizado de inferência LLM projetado em 9 meses Funding Banco de Negócios Britânico se compromete com £90M a 10 primeiros VCs do Reino Unido apoiando deeptech, defesa, clima em pré-seed/seed Funding SK Hynix apresenta pedido para listagem Nasdaq ADR recorde de $29,4B; ação sobe 12% em sinal de aperto de oferta Micron Market Micron atinge margem bruta recorde de 84,9% enquanto escassez de memória sustenta poder de preço Breaking Anthropic acusa Alibaba do maior ataque de destilação em Claude, 28,8M consultas de modelo via 25K contas falsas Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas
Chips

OpenAI, Broadcom revelam Jalapeño: chip customizado de inferência LLM projetado em 9 meses

OpenAI e Broadcom revelaram Jalapeño, o primeiro chip de IA customizado da OpenAI, desenvolvido para lidar de forma mais eficiente com as necessidades computacionais do ChatGPT e do agente de codificação Codex da OpenAI. Testes iniciais mostram que Jalapeño entregará desempenho por watt substancialmente melhor do que o estado da arte atual, com uma redução estimada de 50% nos custos de inferência. O acelerador customizado foi projetado especificamente para inferência de modelos de linguagem grandes e passou do design à produção em apenas nove meses, com o desenvolvimento utilizando os próprios modelos da OpenAI para acelerar partes do design do chip.

Amostras de engenharia do chip Jalapeño estão executando cargas de trabalho de ML no laboratório em frequência alvo de produção e potência, incluindo GPT-5.3-Codex-Spark. A OpenAI planeja implantar o chip em escala de gigawatt com parceiros de data center como a Microsoft começando em 2026, com a Microsoft esperada de comprar 40% dos chips para garantir a primeira fase.

Para arquitetos, Jalapeño sinaliza a mudança da OpenAI em direção à integração vertical: controlar o stack completo de inferência de chip a produto para reduzir custos e reduzir dependência da NVIDIA. O turnaround de 9 meses—tipicamente 1,5–2 anos para silício customizado—demonstra a vantagem de velocidade do design de chip assistido por IA. Se as afirmações de desempenho se sustentarem em escala, isso move a agulha nos custos de unidade de inferência em toda a indústria.

Fontes