AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14649.01 ARTIGOS HOJE 6 TOKENS TOTAL 9.28B
aiexpert
Na linha
Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos Research Anthropic lança Claude Science, workbench de IA para pesquisa científica Chips Amazon projeta chips de IA customizados para Echo e Fire TV Breaking Anthropic lança Claude Science, workbench de IA integrando 60+ bancos de dados científicos para descoberta de drogas Market OpenAI propõe participação de 5% do governo dos EUA no valor de ~$43B para aliviar pressão em Washington Funding Ramp arrecada $750M Series F em avaliação de $44B, visando gerenciamento de gastos de token e IA Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos
Research

OpenAI lanza GeneBench-Pro; avalia juízo de IA em 129 problemas genômicos multiestágio; GPT-5.6 Sol atinge 31,5%

<cite index="63-3,64-1">OpenAI lançou GeneBench-Pro, um benchmark de 129 problemas em 10 domínios primários e 21 subdomínios cobrindo genômica, biologia quantitativa e medicina translacional. Cada problema fornece a um agente um conjunto de dados realista e deliberadamente barulhento e um alvo estimado vinculado a uma decisão científica ou translacional posterior.</cite> <cite index="64-2">GeneBench-Pro testa o que OpenAI chama de 'research taste': a cadeia de julgamentos sobre quais perguntas um conjunto de dados pode apoiar, quando diagnósticos iniciais devem mudar o modelo e quando um resultado está pronto para decisão.</cite> <cite index="61-1">OpenAI submeteu 82 dos 129 problemas a especialistas de domínio externo, incluindo estudantes de pós-graduação, pesquisadores de pós-doutorado, cientistas da indústria e professores universitários, que avaliaram o realismo de cada problema e se a resposta alvo era identificável.</cite>

<cite index="63-2">GPT-5.6 Sol atinge taxa de aprovação de 28,7% no nível máximo de raciocínio, e GPT-5.6 Sol Pro atinge 31,5%; GPT-5.5 atinge 12%, GPT-5.4 atinge 8,9%, e Claude Opus 4.8 da Anthropic atinge 16%.</cite> <cite index="64-3">O dimensionamento de computação em tempo de teste mostra que no nível de raciocínio mais baixo GPT-5.6 Sol pontua em um dígito, e no mais alto resolve aproximadamente seis vezes mais perguntas que GPT-5.2 enquanto usa aproximadamente dois terços dos tokens.</cite> <cite index="63-2">Modelos frequentemente completam partes substanciais do fluxo de trabalho, mas exibem uma lacuna consistente entre notar e agir: identificam sinais diagnósticos locais mas falham em propagar implicações para decisões de análise correspondentes, selecionando estimadores errados ou persistindo em caminhos incorretos.</cite>

<cite index="61-3">Se agentes conseguem automatizar com segurança essa classe de análise, eles poderiam acelerar significativamente a descoberta científica. O fator limitante na pesquisa genômica em escala de biobancos está mudando da geração de dados para transformar a informação em ideias acionáveis; modelos que conseguem consistentemente realizar análises tratadas por equipes de especialistas humanos poderiam transformar pesquisa industrial acelerando triagem de hipóteses e acompanhamento de alvo.</cite> Para equipes de biotech e pesquisadores farmacêuticos avaliando ferramentas de IA para ciência, GeneBench-Pro mede a capacidade que determina se um agente auxilia descoberta ou produz com confiança respostas erradas. Os 60%+ de problemas abaixo da taxa de aprovação de 20% sinalam espaço abundante para investimento antes que modelos saturem o benchmark.

Fontes