AWS OpenSearch Serverless reconstrói para IA agentic: 20x autoscaling mais rápido, economia de 60%, scale-to-zero
AWS anunciou uma re-arquitetura do zero da Amazon OpenSearch Serverless projetada especificamente para workloads de IA agentic. O serviço agora provisiona infraestrutura em segundos (anteriormente minutos), alcança autoscaling 20x mais rápido, e oferece capacidade verdadeira de scale-to-zero—liberando recursos de computa quando ocioso após 10 minutos, e aquecendo de volta à capacidade total em ~10 segundos quando o tráfego retorna. Economias de custo atingem 60% versus provisionar clusters OpenSearch Service para capacidade de pico.
A nova arquitetura desacopla computa de armazenamento, abordando o padrão burst-e-idle que define workloads agentic. Desenvolvedores agora podem provisionar uma coleção e começar a enviar requisições em segundos sem planejamento de capacidade antecipado, decisões de tamanho, ou tempo de aquecimento de infraestrutura. Índexing, busca, armazenamento, e GPU acceleration de Vector Index são medidos separadamente, permitindo que times otimizem cada dimensão independentemente.
AWS posicionou OpenSearch Serverless como um bloco de construção para desenvolvimento de IA agentic, com integrações nativas em plataformas Vercel e Kiro, e OpenSearch Agent Skills que fornecem templates construídos em Claude Code, Cursor, e Codex. O Agent Skills—desenvolvido pela Anthropic—é um formato leve e aberto para estender capacidades de agentes de IA com inteligência pré-construída para busca, observabilidade, e migrações Elasticsearch. Memória de agente longo-prazo está planejada para H2 2026.
Para arquitetos construindo RAG e stacks de busca agentic: OpenSearch Serverless agora compete com vector DBs propósitos especializados em custo e latência enquanto fornece recuperação unificada de busca + vetor + léxica em uma plataforma. O modelo scale-to-zero significa que times podem prototipagem e executar workloads de recuperação agentic bursty sem provisionar capacidade ociosa. Observe taxas de adoção—este tier de preço e velocidade pode commoditizar OpenSearch como padrão de infraestrutura para pipelines de observabilidade e recuperação dirigidos por agentes.
Fontes
- Primary source
- Introducing the next generation of Amazon OpenSearch Serverless
“AWS rebuilt Amazon OpenSearch Serverless from the ground up for agentic AI”
- The next generation of Amazon OpenSearch Serverless
“delivers up to 20 times faster autoscaling, scale to zero, and up to 60% lower cost”
- OpenSearch Agent Skills bring built-in intelligence to your agentic IDE
“Agent Skills bring built-in intelligence to developer workflows”