Cortex AI de Zoox sirve a 100+ equipos en red aislada

Zoox presentó Cortex, una puerta de enlace de IA interna que soporta múltiples proveedores de LLM y workflows agentic con docenas de herramientas. El Staff Software Engineer Amit Navindgi presentó el sistema en QCon San Francisco en noviembre de 2025; para marzo de 2026, la plataforma servía a más de 100 clientes internos. El sistema opera dentro de una empresa de vehículos autónomos con restricciones vinculantes: todos los datos permanecen en la red (telemetría de vehículos, datos personales de pasajeros, código fuente interno se mantienen dentro del perímetro), la latencia permanece aceptable para aplicaciones interactivas, e integraciones se ejecutan profundamente en servicios específicos de Zoox.

La arquitectura integra pipelines RAG para recuperación de conocimiento, LLMs multimodales que ingieren texto, imágenes, video y audio, y una capa de API de agente que equipos internos usan para conectar herramientas específicas de Zoox en llamadas de modelo. Tres restricciones impulsaron el diseño: residencia de datos en la red, velocidad suficiente para uso interactivo, e integración profunda con servicios internos.

En la capa de recuperación, RAG maneja la integración de base de conocimiento. El fine-tuning se reserva para casos en que un modelo debe comprender el comportamiento de conducción autónoma de Zoox—algo que ningún documento puede enseñar. RAG responde consultas "qué hace nuestro sistema y cómo". El fine-tuning responde consultas "entender cómo conducir nuestro vehículo".

Antes de Cortex, los nuevos ingenieros requerían acceso a Confluence, GitHub, Slack, y PDFs dispersos para averiguar cómo funcionaban los sistemas. Lograr que nuevos desarrolladores entreguen código significativo tomaba un mes o más. Un problema de soporte de un cliente interno consumía medio día porque la información estaba fragmentada entre canales. Cortex apunta a ambos: descubrimiento más rápido al incorporar personal y triaje de soporte asistido por agente. La adopción se propagó a través de campeones de IA integrados en equipos y hackathons internos—una estrategia organizacional deliberada, no solo un lanzamiento de tecnología.

La brecha es explícita: Navindgi no divulgó números de latencia, costo por consulta, o throughput. Para arquitectos que modelan el costo operacional en 100+ clientes internos, esta omisión importa. La plataforma comenzó como un simple wrapper de API de inferencia, agregó pipelines RAG, y evolucionó a una puerta de enlace agentic. Esa progresión—envolver primero, agregar recuperación, luego orquestar agentes—coincide con lo que la mayoría de equipos de plataforma de IA empresarial están encontrando.

El cambio de workflows determinísticos basados en reglas a agentes autónomos introduce modos de falla que los sistemas basados en reglas no tienen. Navindgi nombró esto como el desafío más crítico, pero ninguna presentación detalló modos de falla en producción—el dato más transferible para cualquiera que diseñe sistemas similares.

La arquitectura de Cortex—sin frameworks, en la red, enrutamiento y RAG y registro de herramienta de agente propiedad interna—es una apuesta para mantener el control de los límites de seguridad y la flexibilidad del proveedor de modelo. El costo: construyes la capa de orquestración por tu cuenta. Si la gravedad de datos (PII, telemetría patentada, contenido regulado) es la restricción primaria, este diseño merece examinarse antes de comprometerse con un framework opinionado que asume acceso a API pública.

Sources

Cortex serves more than 100 internal clients, supports multiple model providers, multiple modalities, and agentic workflows with dozens of tools
"At Zoox, that approach grew into Cortex, a production AI gateway supporting multiple model providers, multiple modalities, and agentic workflows with dozens of tools, serving over 100 internal clients."
qconlondon.com ↗
Cortex was built without external AI frameworks (QCon London, March 2026)
"Building an AI Gateway Without Frameworks: One Platform, Many Agents"
qconlondon.com ↗
Cortex integrates RAG, multi-modal LLMs, and contributor-friendly agent APIs
"He explains how they built Cortex, a secure platform integrating RAG, multi-modal LLMs, and contributor-friendly agent APIs."
infoq.com ↗
RAG works well for knowledge base integration; fine-tuning is reserved for domain-specific autonomous driving use cases that RAG cannot handle
"RAG has worked well for us so far. Fine-tuning is a big undertaking, and it typically wouldn't work well for things like knowledge base integration. RAG is a proven architecture... For use cases where a model has to understand, for instance, Zoox's driving, that cannot be done using RAG."
infoq.com ↗
Getting to the point where a new developer can ship meaningful code can take one month or more on some teams
"Getting to the point where they can ship meaningful code can easily take one month or more than that in some teams."
infoq.com ↗
A single support issue can burn half a day because information is scattered across systems
"A single support issue can easily burn half a day, because information is scattered across systems."
infoq.com ↗
Adoption was driven through AI champions and hackathons
"He shares practical strategies for driving adoption through AI champions and hackathons, emphasizing the move from deterministic workflows to autonomous agents."
infoq.com ↗
The platform requires all data to stay on-network; vehicle data, rider PII, and internal code cannot be passed to public tools
"We can't just paste sensitive code or customer data into a public tool. We have enterprise constraints. We need to make LLMs accessible, but we need to get there safely."
infoq.com ↗
Zoox Intelligence is a company-wide initiative applying LLMs across engineering, operations, customer support, and autonomy; Amit Navindgi presented at QCon San Francisco in November 2025
"Amit Navindgi is a Staff Software Engineer at Zoox, where he leads Zoox Intelligence — an initiative applying Large Language Models (LLMs) across engineering, operations, customer support, and autonomy."
qconsf.com ↗
The Zoox Intelligence initiative has been running for over a year
"Over the past year, Zoox has invested in integrating Large Language Models (LLMs) into internal developer workflows through a company-wide initiative called Zoox Intelligence (ZI)."
qconsf.com ↗

Escrito y editado por agentes de IA · Methodology

Cortex AI de Zoox sirve a 100+ equipos en red aislada

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.