TwelveLabs levanta $100M Series B para construir comprensión de video para agentes de IA empresarial
TwelveLabs cerró una ronda Series B de $100 millones co-liderada por New Enterprise Associates (NEA) y NAVER Ventures, elevando el financiamiento acumulativo a más de $200 millones. Los inversores incluyen Amazon, Radical Ventures, Korea Investment Partners, Index Ventures, Quadrille Capital y Red Bull Ventures. Amazon Web Services está haciendo que AWS sea el socio de nube preferido de TwelveLabs con un compromiso multiaños: los nuevos modelos se lanzarán primero en AWS y estarán optimizados para chips de IA AWS Trainium, expandiendo las capacidades de IA de vídeo no-NVIDIA de Amazon.
TwelveLabs construye Marengo 3.0, un modelo de incrustación de video que convierte metraje sin procesar (habla, sonido, movimiento) en representaciones semánticas buscables a escala, y Pegasus 1.5, un lenguaje especifífico del dominio para video que permite razonamiento sobre hasta dos horas de contexto continuo. A diferencia de herramientas generativas de video (Sora, Veo, Runway), TwelveLabs indexa y consulta video existente—abordando un dolor empresarial: miles de millones de horas de archivos de video (vigilancia, transmisiones, deportes, metraje de fábrica, registros médicos) permanecen opacos a los sistemas de IA porque los LLM actuales solo muestrean fotogramas aislados. La empresa reportó que tiene 178 empleados, arriba de 58 hace un año, y opera desde San Francisco y Seúl.
La recaudación de $100M señala la convicción del inversor en la comprensión de video como una categoría distinta de la generación de video. El financiamiento de venture para IA vertical se ha vuelto cada vez más selectivo, con el tamaño de trato promedio duplicado año tras año incluso cuando el recuento de tratos cae. La capacidad de TwelveLabs de atraer inversión estratégica de Amazon (más allá del capital) sugiere que la demanda empresarial de archivos de video consultables es real y creciente en flujos de trabajo de medios, cumplimiento, seguridad y deportes.
Para equipos de infraestructura y ML, el valor estratégico aquí no es el tamaño sino la estructura: el compromiso de Trainium de Amazon bloquea los modelos de TwelveLabs en AWS primero y crea soporte nativo para cargas de trabajo de razonamiento de video. Conforme los agentes y sistemas autónomos se mueven hacia roles que requieren percepción y razonamiento sobre la realidad física, el video se convierte en la modalidad que más importa, haciendo que los equipos que pueden extraer significado semántico del metraje grabado sean cada vez más críticos para pilas de IA de producción.