Google Cloud Superpotencia Vertex AI con VMs A4X y NVIDIA GB200 NVL72: Avances en AI de GTC 2026

Google Cloud acaba de revelar mejoras revolucionarias para Vertex AI en NVIDIA GTC 2026, incluyendo soporte para VMs A4X en racks NVIDIA GB200 NVL72 y entrenamiento resiliente de varias semanas. Descubre cómo estos avances, más Gemini 3.1 Flash-Lite y Nemotron 3 Super 120B, posicionan a Vertex AI como líder en AI agentiva.

Google Cloud Superpotencia Vertex AI con VMs A4X y NVIDIA GB200 NVL72: Avances en AI de GTC 2026

Publicado: 21 de marzo de 2026

Solo días después del revuelo de NVIDIA GTC 2026, Google Cloud está causando sensación en el mundo del AI con actualizaciones transformadoras para Vertex AI. Anunciadas en el evento, estas mejoras incluyen soporte para VMs A4X en sistemas NVIDIA GB200 NVL72 a escala de rack, resiliencia de hardware para trabajos de entrenamiento ininterrumpidos de varias semanas, y un Model Garden de Vertex AI ampliado que incluye NVIDIA Nemotron 3 Super 120B y Nemotron 3 Nano. Junto con lanzamientos recientes como la vista previa pública de Gemini 3.1 Flash-Lite y Vector Search 2.0 GA, Vertex AI está consolidando su posición como la plataforma principal para el entrenamiento empresarial de AI agentiva.[1]

Mejoras en Infraestructura: Impulsando el Entrenamiento de AI a Gran Escala

En GTC 2026, Google Cloud destacó su asociación profundizada con NVIDIA, centrada en clústeres de entrenamiento de Vertex AI que pueden manejar las demandas de la AI de próxima generación. ¿La estrella del espectáculo? Soporte para dominios de VMs A4X en sistemas NVIDIA GB200 NVL72 a escala de rack. Esta integración permite a las empresas aprovechar la infraestructura gestionada de Vertex AI para entrenamiento a gran escala sin los problemas de configuraciones personalizadas.[1]

Para abordar los desafíos de los trabajos de larga duración, Google introdujo funciones de resiliencia de hardware con escaneos de detección de fallos proactivos y configurables. Estas capacidades identifican y mitigan problemas potenciales antes de que interrumpan las ejecuciones de entrenamiento críticas de "hero", asegurando un mayor goodput y previniendo reinicios costosos para cargas de trabajo de varias semanas.[1]

El Jefe de Ingeniería de Imgix, Alfonso Acosta,