Google Cloud booste Vertex AI avec les VM A4X et NVIDIA GB200 NVL72 : Percées AI de GTC 2026

Google Cloud vient de dévoiler des mises à niveau révolutionnaires pour Vertex AI lors de NVIDIA GTC 2026, incluant le support des VM A4X pour les racks NVIDIA GB200 NVL72 et l'entraînement résilient sur plusieurs semaines. Découvrez comment ces avancées, plus Gemini 3.1 Flash-Lite et Nemotron 3 Super 120B, positionnent Vertex AI comme leader en AI agentique.

Google Cloud booste Vertex AI avec les VM A4X et NVIDIA GB200 NVL72 : Percées AI de GTC 2026

Publié : 21 mars 2026

Quelques jours seulement après l'effervescence de NVIDIA GTC 2026, Google Cloud fait des vagues dans le monde de l'AI avec des mises à niveau transformatrices pour Vertex AI. Annoncées lors de l'événement, ces améliorations incluent le support des VM A4X pour les systèmes à l'échelle rack NVIDIA GB200 NVL72, la résilience matérielle pour des jobs d'entraînement ininterrompus sur plusieurs semaines, et un Model Garden Vertex AI étendu mettant en vedette NVIDIA Nemotron 3 Super 120B et Nemotron 3 Nano. Couplées aux sorties récentes comme la prévisualisation publique de Gemini 3.1 Flash-Lite et Vector Search 2.0 GA, Vertex AI consolide sa position de plateforme leader pour l'entraînement d'AI agentique en entreprise.[1]

Améliorations de l'infrastructure : Propulsion de l'entraînement AI à grande échelle

À GTC 2026, Google Cloud a mis en lumière son partenariat approfondi avec NVIDIA, en se concentrant sur les clusters d'entraînement Vertex AI capables de répondre aux exigences de la AI de nouvelle génération. La star du spectacle ? Le support des domaines VM A4X sur les systèmes à l'échelle rack NVIDIA GB200 NVL72. Cette intégration permet aux entreprises d'exploiter l'infrastructure gérée de Vertex AI pour un entraînement à très grande échelle, sans les complications des configurations personnalisées.[1]

Pour relever les défis des jobs à longue durée, Google a introduit des fonctionnalités de résilience matérielle avec des scans de détection de pannes proactifs et configurables. Ces capacités identifient et atténuent les problèmes potentiels avant qu'ils ne perturbent les exécutions d'entraînement critiques « hero », garantissant un meilleur goodput et évitant les redémarrages coûteux pour les charges de travail sur plusieurs semaines.[1]

VM A4X : Optimisées pour NVIDIA GB200 NVL72, permettant une mise à l'échelle fluide pour l'AI agentique.
Résilience matérielle : Scans proactifs pour un entraînement ininterrompu.
VM G4 fractionnées : En prévisualisation, alimentées par NVIDIA RTX PRO 6000 pour une allocation GPU flexible.[1]

Responsable de l'ingénierie chez Imgix, Alfonso Acosta, "