NVIDIA CUDA 13.3 : Python stable et nouveau modèle C++ boostent les GPU

Presque 15 ans que je radeau sur ces cartes graphiques comme un naufragé sur son GPU, et chaque fois que NVIDIA lâche une nouvelle version de CUDA, c’est la même chose : les développeurs applaudissent, les admins système pleurent, et moi je dois tout réparer. Cette fois, avec CUDA 13.3, les mecs poussent le curseur un peu plus loin. Python passe officiellement en version 1.0 stable – oui, stable, pas en bêta, pas en « ça compile si t’as de la chance ». Et ils ont aussi balancé CUDA Tile directement dans le toolkit C++, un modèle de programmation qui sent bon le neuf et le prometteur. Autant dire que si t’es dev ou sysadmin, tu vas encore passer un quart d’heure à tout reinstaller.

Moi, Marc, technicien qui a vu plus de CUDA planté que de codes propre en prod, je te dis tout de suite : cette version, c’est du lourd. Mais comme d’hab, NVIDIA a oublié de préciser que ton Windows Update va encore tout casser. Alors accroche-toi, on va décortiquer ça sans bullshit.

Python en version 1.0 : enfin stable, enfin utilisable (si t’as la patience)

Trois ans que les mecs de NVIDIA nous bassinaient avec « Python va être stable bientôt ». Et bien devinez quoi ? C’est fait. Python 1.0. En théorie, ça signifie que tu peux enfin déployer du code Python en production sur tes GPU sans avoir peur que ton notebook Jupyter explode au premier calcul matriciel.

Moi, la semaine dernière, j’ai dû passer deux jours à expliquer à un client pourquoi son script de deep learning plantait en prod alors qu’il marchait nickel en local. La réponse ? Le runtime CUDA 12.2 avait un bug avec numpy + GPU. Alors oui, Python stable, c’est une bonne nouvelle. Mais bon, soyons honnêtes : stable ne veut pas dire parfait.

Ce qui change concrètement ?

Plus de versions « Preview » – tu peux enfin te fier à la doc officielle sans avoir à chercher des forks sur GitHub.
Meilleure intégration avec PyTorch et TensorFlow – ces deux-là ont enfin compris que les GPU NVIDIA, c’est pas qu’un accessoire.
Moins de segfaults mystérieux – niveau crashs aléatoires, on gagne un peu. Pas zéro, mais un peu.

Et maintenant, la partie que tu attends tous : les problèmes. Parce que bon, c’est moi qui dois les résoudre.

Le vrai problème : ta machine Windows va encore tout casser

Oui, je sais, t’as Windows. Et oui, t’as fait ta mise à jour hier soir. Et oui, ton CUDA 13.3 n’installera pas proprement. Deux erreurs classiques que je vois tous les jours :

L’installateur qui plante parce que Visual Studio (ou pire, Visual Studio Code) a décidé de mettre à jour ses composants en même temps.
Le driver graphique qui refuse de se mettre à jour correctement, laissant ton système avec deux versions de CUDA qui se marchent dessus comme des ados dans un ascenseur.

Anecdote vécue : un client m’appelle parce que son script Python qui marchait la veille ne voit plus ses GPU. Je débarque, je regarde : le driver est en version 535, mais l’outil de diagnostic affiche « GPU detected: None ». Après 20 minutes de recherche, je trouve trois versions de CUDA installées en parallèle, dont une qui date de 2021. Le pire ? Son antivirus avait bloqué l’installation de CUDA Toolkit. Résultat : Python voyait bien le GPU, mais CUDA Runtime était corrompu. Un classique.

Alors ma recommandation : désinstalle CUDA à la mano avant de réinstaller, et vérifie que ton système est clean. Sinon, bon courage pour expliquer à ton boss pourquoi ton cluster GPU est en PLS.

CUDA Tile débarque en C++ : le nouveau jouet des devs qui veulent tout casser

Si Python, c’est pour les devs qui veulent faire joli dans leurs notebooks, CUDA Tile, c’est pour ceux qui veulent écrire du code qui tue. Nouveau modèle de programmation intégré directement dans CUDA 13.3 pour C++, CUDA Tile permet de gérer des tiles (des tuiles, des blocs de données) nativement dans le code, sans avoir à bidouiller des kernels manuellement.

Pour les non-initiés, un kernel en CUDA, c’est un peu comme un V8 dans une Porsche : ça fait tourner le moteur, mais si tu veux modéliser un virage serré, tu dois tout coder toi-même. Avec CUDA Tile, NVIDIA te donne un peu le volant tout fait. Moins de boilerplate, plus de performance.

Moi, je vois deux cas d’usage principaux :

Le traitement d’images haute résolution – enfin, un moyen propre de découper une image 8K en morceaux gérables par le GPU.
Le calcul scientifique lourd – les physiciens adorent déjà, et moi je déteste déjà devoir optimiser leurs kernels manuellement.

Mais attention, comme toujours avec les nouveautés de NVIDIA, il y a un hic : la doc est encore en beta. Traduction : tu vas passer deux heures à chercher pourquoi ton __global__ void Tile ne compile pas, alors que le code est « officiellement supporté ».

Pourquoi CUDA Tile va tout changer (et pourquoi ça va encore me faire perdre du temps)

En théorie, CUDA Tile simplifie l’écriture de code parallèle en gérant automatiquement la répartition des données sur les cœurs du GPU. En pratique, ça signifie :

Moins de fautes de segmentation (enfin, normalement).
Une meilleure scalabilité sur les GPU multi-cœurs (RTX 4090, A100, etc.).
Moins de code boilerplate à écrire. Oui, c’est un peu magique.

Mais attention, la magie a un prix. Comme tout ce qui sort des labos NVIDIA, ça ne marche bien que si tu as :

Le dernier driver graphique.
La dernière version de CUDA Toolkit.
Et surtout, que ton système ne soit pas déjà un bordel sans nom avec trois versions de CUDA installées.

Je me souviens d’un client qui voulait absolument utiliser CUDA 13.3 pour son modèle de ML. Résultat ? Son code compilait, mais les performances étaient pires qu’avec CUDA 12.4. Après investigation (merci, strace), je découvre que son système utilisait encore des old-school C++/CUDA bindings compatibles avec CUDA 10.x. Le pire ? Il avait payé un « expert » pour faire ça. Mon diagnostic : « T’as payé pour un truc qui fait ralentir ton code. » Sa réponse : « Oui, mais il avait un bon CV. »

Est-ce que CUDA 13.3 vaut le coup ? Mon avis de tech qui en a ras-le-bol

Alors, franchement ? Oui, mais sous conditions. Si tu es un dev qui veut écrire du code propre sans te prendre la tête avec les kernels manuels, CUDA Tile est une pépite. Si tu es un data scientist qui veut juste faire tourner son notebook sans que Python explose, Python 1.0 est une bonne nouvelle.

Mais si tu es un sysadmin comme moi, prépare-toi à passer une semaine à debugguer des conflits de drivers, des versions de CUDA qui se marchent dessus, et des scripts Python qui refusent de voir les GPU parce qu’un antivirus a décidé de bloquer l’installation.

Mon conseil ?

Fais un backup de tes environnements Python avant de toucher à CUDA 13.3. Vraiment.
Installe CUDA Toolkit dans un environnement isolé (conda, Docker, peu importe).
Vérifie que ton système n’a pas de versions fantômes de CUDA qui traînent. (Spoiler : elles sont là, j’en suis sûr.)
Si t’es sous Windows, prépare-toi à redémarrer trois fois avant que le driver graphique accepte enfin de se mettre à jour.

Et surtout, ne fais pas comme ce client qui a installé CUDA 13.3 en même temps que sa MAJ Windows. Résultat : son système a planté, son GPU a disparu, et il a fallu reinstaller Windows depuis zéro. Oui, ça arrive. Non, je n’exagère pas.

Le futur de CUDA : où va NVIDIA ? (Spoiler : vers plus de bordel)

Avec CUDA 13.3, NVIDIA confirme une chose : son écosystème GPU est devenu trop complexe pour être géré proprement. Entre les versions de CUDA qui s’empilent, les drivers qui se marchent dessus, et les frameworks (PyTorch, TensorFlow, JAX) qui évoluent à leur rythme, gérer un cluster GPU proprement, c’est comme essayer de faire cuire un steak sur un barbecue en feu : ça finit toujours en bordel.

Mais bon, à quoi tu t’attendais ? NVIDIA, c’est l’entreprise qui nous a donné « OpenCL est une merde » avant de se rendre compte que tout le monde l’utilisait (sauf ses GPU). Alors oui, CUDA est puissant. Oui, CUDA Tile est prometteur. Oui, Python 1.0 est une bonne nouvelle.

Mais prévois du temps pour tout reinstaller proprement. Parce que moi, Marc, je te le dis : dans deux semaines, je vais encore avoir des clients qui m’appellent parce que leur script Python ne voit plus leur GPU, ou parce que CUDA Tile plante avec un message d’erreur incompréhensible.

Et devine quoi ? Le problème sera toujours le même : une version de CUDA fantôme qui traîne, un driver graphique pas à jour, ou un système Windows qui a encore tout cassé.

Alors oui, CUDA 13.3 est une bonne nouvelle pour l’écosystème GPU. Mais si tu veux éviter de perdre ton temps, lisez la doc, isolez vos environnements, et préparez-vous au pire.

Pour aller plus loin : où trouver les infos (et les bugs)

Si t’as envie de te lancer, voici les ressources officielles – enfin, celles qui ne sont pas déjà obsolètes :

Télécharger CUDA 13.3 – attention, la page pèse 2 Go, et ton disque dur va grogner.
Release Notes CUDA 13.3 – à lire absolument, parce que sinon tu vas te prendre des surprises.
Libcudacxx pour CUDA Tile – la doc est en beta, mais bon, c’est mieux que rien.

Et sinon, pour les problèmes, le forum NVIDIA Developer est toujours là pour te sauver la mise. Enfin, si tu arrives à trouver la bonne section parmi les 57 sous-forums.

Et sinon, si tu veux un avis plus technique que le mien, je te conseille l’article de Korben – lui, au moins, il sait de quoi il parle (et il cite ses sources, ce qui est rare de nos jours).