En octobre dernier, l’on apprenait l’existence de la petite sœur d’AlphaGo (l’I.A. qui a roulé sur tous les champions de Go en 2016), qui s’annonçait encore plus puissante que son aînée, notamment pour sa capacité à apprendre sans une aide humaine. AlphaZero vient de démontrer une partie de son potentiel sur un jeu d’Échecs.
Now the era of computer chess engine programming also seems to be over: AlphaZero, developed by @DeepMindAI & @demishassabis, took just 4 hours playing against itself to learn to play better than Stockfish (it won 64:36)! Replay 10 example games: https://t.co/cBEuoEFMTN #c24live pic.twitter.com/U2bn1KyJbL
— chess24.com (@chess24com) 6 décembre 2017
Ce qui est impressionnant chez AlphaZero, c’est qu’elle n’a pas eu besoin d’emmagasiner des millions de parties humaines pour apprendre à maîtriser le jeu, contrairement à AlphaGo avec le jeu de Go. Seules les règles du jeu et la position des pièces sur le plateau lui ont suffit ; elle a alors pu enchaîner des millions de parties contre elle-même et progresser petit à petit. C’est ce qu’on appelle un apprentissage de renforcement général.
• Lire aussi : [Interview] Nous avons posé quelques questions à deux scientifiques au sujet du robot joueur de Go
Des progrès fulgurants
Après neuf heures et 44 millions de parties « d’entrainement », AlphaZero s’est donc mesurée à Stockfish, un puissant programme d’Échecs en open source. En quatre heures d’apprentissage, elle a pu résister au programme concurrent, et sur 100 matchs, elle en a gagné 28, concédant rien de moins qu’un nul sur les autres manches.
Au delà de son invincibilité, un des points les plus intéressants de sa performance réside dans le fait qu’AlphaZero n’avait pas besoin d’explorer une quantité très importante de coups, note Chess24. 80 000 positions étaient analysées par AlphaZero contre 70 millions pour Stockfish, AlphaZero étant capable, par son réseau neuronal, de réduire le corpus des coups pouvant être joués à ceux qui étaient les plus prometteurs.
• Lire aussi : Le boss de l’intelligence artificielle sera le maitre du monde, selon Vladimir Poutine
Vers une intelligence artificielle plus fine
On se rapproche ici d’une intelligence humaine, qui pourrait ouvrir bien de nouvelles perspectives dans plein d’autres domaines, comme l’espèrent ses créateurs. Même si, comme l’expliquait Tristan Cazenave au journal Le Monde en octobre dernier, cette méthode d’apprentissage nécessite que le cadre soit très défini et que les règles soient claires et ne permettent pas d’imprévu.
Si vous voulez avoir plus de détails sur le duel entre AlphaZero et Stockfish, Chess24 a écrit un très éclairant compte-rendu.
[ad_2]
Source link