Historique? AlphaZero AI de DeepMind montre une intuition humaine

L’équipe AlphaZero au travail Crédit: DeepMind
S'il vous plaît partager cette histoire!
Ce n'est qu'une partie d'échecs cette fois, mais dans la vraie vie, voulons-nous vraiment une IA qui «sacrifie volontiers ses soldats pour une meilleure position dans l'escarmouche… accordant beaucoup moins de valeur aux pièces individuelles.»? L'intuition est une caractéristique de l'âme humaine, qu'une IA inerte ne peut jamais reproduire. ⁃ Éditeur TN

Le programme d'intelligence artificielle de DeepMind, AlphaZero, montre maintenant des signes d'intuition et de créativité humaines, dans ce que les développeurs ont qualifié de «tournant» dans l'histoire.

Le système informatique étonné le monde l'année dernière quand il a maîtrisé le jeu d’échecs en quatre heures à peine, bien qu’il n’ait pas été programmé pour gagner.

Mais maintenant, après un an de tests et d’analyses menés par les grands maîtres des échecs, la machine a développé un nouveau style de jeu sans précédent, suggérant que le programme improvise maintenant comme un humain.

Contrairement à la meilleure machine d'échecs au monde - Stockfish - qui calcule des millions de résultats possibles pendant qu'elle joue, AlphaZero apprend de ses succès et échecs passés, en se basant sur un `` sens nébuleux sur lequel tout fonctionnera à long terme. , 'selon les experts de DeepMind.

Lorsque AlphaZero a été opposé à Stockfish dans les jeux 1,000, il n’en a perdu que six, remportant de manière convaincante le 155 fois, et marquant les derniers combats.

Pourtant, c’est sa façon de jouer qui a étonné les développeurs. Alors que les ordinateurs d'échecs préfèrent généralement conserver leurs pièces, AlphaZero a immédiatement sacrifié ses soldats pour une meilleure position dans l'escarmouche.

S'adressant à The Telegraph, le professeur David Silver, qui dirige le groupe de recherche sur l'apprentissage par renforcement chez DeepMind, a déclaré: «Son sens de l'intuition est très subtil, ce qui l'aide à équilibrer les différents facteurs.

«Il possède un réseau de neurones avec des millions de paramètres réglables différents, chacun apprenant ses propres règles de ce qui est bon aux échecs, et quand vous les mettez tous ensemble, vous avez quelque chose qui exprime, à la manière du cerveau, notre capacité humaine à jetez un œil à une position et dites «ah ha c'est la bonne chose à faire».

«Ma conviction personnelle est que nous avons assisté à un tournant décisif dans lequel nous commençons à comprendre que de nombreuses capacités, comme l'intuition et la créativité, que nous pensions précédemment appartenir uniquement à l'esprit humain, sont en réalité accessibles à l'intelligence artificielle. ainsi que. Et je pense que c'est un moment vraiment excitant dans l'histoire. "

AlphaZero a commencé comme un système de «tabula rasa» ou ardoise vierge, programmé uniquement avec les règles de base des échecs et a appris à gagner en jouant des millions de parties contre lui-même dans un processus d'essai et d'erreur appelé apprentissage par renforcement.

C’est la même chose que le cerveau humain apprend, en ajustant ses tactiques sur la base d’une victoire ou d’une perte antérieure, ce qui lui permet de ne rechercher que des milliers de positions 60 par seconde, par rapport au million environ 60 de Stockfish.

En quelques heures à peine, le programme avait découvert et joué de manière indépendante avec des stratégies et des ouvertures humaines communes avant de développer ses propres idées, telles que grouiller rapidement autour du roi de l’opposant et accorder moins de valeur aux morceaux individuels.

Le nouveau style de jeu a été analysé par le grand maître des échecs Matthew Sadler et par le maître international féminin Natasha Regan, qui le disent comme n’importe quel moteur d’échecs traditionnel.

"C'est comme découvrir les cahiers secrets d'un grand joueur du passé", a déclaré Sadler.

Regan a ajouté: «C'était fascinant de voir en quoi l'analyse d'AlphaZero différait de celle des meilleurs moteurs d'échecs et même du meilleur jeu des grands maîtres. AlphaZero pourrait être un outil pédagogique puissant pour toute la communauté. »

Garry Kasparov, ancien champion du monde d'échecs, qui a perdu contre la machine à échouer Deep Blue dans 1997, a déclaré: «Au lieu de traiter les instructions et les connaissances humaines à une vitesse incroyable, comme toutes les machines d'échecs précédentes, AlphaZero génère ses propres connaissances.

"Il joue avec un style très dynamique, un peu comme le mien. Les implications vont bien au-delà de mon échiquier bien-aimé."

Lire l'histoire complète ici…

S'abonner
Notifier de
invité

0 Commentaires
Commentaires en ligne
Voir tous les commentaires