DeepMind de Google découvre comment se souvenir des résultats, apprendre plus vite

Mémoire AI DeepMind
S'il vous plaît partager cette histoire!

Ce développement est probablement ce qui a poussé le technocrate / transhuman Ray Kurzweil de Google à déclarer que la singularité sera atteinte en 2029 au lieu de 2045. Se souvenir est un résultat dangereux s'ils sont défectueux au départ, ou pire, ont des préjugés contre les entrées qui les ont créés. Sur la base des «souvenirs» de l'IA, l'apprentissage augmentera certainement, mais la poursuite de l'apprentissage sera-t-elle basée sur la réalité ou simplement sur un modèle informatique pieux?  Éditeur TN

Bien que les systèmes d'intelligence artificielle puissent correspondre à de nombreuses capacités humaines, ils mettent beaucoup de temps à apprendre 10. Maintenant, en copiant le fonctionnement du cerveau, Google DeepMind a mis au point une machine qui réduit l'écart.

Les machines intelligentes ont les humains dans leur ligne de mire. Les machines à apprentissage en profondeur possèdent déjà des compétences surhumaines pour des tâches telles que la reconnaissance des visages, le jeu vidéo et même l'ancien jeu chinois de Go. Il est donc facile de penser que les humains sont déjà surexploités.

Mais pas si vite. Les machines intelligentes sont encore à la traîne par rapport aux humains dans un domaine crucial de performance: la vitesse à laquelle elles apprennent. Lorsqu'il s'agit de maîtriser les jeux vidéo classiques, par exemple, les meilleures machines d'apprentissage en profondeur nécessitent environ 200 heures de jeu pour atteindre les mêmes niveaux de compétence que les humains en seulement deux heures.

Les informaticiens adoreraient donc avoir un moyen d’accélérer le rythme d’apprentissage des machines.

Aujourd'hui, Alexander Pritzel et ses amis de la filiale Google de DeepMind à Londres affirment l'avoir fait. Ces gars ont construit une machine d’apprentissage en profondeur capable d’assimiler rapidement de nouvelles expériences et d’agir sur celles-ci. Le résultat est une machine qui apprend beaucoup plus rapidement que les autres et qui peut correspondre aux humains dans un avenir pas trop lointain.

Tout d'abord, un peu de contexte. L'apprentissage en profondeur utilise des couches de réseaux de neurones pour rechercher des modèles dans les données. Lorsqu'un seul calque repère un motif qu'il reconnaît, il envoie ces informations au calque suivant, qui recherche des motifs dans ce signal, etc.

Ainsi, dans la reconnaissance des visages, un calque peut rechercher des contours dans une image, le calque suivant des motifs de contours circulaires (comme ceux créés par les yeux et la bouche) et le suivant pour les motifs triangulaires tels que ceux formés de deux yeux et d'une bouche. Lorsque tout cela se produit, le résultat final indique qu’un visage a été repéré.

Bien sûr, le diable est dans les détails. Il existe divers systèmes de rétroaction permettant au système d'apprendre en ajustant divers paramètres internes, tels que la résistance des connexions entre les couches. Ces paramètres doivent changer lentement, car un changement important dans une couche peut affecter de manière catastrophique l'apprentissage dans les couches suivantes. C'est pourquoi les réseaux de neurones profonds nécessitent autant de formation et prennent autant de temps.

Pritzel et ses collaborateurs ont abordé ce problème avec une technique appelée contrôle neural épisodique. «Le contrôle épisodique neuronal démontre des améliorations spectaculaires de la vitesse d’apprentissage pour un large éventail d’environnements», expliquent-ils. «De manière critique, notre agent est capable de s’adapter rapidement aux stratégies les plus performantes dès qu’elles sont expérimentées, au lieu d’attendre de nombreuses étapes d’optimisation.»

L'idée de base derrière l'approche de DeepMind est de copier la façon dont les humains et les animaux apprennent rapidement. Le consensus général est que les humains peuvent aborder les situations de deux manières différentes. Si la situation est familière, nos cerveaux en ont déjà formé un modèle, qu'ils utilisent pour déterminer comment se comporter au mieux. Cela utilise une partie du cerveau appelée cortex préfrontal.

Lire l'histoire complète ici…


Regarde aussi La nouvelle IA de Google devient plus intelligente grâce à une mémoire de travail

S'abonner
Notifier de
invité

0 Commentaires
Commentaires en ligne
Voir tous les commentaires