NZNTV

NOYAUZERONETWORK.ORG / GENEVA, SWITZ.
Science. Des pistes pour rendre les IA plus sobres

INTELLIGENCE Les consommations énergétiques des IA ne cessent de croître. Une solution explorée par les scientifiques consiste à revenir à des structures non plus numériques mais analogiques, basées sur des éléments physiques. Mais attention à l’effet d’empilement, préviennent déjà certains experts.

Plus de 700 millions d’utilisateurs et utilisatrices adressent environ 17,5 milliards de requêtes par semaine au chatbot ChatGPT. Dévoilés par OpenAI à la mi-septembre, ces chiffres mettent en lumière l’ampleur de l’irruption de l’intelligence artificielle (IA) générative dans nos quotidiens. Revers de la médaille : une explosion des demandes en électricité pour le numérique. D’où les recherches de certains scientifiques vers des IA plus sobres, basées non plus sur des réseaux de neurones artificiels mais sur des éléments physiques, comme des montages électriques ou à base d’ondes lumineuses.

L’idée paraît saugrenue, car elle signe un retour vers le passé. Aujourd’hui, nos ordinateurs sont numériques : l’information est codée par des successions de 0 et de 1, puis traitée (pour faire un calcul, par exemple) par des opérations sur ces bits (des comparaisons, des additions, etc.). Mais les premiers ordinateurs fonctionnaient sur un tout autre principe. Ces calculateurs imitaient des systèmes physiques : au lieu de manipuler des 0 et des 1, leurs données étaient représentées par des éléments physiques, comme une tension électrique par exemple. 

L’âge d’or des machines dites analogiques prend fin dans les années 1980. Les ordinateurs numériques deviennent plus rapides et ont l’avantage d’être programmables, c’est-à-dire qu’on peut leur faire exécuter des tâches très diverses juste en leur fournissant la bonne liste d’instructions pour y procéder (un programme). L’intelligence artificielle actuelle n’échappe pas à la tendance numérique. En effet, depuis les années 2010, la puissance de calculs des processeurs graphiques (ou GPU) rend possible un rêve vieux de soixante ans : programmer des réseaux de neurones artificiels sur des ordinateurs.

S’ils avaient pour objectif originel d’imiter la structure du cerveau – une machine à calculer peu énergivore –, les réseaux de neurones artificiels ne lui ressemblent pas vraiment. « Ce sont des programmes qu’on fait tourner sur les ordinateurs, mais le support matériel n’a rien à voir avec un réseau de neurones. Or, quand la forme est adaptée à la fonction, c’est plus efficace », tranche Julie Grollier, chercheuse au laboratoire Albert-Fert. « C’est pourquoi nous cherchons des alternatives », ajoute Ali Momeni, chercheur à l’École polytechnique fédérale de Lausanne.

Imiter le cerveau

Pour ces chercheurs et chercheuses, l’alternative consiste à retourner vers des structures analogiques. Ils ne sont pas les seuls. À la fin de l’été, deux articles publiés à quelques jours d’écart dans la revue Nature s’attaquent à démontrer leur potentiel pour les applications de l’IA. Le premier décrit un système de génération d’images grâce à des ondes lumineuses, tandis que le second fait un bilan de la recherche sur le sujet. « Ce n’est pas surprenant de voir ces études publiées en parallèle. C’est un sujet passionnant, à l’interface de plein de domaines et dont les applications sont importantes », souligne Julie Grollier, coautrice du second papier.

Comment cela fonctionne-t-il concrètement ? « Un réseau de neurones artificiels est une fonction mathématique compliquée qui transforme des entrées selon des paramètres qu’on peut ajuster », détaille Julie Grollier. Or, un système physique peut tout aussi bien constituer cette machine à transformer des données, qui ici prennent la forme de signaux lumineux, sonores, électriques ou autres. 

Ces architectures originales ont un double avantage énergétique. Déjà, à la différence de l’ordinateur numérique, les tâches de calcul et de mémorisation ne sont pas faites dans des espaces distincts mais à proximité, tout comme dans notre cerveau. C’est important, car les ordinateurs classiques consomment des quantités importantes d’énergie uniquement pour transférer les données entre la mémoire et le processeur.

Autre atout : selon le montage choisi, la réalisation d’une tâche peut être assez peu gourmande. C’est le cas du modèle de génération d’images qu’une équipe de l’université de Los Angeles en Californie a présenté dans une récente étude. Celui-ci repose sur une hybridation entre un réseau artificiel avec peu de neurones et des ondes lumineuses. « La partie numérique vient créer du bruit, une sorte d’image mélangée. Celle-ci est convertie en une onde lumineuse puis décodée en passant par un filtre », décrit Aydoğan Özcan, membre de l’équipe. Comme une paire de lunettes, le décodeur modifie le signal lumineux pour le rendre compréhensible.

Et comme une paire de lunettes, une fois confectionné, le décodeur n’a pas besoin d’énergie pour fonctionner, « il interagit avec la lumière de manière passive », complète-t-il. Seule la partie numérique et la création de l’onde lumineuse ont besoin d’électricité. Aydoğan Özcan et ses collègues ont ainsi estimé à quelques joules la génération d’une image par leur système, contre des centaines, voire des milliers, pour les modèles d’IA numériques actuels.

Comme n’importe quel domaine physique (optique, acoustique, spintronique, électronique…) peut être mis à contribution, une diversité de réseaux « physiques » voit actuellement le jour dans les laboratoires de recherche. « On ne sait pas encore quelles sont les meilleures solutions », souligne Julie Grollier.

Neurones magnétiques

La chercheuse et ses collègues, par exemple, jouent avec des objets qui ressemblent davantage à un réseau de neurones. « Nous avons vraiment des composants interconnectés proches du réseau de neurones biologiques », décrit-elle. Ces composants sont des objets qui ne laissent passer que certains électrons (appelés jonctions tunnels magnétiques).

Ce type de montage, ressemblant aux réseaux de neurones, a l’avantage de réussir très bien la plupart des opérations mathématiques faites par les IA aujourd’hui. Ainsi, ils sont adaptés pour faire toutes les tâches des modèles actuels : génération de textes et d’images, reconnaissance vocale, etc. « Et les sorties seraient les mêmes qu’avec des réseaux de neurones artificiels », estime Ali Momeni.

Peu importe le réseau de neurones physiques choisi, il faut l’entraîner avant de pouvoir l’utiliser. Cette étape permet de modifier les composants du système de sorte à le rendre performant sur la tâche visée. Pour l’IA numérique, l’ajustement du système est décidé par un algorithme appelé rétropropagation du gradient. Si la sortie voulue n’est pas la même que celle calculée par le réseau, une erreur est calculée et les connexions entre neurones sont corrigées. « C’est une méthode très performante mathématiquement. Mais dans un réseau de neurones physiques, elle marche très mal », décrit Ali Momeni.

Les scientifiques explorent alors diverses méthodes pour faire apprendre les réseaux physiques. Il est par exemple envisageable de construire un jumeau numérique du réseau de neurones physiques, de réaliser l’entraînement ici (avec la rétropropagation du gradient) puis de s’en servir pour construire le réseau physique prêt à l’usage. « On perd l’avantage énergétique sur l’apprentissage mais une fois que le réseau physique est configuré, il a des qualités supérieures aux processeurs graphiques en termes de vitesse et d’efficacité », souligne Julie Grollier.

Il est néanmoins possible d’éviter l’utilisation d’un jumeau numérique, comme avec l’apprentissage physique local, où l’erreur est calculée plusieurs fois avant la sortie et un ajustement est apporté en cas de dérive. « Le choix de la méthode d’apprentissage dépend de ce que vous recherchez : plus de précision ou plus d’efficacité énergétique », éclaire Ali Momeni.

Le risque de l’effet rebond

En définitive, selon l’entraînement et le type de réseaux de neurones physiques, le système sera plus ou moins précis, adapté pour faire des tâches différentes, facile à déployer à grande échelle, avec une faible consommation électrique, etc. Reste que pour l’heure, les versions analogiques de l’IA sont « encore au stade de la recherche »,fait savoir Julie Grollier. « On fait des petits réseaux et on essaie de fabriquer des puces. »

Pourraient-ils demain remplacer les réseaux artificiels et permettre des usages moins énergivores ? Rien de moins sûr. « Un effet d’empilement est à craindre, met en garde Aurélie Bugeau, du Laboratoire bordelais de recherche en informatique (LaBRI). Même si ces systèmes apparaissaient dans les prochaines années, ils ne remplaceraient pas immédiatement les systèmes actuels. » Ils risquent simplement de s’ajouter à nos usages.

Voire de les multiplier, car si les réseaux physiques consomment peu, il devient possible de les embarquer dans certains objets (montres, lunettes connectées, etc). Et l’effet rebond n’est alors pas loin. « Cela ne veut pas dire qu’il ne faut pas conduire ces recherches, mais il faudrait qu’elles soient accompagnées d’une réflexion », suggère la chercheuse. La sobriété ne viendra pas – ou pas seulement – des innovations, mais avant tout de nos usages.

Charlotte Mauger