Intelligence artificielle : quel impact sur l’environnement ?

Intelligence artificielle : quel impact sur l’environnement ?

On a tous et toutes constaté l’explosion de l’usage de l’intelligence artificielle ces derniers mois, tant dans le cercle professionnel que personnel. Il n’y a plus un logiciel qui sort sans être “powered by AI”, et on a tous un·e ami·e qui répond avec plus d’assiduité à ChatGPT qu’aux messages qu’on lui envoie.

Cet essor s’accompagne évidemment de nombreuses voix qui alertent sur les dangers des intelligences artificielles : nos emplois vont-ils disparaitre ? les intelligences artificielles peuvent-elles nous manipuler avec de fausses informations ? ou encore quel est leur impact sur l’environnement ? Et c’est sur cette dernière question que l’on va s’arrêter. Cet article vise à évaluer l'influence de l'intelligence artificielle sur notre environnement. En d'autres termes, dans quelles mesures chaque requête sur ChatGPT contribue-t-elle à dégrader notre planète ?

Comprendre ce qu’est l’intelligence artificielle pour comprendre son impact environnemental

Afin de garder cet article pratique et utilisable par chacun, j’ai choisi de ne garder dans la définition d’intelligence artificielle (IA) que celle de grands modèles de langage (Large Language Models ou LLM). Les LLM forment une sous-catégorie de ce qu’on appelle l’intelligence artificielle générative (Generative AI). L’IA générative se définit par la construction de modèles permettant de produire de la donnée similaire à la donnée sur laquelle elle a été entrainée. La sous-catégorie des LLM est celle des tâches liées au langage naturel 1. Pour faire simple, on entraine une intelligence artificielle en lui faisant lire les six premiers livres Harry Potter, on lui demande ensuite de finir l’histoire par un dernier tome (c’est l’input ou le prompt), et elle nous produit un livre pour conclure la saga, livre qui sera cohérent parce qu’elle connait le début de l’histoire.

De l’autre côté de notre question, et toujours dans l‘objectif d’avoir quelque chose d’actionnable, je vous propose qu’on calque notre mesure de l’impact environnemental aux grandes lignes de l’analyse du cycle de vie (ACV ou Life Cycle Assessment LCA en anglais). L'ACV est une méthode qui évalue l'impact total d'un produit ou service, en tenant compte de toutes les étapes, de l'extraction des matières premières à la fin de vie, en passant par sa fabrication et son utilisation 3. L'impact est mesuré en kilogrammes équivalent CO2 (CO2e), une unité qui convertit les émissions de gaz à effet de serre selon leur potentiel de réchauffement global sur 100 ans. Cela permet de d’accumuler et de comparer facilement les impacts des différents gaz 4. Par exemple, une tonne de méthane émise par un élevage bovin équivaut à 28 tonnes de CO2e, car le méthane a un pouvoir de réchauffement 28 fois supérieur au CO2 sur une période de 100 ans 5. Voici un tableau pour vous donner un ordre de grandeur du CO2e :

Produit tonnes CO2e par an
Smartphone6 0,014
Jean coton 0,025
Réfrigérateur de 250 litres 0,031
Ordinateur portable 0,042
Un humain en France en 20227 9,2
La France en 2022 623 millions

En revanche cet article n’est pas une publication scientifique, et je ne pourrais faire de mesure précise de chacune des étapes de vie d’un LLM. L’idée est plutôt de suivre la méthode de l’ACV en condensant des écrits déjà produits et en convertissant les mesures estimées en CO2e. On va donc faire de grossières estimations et approximations. Les chiffres résultants de ces calculs doivent être pris avec beaucoup de sens critique.

Ce qui fait tourner l’IA : de la construction des puces électroniques au refroidissement des data centers

Commençons quelque peu par simplifier le modèle en considérant que les LLM n’ont besoin que de data centers (centre de stockage informatique) et de puces électroniques pour fonctionner.

En parallèle d'une révolution logicielle, une révolution matérielle est en cours concernant les puces électroniques. L'IA repose sur des puces capables d'être 10 à 100 fois plus rapides qu'une puce traditionnelle 8. La fabrication de ces puces est un des pôles majeurs d’impact sur l’environnement. En 2021, les émissions de la production de puces en Europe étaient comprises entre 10,7 et 13,7 millions de tonnes de CO2e 9. On va extrapoler ce résultat en considérant que l’Europe représente 8% à 10% de la production mondiale de puces électroniques 10. Donc, les émissions de la production de puces électroniques en 2021 pourraient être estimées entre 133,8 et 137 millions de tonnes de CO2e.

D’après une étude de Data4 11, les data centers européens produisent entre 405 et 625 tonnes de CO2e par mégawatt par an - en excluant la fabrication du matériel électronique. Pour vous donner un repère, la construction seule est responsable de 75 à 105 tonnes de CO2 par mégawatt d'infrastructure construite. En 2023, on estime que les data centers du monde ont consommé 40 000 mégawatt, on peut donc estimer l’impact des data center entre 16,2 millions et 25 millions de tonnes CO2e par an.

Mais il faut bien comprendre que ces data centers et ces puces ne sont pas à usage exclusif de l’intelligence artificielle. D’ailleurs, leur usage principal est plutôt celui d’applications classiques. Nous allons donc essayer de comprendre la part des LLM dans ce copieux gateau qui représente déjà entre 150 et 162 millions de tonnes de CO2e par an, soit l’équivalent des émissions de 17 millions de français par an.

Comparaison CO2e data centers, puces et Pays-Bas

La part de l’IA dans l’utilisation des ressources informatiques mondiales

Les chiffres présentés ci-dessus sont en constante augmentation 12. Les intelligences artificielles contribuent à l'accroissement de notre consommation de ressources informatiques en raison de leur besoin très accru. Certains chercheurs estiment que l’IA représente déjà 10 à 20% de l’utilisation des data centers 16. Explorons les raisons de cette consommation et déterminons quelle part elle représente.

L’entrainement régulier des différents modèles

Une étude révèle que GPT-3, avec ses 175 milliards de paramètres, a généré 552 tonnes de CO2e uniquement pour son entraînement, avant même sa publication 13. GPT-4, doté de dix fois plus de paramètres 14, aurait donc, en théorie, émis 5 552 tonnes de CO2e durant son entraînement. Toutefois, ce chiffre doit être nuancé en considérant les améliorations algorithmiques et les progrès des machines utilisées pour l'entraînement.

Par exemple, un modèle comme Bloom, avec 100 milliards de paramètres, a émis 39,4 tonnes de CO2e lors de son entraînement 17. La diversité des facteurs influençant les émissions des modèles rend difficile la standardisation de leur mesure. Néanmoins, depuis 2021, au moins 33 modèles avec autant ou plus de paramètres que GPT-3 ont été développés, soit environ 8,25 modèles par an 15.

Une estimation prudente suggère que l'entraînement annuel des LLM pourrait représenter 4 554 tonnes de CO2e (552 * 8,25), soit 0,02 % de l'utilisation totale des centres de données. Cette estimation rejoint celle faite par Carbon Direct 18.

L’utilisation des LLM au quotidien

En 2022, Google estimait que 40 % des émissions liées à l'IA provenaient de l'entraînement des modèles, tandis que les 60 % restants étaient attribués à l'inférence, c'est-à-dire aux requêtes effectuées par les utilisateurs sur des plateformes comme ChatGPT 19. Cependant, évaluer l'impact des recherches utilisant un LLM devient complexe, car il est nécessaire de comparer leurs émissions à celles des alternatives qu'elles remplacent. Par exemple, une recherche sur ChatGPT pourrait remplacer une recherche Google.

On sait qu’une recherche Google émet 0,2 grammes de CO2e 20, et qu'une recherche ChatGPT en émet dix fois plus, soit 2 grammes de CO2e 21. En 2024, Google a enregistré 14 milliards de recherches par jour, contre 37,5 millions pour ChatGPT 22. Cela se traduit par 1,02 million de tonnes de CO2e pour Google contre 27 375 tonnes de CO2e pour ChatGPT, sur une base annuelle.

comparaison CO2e google chatgpt

Cependant, Google intègre également de l'IA dans son moteur de recherche, et la majorité des logiciels font de même. Cette intégration généralisée complique l'évaluation précise de l'impact environnemental des requêtes sur les LLM, car il devient difficile de distinguer les émissions spécifiques attribuables à l'IA des autres composantes logicielles.

Faisons une pause. J'ai commencé cet article avec l'intention de mettre en lumière l'impact alarmant des IA sur l'environnement, mais je constate que les chiffres actuels ne sont pas aussi préoccupants que prévu. Cependant, il est évident que l'ensemble du secteur informatique doit adopter une approche plus sobre. La tendance actuelle pourrait devenir exponentielle, et dans dix ans, la situation pourrait être bien plus inquiétante. De plus, il est très difficile de mesurer précisément les émissions attribuables à l'IA, car elles sont souvent estimées de manière approximative. Cela dit, je me demande si l'IA ne pourrait pas, au contraire, offrir des solutions pour réduire notre impact environnemental.

L’intelligence artificielle qui compense son impact environnemental

En explorant les applications de l'intelligence artificielle au-delà des grands modèles de langage, on découvre rapidement son potentiel pour stimuler l'innovation, notamment dans le domaine environnemental. Un rapport de 2018, bien que daté, produit par PwC et le Stanford Woods Institute for the Environment, illustre plusieurs exemples d'impact positif 22 :

  1. Optimisation des Ressources Naturelles :
    • Agriculture Précise : L'IA optimise l'utilisation des ressources comme l'eau et les engrais, améliorant l'efficacité agricole et réduisant le gaspillage.
    • Gestion de l'Énergie : Les réseaux électriques intelligents, alimentés par l'IA, optimisent la distribution et la consommation d'énergie, favorisant l'intégration des énergies renouvelables.
  2. Surveillance et Protection de l'Environnement :
    • Surveillance des Écosystèmes : Les drones et satellites équipés d'IA surveillent les écosystèmes en temps réel, détectant des changements comme la déforestation et la pollution, essentiels pour la préservation des habitats.
    • Prévention des Catastrophes Naturelles : L'IA améliore la prévision des catastrophes naturelles, permettant une meilleure préparation et des interventions rapides.
  3. Énergies Renouvelables et Efficacité Énergétique :
    • Prévision et Gestion des Énergies Renouvelables : L'IA optimise la production d'énergie renouvelable en améliorant le placement et la gestion des installations.
    • Efficacité Énergétique des Bâtiments : Les systèmes de gestion de l'énergie basés sur l'IA réduisent la consommation d'énergie dans les bâtiments en ajustant automatiquement le chauffage et l'éclairage.
  4. Réduction des Déchets et Recyclage :
    • Optimisation de la Gestion des Déchets : L'IA améliore le tri et le recyclage des déchets, augmentant ainsi les taux de recyclage.
    • Réduction des Déchets Alimentaires : Les systèmes d'IA analysent les chaînes d'approvisionnement pour identifier et réduire le gaspillage alimentaire.
  5. Conservation de la Biodiversité :
    • Protection des Espèces Menacées : L'IA surveille et protège les espèces menacées en analysant les données des capteurs et des caméras pour détecter les activités illégales.

Sans nécessairement chiffré ces initiatives, elles nous donnent des secteurs d’exploitation raisonnés de l’intelligence artificielle qui lui permettrait de combler son impact relativement néfaste sur l’environnement.

Comment rendre l’intelligence artificielle plus respectueuse de l’environnement ?

L’un des avantages de décortiquer l’empreinte environmental de l’intelligence artificielle est de pouvoir trouver des solutions concrètes pour répondre à chacun des points d’inquiétude. En voici une liste non-exhaustive.

Mieux concevoir les data centers

  • Refroidissement Efficace : Utiliser des méthodes de refroidissement comme le refroidissement par air libre, évaporatif, ou par immersion pour réduire la consommation d'énergie et d'eau. Ces techniques permettent de diminuer l'empreinte environnementale des centres de données 23.
  • Énergie Renouvelable : Privilégier les sources d'énergie renouvelable pour alimenter les centres de données, ou au moins des sources d'énergie décarbonées. Cela contribue à réduire les émissions de gaz à effet de serre associées à l'exploitation des infrastructures numériques 23.

Fabriquer des puces plus performantes à moindre coût énergétique

  • Innovations : Google a démontré, en utilisant la méthode de l'analyse du cycle de vie, qu'il avait déjà amélioré l'efficacité carbone de ses puces par trois 24. Les puces TPU de Google et les GPU de NVIDIA offrent de meilleures performances à moindre coût énergétique.

Optimiser les algorithmes

  • Efficacité Algorithmique : Améliorer l'efficacité des algorithmes utilisés par les grands modèles de langage (LLM) peut réduire leur consommation énergétique. Cela inclut des techniques comme la quantification, la distillation de modèles, et l'utilisation de modèles plus légers lorsque cela est possible 25.
  • Réduction de la Complexité : Simplifier les opérations mathématiques et réduire la taille des réseaux neuronaux pour diminuer la charge de calcul et la consommation d'énergie, sans compromettre significativement la performance 23.

Mieux se servir de l’IA

  • Orchestration des Charges de Travail : Utiliser des logiciels pour optimiser le moment et le lieu d'exécution des charges de travail d'IA afin de réduire la consommation d'énergie. Par exemple, déplacer les charges de travail vers des périodes de faible demande énergétique 23.
  • Bien Choisir son Modèle : Choisir des modèles d'IA adaptés aux besoins spécifiques pour éviter les surcharges inutiles. Par exemple, utiliser des modèles plus légers pour des tâches moins exigeantes peut réduire la consommation d'énergie sans sacrifier la qualité des résultats 26.

Conclusion

J’aurais voulu conclure cet article en disant : “Voilà, votre prochaine recherche sur ChatGPT émettra 2 kg de CO2e.” Mais la réalité de l’impact environnemental des intelligences artificielles est bien plus complexe. Cet impact est enchevêtré avec notre usage actuel de l’informatique, et l’isoler dans son ensemble est une tâche que cet article écrit en quelques jours ne peut surmonter.

Je dois toutefois avouer ma surprise face à l’échelle des résultats présentés, que j’imaginais bien plus importants. Cependant, il faut analyser ces données avec intelligence et les considérer non pas comme un état figé, mais comme le début d’une révolution. Les quelques milliers de tonnes de CO2e émises par l’IA ne sont que la fumée d’un feu qui pourrait rapidement devenir incontrôlable.

Il existe toutefois des usages et des solutions qui peuvent nous permettre de garder la main et de continuer à utiliser l’IA comme un outil au bilan carbone favorable.

En attendant, si vous souhaiter prolonger la lecture avec un article plus technique et complet sur la durabilité des intelligences artificielles, je vous invite à consulter Towards Sustainability of AI: A Systematic Review of Existing Life Cycle Assessment Approaches and Key Environmental Impact Parameters of Artificial Intelligence

Et je ne peux que vous inviter à utiliser le calculateur de ecologits.ai - dont le travail est remarquable - qui vous permet d’avoir une idée de l’impact de vos discussions avec votre LLM préféré : https://huggingface.co/spaces/genai-impact/ecologits-calculator

Sources