Le nom de ChatGPT est un mot-valise. Il vise à expliquer la façon dont fonctionne cet agent conversationnel, capable d’imiter une discussion naturelle.

C’est une combinaison de lettres qui prête à sourire en français, mais qui n’est pas dénuée de sens en anglais. Le nom choisi pour baptiser ChatGPT, l’agent conversationnel développé par l’entreprise américaine OpenAI, a une signification précise, qui sert à décrire le travail effectué par ce programme informatique quand on interagit avec lui.

ChatGPT est un mot-valise composé de « chat » et « GPT ». Le premier terme est simple à comprendre : il s’agit de désigner les discussions instantanées que l’on a avec d’autres internautes (sauf qu’ici, on s’adresse à un système reposant sur des algorithmes avancés en intelligence artificielle). Parfois, on écrit tchat en français, pour faire le distinguo avec le félin.

Quant à GPT, c’est un acronyme signifiant « Generative Pre-trained Transformer », que l’on pourrait approximativement traduire par « Transformateur génératif pré-entraîné ». La formulation est complexe, mais elle désigne en somme la faculté de ChatGPT à donner l’illusion d’une conversation naturelle, comme si l’on parlait à une autre personne.

Un système entraîné sur de grandes quantités de textes

ChatGPT a été entraîné à partir de très nombreuses données textuelles — d’où cette notion de pré-entrainement que l’on trouve dans son nom. Sa force est de produire des réponses structurées et articulées, grâce aux méthodes courantes que l’on retrouve dans le domaine de l’intelligence artificielle, en particulier celles de l’apprentissage automatique.

Précisément, ChatGPT repose sur une approche d’apprentissage par renforcement, mais également supervisée — c’est-à-dire avec un ajustement humain dans le processus d’assimilation. L’apprentissage par renforcement est l’équivalent d’une sorte de cours théorique : on montre au système des exemples auxquels on associe une notion, pour apprendre à faire le lien.

ChatGPT Midjourney
ChatGPT a basé son apprentissage sur des ressources textuelles. Allégorie. // Source : Midjourney

Quant à la supervision, elle s’est manifestée lorsque « des formateurs humains en IA ont fourni des conversations dans lesquelles ils ont joué des deux côtés : l’utilisateur et un assistant en IA », précise ChatGPT. Les réponses qu’ils ont fournies ont été intégrées aux données d’un autre modèle, InstructGPT. Le tout a été adapté pour simuler un dialogue entre l’IA et l’internaute.

ChatGPT est la dernière itération des modèles de langages conçus par OpenAI. L’agent conversationnel est une déclinaison spécialisée de GPT-3.5, dont la mise au point a été terminée début 2022. Avant lui, d’autres modèles de langage ont été inventés, dont GPT-3, qui avait fait parler de lui au tournant des années 2020.


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.