chatgpt

ChatGPT en français

Simon Moisselin

7 sept. 2024 • 2 min read

Qu'est-ce que ChatGPT ?

ChatGPT est un chatbot accessible en ligne et une interface d'API développée par OpenAI. Il s'appuie sur un modèle de langage étendu, appelé GPT (Generative Pre-Trained Transformer). Ce dernier inclut certains des modèles les plus avancés jamais créés. Après la phase d'apprentissage, le modèle subit un affinement supplémentaire pour optimiser la qualité de ses réponses générées.

Fonctionnement de ChatGPT

ChatGPT fait partie d'une nouvelle génération de modèles de langage étendus (LLMs) rendus possibles grâce à une technologie nommée "transformers". D'autres LLM remarquables incluent BERT, utilisé par Google pour analyser les requêtes des utilisateurs ; DALL-E, capable de générer des images, et GPT-Neo, un modèle LLM prometteur en open-source.

Différence avec les moteurs de recherche

Alors que ChatGPT est formé sur d'importantes quantités de données issues d'Internet, il se distingue des moteurs de recherche traditionnels par plusieurs aspects :

Il n'effectue pas de crawls web quotidiens.
Les données peuvent être obsolètes, par exemple, ChatGPT 3 utilise des informations jusqu'en 2021.
Le volume des données utilisées pour entraîner le modèle est majeur.
Il utilise un type d'affinage appelé "Reinforcement Learning from Human Feedback" (RLHF).
Des approches spécifiques de ChatGPT, telles que des prompts et des paramètres comme la température.

Évolution de ChatGPT

Diverses générations de technologies d'intelligence artificielle ont conduit à l'émergence de ChatGPT.

Réseaux de neurones feed-forward : Les Réseaux Neurones Artificiels (ANN) se basent sur le fonctionnement des neurones humains. Ils sont organisés en couches et apprennent en dissociant les bonnes et les mauvaises réponses.

Réseaux de neurones récurrents : Un inconvénient des ANN est leur incapacité à gérer des séquences temporelles, ce qui a conduit à la création des Réseaux de Neurones Récurrents (RNN). Ces réseaux permettent de donner des résultats de décision au système en boucle, aidant notamment à la traduction des phrases.

Avancée avec les Transformers : La révélation permettant de développer des modèles comme BERT et ChatGPT est l'introduction des transformers dans un article de 2017 intitulé "Attention is all you need". Ce modèle permet une exécution parallèle plus rapide et introduit le concept "d'auto-attention" pour mieux traiter les longues séquences langagières.

Risques et limitations

Désinformation : Les LLM actuels étant entraînés sur des ensembles de données d'une certaine époque, ils peuvent fournir des informations inexactes. De plus, leur précision dépend de la qualité des données utilisées pour l'apprentissage.

Risques de sécurité : L'utilisation de ChatGPT requiert l'envoi d'informations sur Internet, ce qui peut engendrer des risques pour des données personnelles ou sensibles.

Biais : La présence d'informations biaisées sur Internet pose un défi pour ChatGPT. OpenAI a reconnu que c'est une préoccupation majeure à adresser.

Avenir et perspectives

Utilisation : Bien que ChatGPT ait été conçu pour démontrer cette technologie, de nombreuses entreprises étudient ses applications potentielles, comme la génération de résumés textuels, la création de chatbots avancés, ou encore l'assistance à la rédaction de code.

Coût : Le coût de l'entraînement d'un LLM peut atteindre des millions de dollars, soulevant des défis commerciaux.

Nouveaux domaines technologiques : L'ingénierie des prompts, les embeddings et l'affinage sont cruciaux pour tirer parti de ces nouvelles technologies. Il est prédit que certains aspects de la programmation vont évoluer avec l'émergence de ces technologies.