Glossaire
LLM (grand modèle de langage)
Un LLM est un modèle d'IA entraîné sur d'immenses quantités de texte pour comprendre et générer du langage naturel.
Un LLM, ou Large Language Model (grand modèle de langage), est un système d'intelligence artificielle entraîné sur d'immenses volumes de texte afin de comprendre et de produire du langage naturel. Claude est un exemple de LLM : c'est la technologie qui lui permet de rédiger, d'analyser et de raisonner à partir de vos demandes.
Comment ça fonctionne
Un LLM apprend en analysant des milliards de phrases. Pendant cet entraînement, il ajuste des paramètres internes pour repérer les régularités du langage. Une fois entraîné, il fonctionne par prédiction : à partir d'une suite de tokens, il estime le token suivant le plus probable, puis recommence, mot après mot.
Ce mécanisme explique deux caractéristiques importantes. D'abord, le modèle ne « sait » pas vraiment : il reproduit des schémas statistiques. Ensuite, il est limité par sa fenêtre de contexte, c'est-à-dire la quantité de texte qu'il peut traiter en une fois.
Pourquoi c'est important
Les LLM ont rendu accessible une IA générale capable de s'adapter à de nombreuses tâches sans programme spécifique. C'est ce qui permet à un même modèle de traduire, résumer, coder ou converser. Comprendre leur principe aide à mieux les utiliser et à anticiper leurs limites.
Connaissances figées
Un LLM ne connaît que ce qu'il a appris jusqu'à une certaine date. Pour des informations récentes, il faut lui fournir le contexte ou utiliser des approches comme la recherche augmentée.
Exemple
Si vous demandez à un LLM d'expliquer la photosynthèse, il assemble une réponse cohérente à partir de tout ce qu'il a lu sur le sujet. Mais si vous l'interrogez sur un événement très récent, il peut se tromper : ses connaissances sont figées au moment de l'entraînement.
Pour adapter un LLM à un domaine précis, on peut recourir au fine-tuning. Les LLM sont conçus par des laboratoires comme Anthropic. Pour découvrir comment les utiliser au quotidien, commencez par le cours Claude 101.
Termes liés
- TermeTokenUn token est une petite unité de texte que les modèles de langage utilisent pour lire et générer du contenu.
- TermeFenêtre de contexteLa fenêtre de contexte est la quantité maximale de texte qu'un modèle comme Claude peut prendre en compte en une seule fois.
- TermeFine-tuningLe fine-tuning consiste à réentraîner un modèle de langage sur des données spécifiques pour l'adapter à un domaine ou un style.
- TermeAnthropicAnthropic est l'entreprise d'intelligence artificielle qui développe Claude, en mettant l'accent sur la sécurité de l'IA.