LLM (grand modèle de langage)

Un LLM, ou Large Language Model (grand modèle de langage), est un système d'intelligence artificielle entraîné sur d'immenses volumes de texte afin de comprendre et de produire du langage naturel. Claude est un exemple de LLM : c'est la technologie qui lui permet de rédiger, d'analyser et de raisonner à partir de vos demandes.

Comment ça fonctionne

Un LLM apprend en analysant des milliards de phrases. Pendant cet entraînement, il ajuste des paramètres internes pour repérer les régularités du langage. Une fois entraîné, il fonctionne par prédiction : à partir d'une suite de tokens, il estime le token suivant le plus probable, puis recommence, mot après mot.

Ce mécanisme explique deux caractéristiques importantes. D'abord, le modèle ne « sait » pas vraiment : il reproduit des schémas statistiques. Ensuite, il est limité par sa fenêtre de contexte, c'est-à-dire la quantité de texte qu'il peut traiter en une fois.

Pourquoi c'est important

Les LLM ont rendu accessible une IA générale capable de s'adapter à de nombreuses tâches sans programme spécifique. C'est ce qui permet à un même modèle de traduire, résumer, coder ou converser. Comprendre leur principe aide à mieux les utiliser et à anticiper leurs limites.

Connaissances figées

Un LLM ne connaît que ce qu'il a appris jusqu'à une certaine date. Pour des informations récentes, il faut lui fournir le contexte ou utiliser des approches comme la recherche augmentée.

Exemple

Si vous demandez à un LLM d'expliquer la photosynthèse, il assemble une réponse cohérente à partir de tout ce qu'il a lu sur le sujet. Mais si vous l'interrogez sur un événement très récent, il peut se tromper : ses connaissances sont figées au moment de l'entraînement.

Pour adapter un LLM à un domaine précis, on peut recourir au fine-tuning. Les LLM sont conçus par des laboratoires comme Anthropic. Pour découvrir comment les utiliser au quotidien, commencez par le cours Claude 101.

Comment ça fonctionne

Pourquoi c'est important

Exemple

Termes liés