Glossaire
Fenêtre de contexte
La fenêtre de contexte est la quantité maximale de texte qu'un modèle comme Claude peut prendre en compte en une seule fois.
La fenêtre de contexte désigne la quantité maximale de texte qu'un modèle de langage peut traiter en une seule interaction. Elle englobe à la fois ce que vous écrivez, les documents que vous fournissez et la réponse que le modèle génère. Si vous dépassez cette limite, les informations les plus anciennes risquent d'être oubliées ou tronquées.
Comment ça fonctionne
La fenêtre de contexte se mesure en tokens, de petites unités de texte. Chaque modèle possède une taille maximale : par exemple plusieurs centaines de milliers de tokens pour les modèles récents. Tout ce qui entre dans la conversation consomme cet espace, y compris le prompt système et l'historique des échanges.
Lorsqu'une conversation devient très longue, le modèle ne « voit » plus le tout début. C'est pourquoi il est parfois utile de résumer les éléments importants ou de relancer une conversation propre.
Pourquoi c'est important
La taille de la fenêtre de contexte détermine ce que le modèle peut « garder en tête ». Une grande fenêtre permet d'analyser un long document, de suivre une conversation détaillée ou de raisonner sur beaucoup d'informations à la fois. À l'inverse, une fenêtre saturée dégrade la qualité des réponses.
Conseil pratique
Placez les informations les plus importantes au début et à la fin de votre message : ce sont souvent les zones que le modèle exploite le mieux.
Exemple
Supposons que vous fournissiez un contrat de cinquante pages à Claude. Si le document tient dans la fenêtre de contexte, le modèle peut le résumer ou répondre à des questions précises dessus. S'il est trop volumineux, une approche de type RAG permet de ne sélectionner que les passages utiles plutôt que de tout charger.
Comprendre cette notion change votre façon de formuler vos demandes. Le cours Claude 101 explique comment structurer vos consignes pour tirer le meilleur parti du contexte disponible.
Termes liés
- TermeTokenUn token est une petite unité de texte que les modèles de langage utilisent pour lire et générer du contenu.
- TermeLLM (grand modèle de langage)Un LLM est un modèle d'IA entraîné sur d'immenses quantités de texte pour comprendre et générer du langage naturel.
- TermePromptUn prompt est la consigne en langage naturel que vous adressez à Claude pour obtenir une réponse ou déclencher une action.
- TermeRAG (génération augmentée par récupération)Le RAG combine un modèle de langage avec une recherche documentaire pour produire des réponses ancrées dans vos données.