Fenêtre de contexte

La fenêtre de contexte désigne la quantité maximale de texte qu'un modèle de langage peut traiter en une seule interaction. Elle englobe à la fois ce que vous écrivez, les documents que vous fournissez et la réponse que le modèle génère. Si vous dépassez cette limite, les informations les plus anciennes risquent d'être oubliées ou tronquées.

Comment ça fonctionne

La fenêtre de contexte se mesure en tokens, de petites unités de texte. Chaque modèle possède une taille maximale : par exemple plusieurs centaines de milliers de tokens pour les modèles récents. Tout ce qui entre dans la conversation consomme cet espace, y compris le prompt système et l'historique des échanges.

Lorsqu'une conversation devient très longue, le modèle ne « voit » plus le tout début. C'est pourquoi il est parfois utile de résumer les éléments importants ou de relancer une conversation propre.

Pourquoi c'est important

La taille de la fenêtre de contexte détermine ce que le modèle peut « garder en tête ». Une grande fenêtre permet d'analyser un long document, de suivre une conversation détaillée ou de raisonner sur beaucoup d'informations à la fois. À l'inverse, une fenêtre saturée dégrade la qualité des réponses.

Conseil pratique

Placez les informations les plus importantes au début et à la fin de votre message : ce sont souvent les zones que le modèle exploite le mieux.

Exemple

Supposons que vous fournissiez un contrat de cinquante pages à Claude. Si le document tient dans la fenêtre de contexte, le modèle peut le résumer ou répondre à des questions précises dessus. S'il est trop volumineux, une approche de type RAG permet de ne sélectionner que les passages utiles plutôt que de tout charger.

Comprendre cette notion change votre façon de formuler vos demandes. Le cours Claude 101 explique comment structurer vos consignes pour tirer le meilleur parti du contexte disponible.

Comment ça fonctionne

Pourquoi c'est important

Exemple

Termes liés