Certif Claude FR

Glossaire

RAG (génération augmentée par récupération)

Le RAG combine un modèle de langage avec une recherche documentaire pour produire des réponses ancrées dans vos données.

Le RAG, ou Retrieval-Augmented Generation (génération augmentée par récupération), est une technique qui combine un modèle de langage avec un moteur de recherche documentaire. Avant de répondre, le système va chercher les informations pertinentes dans une base de connaissances, puis les fournit au modèle pour qu'il rédige une réponse ancrée dans ces sources.

Comment ça fonctionne

Le RAG se déroule en deux temps. D'abord, la phase de récupération : la question de l'utilisateur sert à retrouver les passages les plus proches dans une base de documents, souvent grâce à une recherche par similarité de sens. Ensuite, la phase de génération : ces passages sont insérés dans le prompt, et le LLM rédige sa réponse en s'appuyant dessus.

L'intérêt de cette approche est de ne charger dans la fenêtre de contexte que les extraits utiles, plutôt que des documents entiers.

Pourquoi c'est important

Un modèle seul ne connaît que ses données d'entraînement, figées dans le temps. Le RAG lui donne accès à des informations à jour et propres à votre organisation, sans réentraîner le modèle. Il réduit aussi le risque d'hallucination, puisque la réponse s'appuie sur des sources identifiables.

RAG ou fine-tuning ?

Le RAG est idéal pour des connaissances qui changent souvent. Le fine-tuning, lui, modifie le comportement du modèle. Les deux approches sont complémentaires plutôt que concurrentes.

Exemple

Imaginez un assistant interne pour les ressources humaines. Quand un employé demande « combien de jours de congé puis-je reporter ? », le système recherche la clause concernée dans le règlement de l'entreprise, puis transmet ce passage à Claude, qui formule une réponse précise et citée.

Comparé au fine-tuning, le RAG est plus simple à mettre à jour : il suffit de modifier la base documentaire. Pour comprendre comment intégrer ces approches dans un projet, la certification Certified Architect aborde la conception de solutions fondées sur Claude.

Termes liés