Glossaire
Fine-tuning
Le fine-tuning consiste à réentraîner un modèle de langage sur des données spécifiques pour l'adapter à un domaine ou un style.
Le fine-tuning, ou affinage, consiste à poursuivre l'entraînement d'un modèle de langage déjà existant sur un jeu de données plus restreint et spécialisé. L'objectif n'est pas de repartir de zéro, mais d'adapter un LLM généraliste à un domaine, un ton ou un format précis.
Comment ça fonctionne
Un LLM est d'abord entraîné sur d'énormes corpus génériques. Le fine-tuning ajoute une étape : on lui présente des exemples ciblés — des questions-réponses, des documents d'un secteur, un style d'écriture — et on ajuste légèrement ses paramètres internes pour qu'il s'aligne sur ces exemples.
Le résultat est un modèle qui conserve ses capacités générales tout en étant plus performant sur la tâche visée. La qualité de l'affinage dépend directement de la qualité et de la cohérence des données fournies.
Pourquoi c'est important
Le fine-tuning permet d'obtenir un comportement régulier sur des tâches répétitives, ou d'imposer un style maison difficile à décrire entièrement dans un prompt. Il a cependant un coût : il faut préparer les données, lancer l'entraînement, puis maintenir le modèle dans le temps.
Pas toujours nécessaire
Avant de recourir au fine-tuning, essayez un bon prompt et l'approche RAG. L'affinage n'est justifié que lorsque ces méthodes plus simples ne suffisent pas.
Exemple
Une entreprise juridique souhaite que son assistant rédige des clauses dans un style très précis. Plutôt que de répéter de longues consignes à chaque demande, elle affine un modèle sur des centaines de clauses validées. Le modèle adopte alors naturellement le bon vocabulaire et la bonne structure.
Le fine-tuning se distingue du RAG : l'un modifie le modèle, l'autre lui fournit des documents au moment de la réponse. La disponibilité exacte de ces options pour Claude est à vérifier sur le site officiel d'Anthropic. Pour situer ces choix dans une architecture complète, voyez la certification Certified Architect.
Termes liés
- TermeLLM (grand modèle de langage)Un LLM est un modèle d'IA entraîné sur d'immenses quantités de texte pour comprendre et générer du langage naturel.
- TermeRAG (génération augmentée par récupération)Le RAG combine un modèle de langage avec une recherche documentaire pour produire des réponses ancrées dans vos données.
- TermePromptUn prompt est la consigne en langage naturel que vous adressez à Claude pour obtenir une réponse ou déclencher une action.
- TermeAnthropicAnthropic est l'entreprise d'intelligence artificielle qui développe Claude, en mettant l'accent sur la sécurité de l'IA.