Fine-tuning

Le fine-tuning, ou affinage, consiste à poursuivre l'entraînement d'un modèle de langage déjà existant sur un jeu de données plus restreint et spécialisé. L'objectif n'est pas de repartir de zéro, mais d'adapter un LLM généraliste à un domaine, un ton ou un format précis.

Comment ça fonctionne

Un LLM est d'abord entraîné sur d'énormes corpus génériques. Le fine-tuning ajoute une étape : on lui présente des exemples ciblés — des questions-réponses, des documents d'un secteur, un style d'écriture — et on ajuste légèrement ses paramètres internes pour qu'il s'aligne sur ces exemples.

Le résultat est un modèle qui conserve ses capacités générales tout en étant plus performant sur la tâche visée. La qualité de l'affinage dépend directement de la qualité et de la cohérence des données fournies.

Pourquoi c'est important

Le fine-tuning permet d'obtenir un comportement régulier sur des tâches répétitives, ou d'imposer un style maison difficile à décrire entièrement dans un prompt. Il a cependant un coût : il faut préparer les données, lancer l'entraînement, puis maintenir le modèle dans le temps.

Pas toujours nécessaire

Avant de recourir au fine-tuning, essayez un bon prompt et l'approche RAG. L'affinage n'est justifié que lorsque ces méthodes plus simples ne suffisent pas.

Exemple

Une entreprise juridique souhaite que son assistant rédige des clauses dans un style très précis. Plutôt que de répéter de longues consignes à chaque demande, elle affine un modèle sur des centaines de clauses validées. Le modèle adopte alors naturellement le bon vocabulaire et la bonne structure.

Le fine-tuning se distingue du RAG : l'un modifie le modèle, l'autre lui fournit des documents au moment de la réponse. La disponibilité exacte de ces options pour Claude est à vérifier sur le site officiel d'Anthropic. Pour situer ces choix dans une architecture complète, voyez la certification Certified Architect.

Comment ça fonctionne

Pourquoi c'est important

Exemple

Termes liés