Fine-tuning
Le fine-tuning (ou ajustement fin) est le processus qui consiste à poursuivre l'entraînement d'un modèle d'IA pré-entraîné (par exemple un LLM) sur un jeu de données spécifique à un domaine ou à une tâche, pour spéciali…
Le fine-tuning (ou ajustement fin) est le processus qui consiste à poursuivre l'entraînement d'un modèle d'IA pré-entraîné (par exemple un LLM) sur un jeu de données spécifique à un domaine ou à une tâche, pour spécialiser son comportement sans repartir de zéro.
Il en existe plusieurs variantes : fine-tuning supervisé classique, RLHF (apprentissage par renforcement à partir de feedback humain), DPO (Direct Preference Optimization) et des techniques d'ajustement efficient en paramètres comme LoRA et QLoRA, qui ne modifient qu'une petite partie du modèle.
En 2026, le fine-tuning reste utile pour des cas pointus (style, ton, vocabulaire métier), mais il est souvent supplanté par le RAG et le prompting bien fait, qui sont plus simples à mettre à jour.
