Data & IA
Qu'est ce qu'un LLM Engineer ?
Fiche de poste LLM Engineer : missions, compétences, salaire, parcours. Recrutement Tech sur-mesure par Bluecoders.
Le LLM Engineer est un ingénieur spécialisé dans la conception, le déploiement et l'optimisation de systèmes basés sur les Large Language Models (GPT, Claude, Gemini, Llama, Mistral). C'est un sous-genre de l'AI Engineer, plus pointu : où l'AI Engineer fait du généraliste IA, le LLM Engineer vit dans les entrailles des modèles de langage.
Son terrain : prompt engineering avancé, fine-tuning, RLHF / DPO, optimisation d'inference (vLLM, TGI), construction d'agents et de systèmes multi-modèles.
Pourquoi recruter un LLM Engineer ?
Quand un produit dépasse le POC "LLM avec un prompt" et entre en phase d'industrialisation, les défis deviennent pointus : comment garantir la qualité à l'échelle ? Comment réduire la latence et le coût ? Comment fine-tuner un modèle open-source pour battre GPT-5 sur un cas d'usage spécifique ? Comment construire un système d'agents qui ne déraille pas ?
Ces questions demandent un LLM Engineer dédié, capable de descendre dans la mécanique des modèles plutôt que de juste les consommer.
Quel rôle joue le LLM Engineer ?
Le LLM Engineer travaille dans une équipe AI / ML / Research. Il rapporte à un Lead ML, un Head of AI ou un CAIO. Il collabore avec les Data Engineers (pour les pipelines de fine-tuning), les MLOps Engineers (pour le serving), et les AI Engineers (pour l'intégration produit).
Son quotidien : POCs sur nouveaux modèles, fine-tuning sur jeux de données internes, optimisation d'inference, construction de pipelines RAG sophistiqués, et expérimentations RLHF/DPO.
Quelles sont les missions du LLM Engineer ?
- Fine-tuner des modèles : SFT, RLHF, DPO sur Llama, Mistral, Qwen, Gemma, modèles propriétaires fine-tunables.
- Optimiser l'inference : quantization (GPTQ, AWQ, GGUF), serving avec vLLM / TGI / Triton, batching, speculative decoding.
- Construire des systèmes RAG avancés : indexation, chunking, hybrid search, reranking, query routing.
- Designer des agents : tool use, planning, multi-step reasoning, agent frameworks (LangGraph, AutoGen).
- Mettre en place les évals : eval frameworks (LangSmith, Promptfoo, custom), benchmarks ciblés.
- Veille scientifique : suivre arXiv, reproduire les papers pertinents pour le business.
Quelles compétences clés ?
Profil très technique avec de réelles bases ML :
- Solide expérience Python (NumPy, PyTorch, Transformers, vLLM, etc.)
- Connaissance approfondie de l'architecture Transformer et des LLMs
- Expérience pratique de fine-tuning (PEFT/LoRA, QLoRA, full fine-tuning)
- Maîtrise des frameworks d'agents et d'orchestration
- Notions GPU/CUDA pour comprendre les contraintes hardware
- Familiarité avec les principaux modèles open et closed-source
Les soft skills
Capacité d'expérimentation rigoureuse (eval-driven development), patience face aux comportements probabilistes, lecture régulière de papers (le domaine bouge chaque semaine), pragmatisme entre "fine-tuner" et "prompt mieux".
Quel salaire pour un LLM Engineer ?
Très tendu sur le marché : junior 60K€-80K€, confirmé 80K€-110K€, senior/lead 110K€-150K€+. Dans les AI labs ou les boîtes très bien fundées (Mistral, Hugging Face, Photoroom, etc.), les enveloppes globales avec equity dépassent largement 200K€.
Comment évolue la carrière d'un LLM Engineer ?
Évolution naturelle vers Lead LLM, Research Engineer dans un lab (Hugging Face, Mistral, DeepMind FR, etc.), Head of AI d'une scale-up, ou création de startup IA. Certains pivotent en Applied Research Scientist, faisant le pont entre recherche académique et produit.
