LLMOps
Le LLMOps est une discipline dérivée du MLOps, dédiée aux spécificités d'opération en production des applications basées sur des LLM : gestion des prompts comme du code, évaluation continue, observabilité des appels mod…
Le LLMOps est une discipline dérivée du MLOps, dédiée aux spécificités d'opération en production des applications basées sur des LLM : gestion des prompts comme du code, évaluation continue, observabilité des appels modèles, gestion des coûts en tokens, monitoring des hallucinations et des dérives, déploiement de versions de prompts ou de modèles.
Il recouvre des outils transverses : versionning de prompts (Promptfoo, PromptLayer), évaluation (Braintrust, Humanloop, LangSmith), observabilité (Langfuse, Helicone, Arize), gestion des secrets et limitation de débit, plus toute la stack RAG (bases vectorielles, ingestion, retrieval).
C'est l'un des sujets les plus chauds en 2026 : déployer un POC est facile, opérer un LLM à l'échelle et en sécurité reste le vrai défi.
