Du machine learning classique aux architectures LLM et aux outils MLOps — les termes essentiels pour comprendre ce métier et ses outils en 2026.
- A/B Testing (ML)
— - Comparaison en production de deux versions d'un modèle sur des sous-ensembles d'utilisateurs pour valider l'amélioration réelle avant un déploiement complet.
- AutoML
— - Automatisation des étapes répétitives du pipeline ML (feature engineering, sélection de modèle, hyperparameter tuning). Exemples : AWS AutoPilot, Google AutoML, H2O.ai.
- BERT / Transformers
— - Architecture de deep learning basée sur le mécanisme d'attention, fondement de la plupart des LLMs modernes (GPT, Mistral, Llama). BERT est la variante bidirectionnelle de Google.
- BentoML
— - Framework open-source de déploiement de modèles ML en API REST et workers asynchrones. Alternative légère à Seldon ou SageMaker Endpoints pour les équipes autonomes.
- Causal AI
— - Approche qui modélise les relations de causalité (et non de corrélation) entre variables. Pertinente pour des décisions business où l'intervention (pricing, traitement) impacte l'outcome.
- Computer Vision
— - Domaine du ML traitant les images et vidéos : classification, détection d'objets, segmentation sémantique. Frameworks dominants : PyTorch + torchvision, Ultralytics YOLO.
- Data Drift
— - Changement statistique des données de production par rapport aux données d'entraînement, entraînant une dégradation des performances du modèle. Détecté par des outils comme Evidently AI.
- DVC
— - Data Version Control — outil de versionnement des datasets et expériences ML, analogue à Git mais pour les données et artefacts de modèles. Clé dans une pipeline MLOps reproductible.
- Deep Learning
— - Sous-domaine du ML utilisant des réseaux de neurones profonds (nombreuses couches). Fondement de la Computer Vision, du NLP et des LLMs. Frameworks : PyTorch, TensorFlow/Keras.
- Embedding
— - Représentation vectorielle dense d'une donnée (texte, image, utilisateur) dans un espace de haute dimension. Base des moteurs de recommandation, de la recherche sémantique et des architectures RAG.
- Evidently AI
— - Outil open-source de monitoring de modèles ML en production : détection de data drift, dégradation de performance, rapports de qualité des données. Standard du marché MLOps.
- Feature Engineering
— - Processus de création et sélection des variables explicatives (features) à partir des données brutes pour améliorer les performances d'un modèle ML. Étape souvent la plus déterminante.
- Feature Store
— - Infrastructure centralisée pour stocker, partager et réutiliser les features calculées entre différents modèles et équipes. Évite la duplication et garantit la cohérence training/inference.
- Fine-tuning (LLM)
— - Réentraînement d'un LLM pré-entraîné sur un corpus de données propriétaires pour l'adapter à un domaine ou un style particulier. Méthodes : LoRA, QLoRA, instruction tuning.
- GGUF / Quantization
— - Format de stockage compressé pour les LLMs (GGUF remplace GGML) permettant d'exécuter des modèles de grande taille sur du matériel standard en réduisant la précision des poids.
- Gradient Boosting
— - Famille d'algorithmes ML construisant des ensembles d'arbres de décision en séquence. Implémentations : XGBoost, LightGBM, CatBoost. Référence pour les données tabulaires.
- Hallucination
— - Génération par un LLM d'informations factuellement incorrectes mais formulées avec assurance. Risque majeur en production — à atténuer par RAG, fact-checking, ou supervision humaine.
- Hyperparameter Tuning
— - Optimisation des paramètres de configuration d'un modèle (learning rate, profondeur d'arbre, nombre de couches) qui ne sont pas appris par l'entraînement. Outils : Optuna, Ray Tune, Hyperopt.
- Kubernetes (ML)
— - Orchestrateur de conteneurs utilisé pour déployer et scaler les workloads ML en production. Base des plateformes MLOps cloud-native (Kubeflow, Seldon, BentoML sur K8s).
- LangChain
— - Framework Python pour construire des applications LLM : chaînes de prompts, agents, intégration de tools. Dominant dans l'écosystème IA générative, bien que parfois critiqué pour sa complexité.
- LlamaIndex
— - Framework spécialisé dans la construction d'architectures RAG : ingestion de documents, indexation vectorielle, retrieval augmenté. Souvent préféré à LangChain pour les usages RAG purs.
- LLM
— - Large Language Model — modèle de langage de grande taille entraîné sur des corpus massifs (GPT-4, Claude, Mistral, Llama 3). Base de l'IA générative actuelle.
- MLflow
— - Plateforme open-source de gestion du cycle de vie ML : tracking des expériences, versionnement des modèles (Model Registry), déploiement. Standard de facto pour les équipes Data Science.
- MLOps
— - Ensemble de pratiques et d'outils pour automatiser le déploiement, le monitoring et la maintenance des modèles ML en production. Convergence des pratiques DevOps et Data Science.
- Model Registry
— - Catalogue centralisé des modèles entraînés avec leurs versions, métriques, artefacts et statut de déploiement (staging, production, archivé). Clé de la gouvernance des modèles.
- ONNX
— - Open Neural Network Exchange — format d'échange standard pour les modèles de deep learning, permettant de porter un modèle d'un framework (PyTorch) vers un runtime d'inférence optimisé.
- Overfitting / Underfitting
— - Overfitting : modèle trop adapté aux données d'entraînement, mauvaises performances en production. Underfitting : modèle trop simple, ne capture pas les patterns. Les deux s'évaluent sur un ensemble de validation indépendant.
- RAG
— - Retrieval-Augmented Generation — architecture LLM combinant un moteur de recherche vectorielle (contexte) et un LLM générateur. Réduit les hallucinations et permet d'interroger des documents propriétaires.
- SHAP / LIME
— - Méthodes d'explicabilité des modèles ML : SHAP (SHapley Additive exPlanations) calcule la contribution de chaque feature à une prédiction. LIME génère une approximation locale interprétable. Indispensables pour l'EU AI Act.
- Transfer Learning
— - Réutilisation d'un modèle pré-entraîné sur une tâche source pour accélérer l'apprentissage sur une tâche cible avec moins de données. Fondement de l'efficacité des LLMs et des modèles de vision.
- Vector Database
— - Base de données spécialisée dans le stockage et la recherche par similarité vectorielle (cosinus, produit scalaire). Exemples : Pinecone, Weaviate, Qdrant, pgvector. Cœur des architectures RAG.