- A/B Testing (ML)
- — Comparaison contrôlée de deux versions d'un modèle en production pour mesurer l'impact réel.
- AutoML
- — Automatisation de la sélection de modèles et du tuning d'hyperparamètres (Google AutoML, H2O, AutoSklearn).
- BERT / Transformers
- — Famille d'architectures de deep learning basées sur l'attention, à la base des LLM modernes.
- BentoML
- — Framework open source pour packager et déployer des modèles ML sous forme d'API REST.
- Causal AI
- — Approche ML qui modélise les relations causales (pas seulement corrélatives) pour des décisions plus robustes.
- Computer Vision
- — Branche du ML traitant des images et vidéos (classification, détection d'objets, segmentation).
- Data Drift
- — Changement dans la distribution des données d'entrée en production qui dégrade les performances du modèle.
- Data Versioning (DVC)
- — Outil de versioning des datasets et des expériences ML, analogue à Git pour les données.
- Deep Learning
- — Sous-ensemble du ML utilisant des réseaux de neurones profonds (many layers).
- Embedding
- — Représentation vectorielle dense d'une entité (texte, image, produit) dans un espace de haute dimension.
- Evidently AI
- — Bibliothèque open source pour monitorer la qualité des données et des modèles ML en production.
- Feature Engineering
- — Processus de création et transformation de variables d'entrée pour améliorer les performances du modèle.
- Feature Store
- — Référentiel centralisé pour stocker, partager et servir des features ML (Feast, Tecton, SageMaker Feature Store).
- Fine-tuning (LLM)
- — Entraînement supplémentaire d'un LLM pré-entraîné sur un dataset spécifique pour l'adapter à un domaine.
- GGUF / Quantization
- — Format et technique permettant de compresser les LLM pour les faire tourner sur CPU ou GPU modeste.
- Gradient Boosting (XGBoost/LightGBM)
- — Famille d'algorithmes d'ensemble très performants sur les données tabulaires.
- Hallucination (LLM)
- — Phénomène où un LLM génère des informations plausibles mais factuellement fausses.
- Hyperparameter Tuning
- — Optimisation des paramètres de configuration d'un modèle ML (Optuna, Ray Tune, Keras Tuner).
- Kubernetes (ML)
- — Orchestrateur de conteneurs utilisé pour déployer et scaler des services d'inférence ML.
- LangChain
- — Framework Python/JS pour construire des applications basées sur des LLM avec chaînage de prompts.
- LlamaIndex
- — Framework spécialisé dans les architectures RAG et l'indexation de documents pour les LLM.
- LLM (Large Language Model)
- — Modèle de langage de grande taille entraîné sur des corpus massifs (GPT-4, Claude, Mistral, Llama).
- MLflow
- — Plateforme open source pour tracker les expériences ML, versionner les modèles et gérer leur cycle de vie.
- MLOps
- — Ensemble des pratiques DevOps appliquées au cycle de vie des modèles ML (CI/CD, monitoring, réentraînement).
- Model Registry
- — Composant d'un système MLOps centralisant les versions de modèles et leur statut (staging, production, archived).
- ONNX
- — Format open standard d'échange de modèles ML entre frameworks (PyTorch → TensorRT, CoreML, etc.).
- Overfitting / Underfitting
- — Overfitting : modèle trop adapté aux données train, mauvais en généralisation. Underfitting : modèle trop simple.
- RAG (Retrieval-Augmented Generation)
- — Architecture combinant un LLM avec une base de connaissances récupérée dynamiquement pour réduire les hallucinations.
- SHAP / LIME (explainabilité)
- — Techniques d'interprétabilité locale et globale des prédictions de modèles ML (Shapley values, Local Interpretable Model-agnostic Explanations).
- Transfer Learning
- — Réutilisation d'un modèle pré-entraîné comme point de départ pour une nouvelle tâche, réduisant les données nécessaires.
- Vector Database
- — Base de données optimisée pour la recherche par similarité vectorielle (Pinecone, Weaviate, Qdrant, Chroma, pgvector).