Dictionnaire de l'IA

Voir aussi : decision-tree, genetic-algorithm, evolutionary-algorithm +2

Algorithme de recherche de chemin optimal combinant le coût réel parcouru et une estimation heuristique du coût restant. Utilisé en robotique, jeux vidéo et planification.

A2A (Agent-to-Agent)

A2A, pour Agent-to-Agent, désigne les architectures où plusieurs agents IA dialoguent entre eux pour résoudre une tâche, plutôt que de la traiter chacun isolément. C'est le prolongement naturel des assistants individuels : un agent peut déléguer un sous-problème à un autre agent spécialisé, recevoir sa réponse, et continuer son raisonnement. Concrètement, une équipe d'agents A2A peut comporter un agent planificateur, un agent rédacteur, un agent vérificateur et un agent exécuteur, chacun avec son rôle, ses droits d'accès et ses outils. La coopération imite celle d'une équipe humaine, à la différence près que les agents fonctionnent à la vitesse machine. Plusieurs frameworks ont émergé en 2024-2025 pour standardiser cette communication (Google A2A, frameworks open source). Pour une entreprise, c'est une voie prometteuse pour automatiser des chaînes métier complexes (achat, conformité, traitement de réclamations) sans avoir à scripter chaque étape.

Voir aussi : agent-ia, agentic-ai, multi-agent-system +2

Accuracy

Métrique mesurant le pourcentage de prédictions correctes. Simple mais trompeuse sur des classes déséquilibrées.

Voir aussi : precision, recall, f1-score +2

Activation Function

Fonction non-linéaire appliquée aux neurones (ReLU, Sigmoid, Tanh) permettant au réseau d'apprendre des relations complexes.

Voir aussi : relu, sigmoid, softmax +1

AdaBoost

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Algorithme d'ensemble qui combine plusieurs classifieurs faibles en un classifieur fort, en pondérant davantage les exemples mal classifiés à chaque itération.

Adversarial Attack

Perturbation intentionnelle des entrées d'un modèle pour provoquer des erreurs de prédiction, révélant les vulnérabilités des systèmes IA.

Voir aussi : black-box-model, xai, trustworthy-ai +2

Agent IA

Voir aussi : agentic-ai, multi-agent-system, hitl +2

Système d'IA autonome capable d'exécuter des tâches complexes en décomposant un objectif en étapes et en utilisant des outils externes.

Agentic AI

Voir aussi : agent-ia, multi-agent-system, hitl +2

Systèmes IA capables d'agir de manière autonome, planifiant et exécutant des séquences d'actions pour atteindre des objectifs complexes.

AGI

Voir aussi : intelligence-artificielle, asi, alignement +2

Artificial General Intelligence : IA hypothétique capable d'accomplir n'importe quelle tâche intellectuelle humaine avec flexibilité et raisonnement général.

Alignement

Processus visant à s'assurer qu'un modèle IA agit conformément aux valeurs et intentions humaines, crucial pour la sécurité des systèmes IA.

Voir aussi : valeur, intelligence-artificielle, agi +2

AlphaGo

Voir aussi : intelligence-artificielle, apprentissage-par-renforcement, agi +2

Programme d'intelligence artificielle développé par DeepMind (Google) qui a battu le champion du monde de Go Lee Sedol en 2016. AlphaGo combine des réseaux de neurones profonds et l'apprentissage par renforcement. Sa victoire a marqué un tournant majeur en démontrant la capacité de l'IA à maîtriser des jeux d'une complexité extrême.

Annotation

Processus d'étiquetage manuel des données pour créer des datasets d'entraînement supervisé, essentiel pour la qualité des modèles.

Voir aussi : entrainement, dataset, training-data +2

APE

Automatic Prompt Engineering. Technique où l'IA génère elle-même plusieurs variantes de prompts, les teste et sélectionne automatiquement le plus performant pour un objectif donné.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

API

Application Programming Interface. Interface permettant à des applications de communiquer entre elles. Les modèles d'IA sont souvent accessibles via API.

Voir aussi : gpu, latence, inference +2

Apprentissage non supervisé

Méthode d'apprentissage où le modèle découvre des patterns dans les données sans étiquettes préalables, comme le clustering ou la réduction de dimension.

Voir aussi : clustering, apprentissage-supervise, apprentissage-par-renforcement +2

Apprentissage par renforcement

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, transfer-learning +2

Paradigme où un agent apprend à prendre des décisions en interagissant avec un environnement et en recevant des récompenses ou pénalités.

Apprentissage supervisé

Voir aussi : apprentissage-non-supervise, apprentissage-par-renforcement, transfer-learning +2

Méthode d'apprentissage où le modèle est entraîné sur des données étiquetées, avec des entrées associées aux sorties attendues.

ASI

Voir aussi : intelligence-artificielle, agi, alignement +2

Artificial Superintelligence : concept théorique d'une IA surpassant significativement l'intelligence humaine dans tous les domaines.

Attention

Mécanisme permettant à un modèle de pondérer différemment les parties d'une entrée selon leur pertinence pour la tâche en cours. Fondamental dans les architectures Transformer.

Voir aussi : transformer, nlp, token +2

AUC

Area Under the Curve : aire sous la courbe ROC, mesurant la capacité d'un classifieur à distinguer les classes indépendamment du seuil.

Voir aussi : accuracy, precision, recall +2

Autoencoder

Voir aussi : reseau-de-neurones, perceptron, mlp +2

Réseau de neurones qui apprend à compresser des données en une représentation réduite (encodage) puis à les reconstruire. Utilisé pour la réduction de dimensionnalité et la détection d'anomalies.

Automatisation

Utilisation de l'IA pour exécuter des tâches répétitives sans intervention humaine, améliorant productivité et fiabilité.

AutoML

Voir aussi : hyperparametre, machine-learning, api +2

Automated Machine Learning : ensemble de techniques automatisant la sélection de modèles, l'ingénierie des features et l'optimisation des hyperparamètres.

Backpropagation

Rétropropagation. Algorithme calculant comment ajuster chaque poids du réseau pour réduire l'erreur, essentiel à l'entraînement des réseaux de neurones.

Voir aussi : entrainement, perceptron, mlp +2

Bag-of-Words

Représentation textuelle simple où un document est converti en vecteur de fréquences de mots, ignorant l'ordre et la grammaire.

Bagging

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Bootstrap Aggregating : technique d'ensemble combinant les prédictions de modèles entraînés sur des échantillons aléatoires avec remplacement.

Base vectorielle

Base de données optimisée pour stocker et rechercher des embeddings, permettant de trouver rapidement des contenus similaires.

Voir aussi : embedding, dataset, training-data +2

Batch

Sous-ensemble de données traitées simultanément pendant l'entraînement d'un modèle, permettant d'optimiser l'utilisation de la mémoire GPU.

Voir aussi : entrainement, gpu, decision-tree +2

Batch Normalization

Technique de régularisation normalisant les activations d'une couche pour chaque mini-batch, accélérant l'entraînement et stabilisant le gradient.

Voir aussi : entrainement, batch, perceptron +2

Bayesian Network

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Modèle graphique probabiliste représentant les dépendances conditionnelles entre variables via un graphe acyclique dirigé.

Bayesian Optimization

Voir aussi : hyperparametre, decision-tree, random-forest +2

Méthode d'optimisation globale pour fonctions coûteuses à évaluer, utilisant un modèle probabiliste pour guider la recherche des hyperparamètres optimaux.

BERT

Bidirectional Encoder Representations from Transformers : modèle pré-entraîné comprenant le contexte bidirectionnel, révolutionnant le NLP.

Voir aussi : nlp, contexte, transformer +2

Biais

Voir aussi : entrainement, intelligence-artificielle, agi +2

Distorsion dans les résultats d'un modèle d'IA due à des déséquilibres ou préjugés présents dans les données d'entraînement.

Biais de confirmation

Tendance cognitive humaine à privilégier les informations qui confirment nos croyances préexistantes et à ignorer celles qui les contredisent. Ce biais est exploité par la désinformation et peut être amplifié par les algorithmes de recommandation et les IA qui adaptent leurs réponses à nos attentes (Sycophancy).

Voir aussi : biais, desinformation, sycophancy +2

Bias-Variance Tradeoff

Compromis fondamental entre la capacité d'un modèle à capturer la complexité des données (biais) et sa sensibilité aux variations (variance).

Voir aussi : biais, decision-tree, random-forest +2

Big Data

Voir aussi : entrainement, velocite, machine-learning +2

Ensemble de données massives caractérisées par les "3V" : Volume (quantité énorme), Vélocité (vitesse de génération et traitement) et Variété (formats structurés et non structurés). Le Big Data a permis l'essor du Machine Learning moderne en fournissant les données nécessaires à l'entraînement des modèles.

Black Box Model

Modèle dont le fonctionnement interne est opaque et difficile à interpréter, soulevant des questions d'explicabilité et de confiance.

Voir aussi : adversarial-attack, xai, trustworthy-ai +2

BLEU Score

Bilingual Evaluation Understudy : métrique évaluant la qualité de traduction automatique par comparaison avec des références humaines.

Boosting

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Technique d'ensemble entraînant séquentiellement des modèles faibles, chacun corrigeant les erreurs des précédents pour former un prédicteur puissant.

BPE

Byte Pair Encoding. Algorithme de tokenisation qui fusionne itérativement les paires de caractères les plus fréquentes pour créer un vocabulaire optimal.

Voir aussi : tokenisation, nlp, token +2

Business Intelligence

Ensemble des processus, outils et technologies qui permettent de transformer des données brutes en informations exploitables pour la prise de décision. La BI répond à la question "Qu'est-ce qui s'est passé ?" en analysant l'historique, visualisant les tendances et suivant les indicateurs clés de performance (KPI). Elle ne prédit pas l'avenir, mais éclaire le passé et le présent.

Voir aussi : kpi, transformer, churn +2

Capsule Network

Architecture proposée par Hinton capturant les relations hiérarchiques et spatiales entre les features, alternative aux CNN.

Voir aussi : cnn, convolution, object-detection +2

Catastrophic Forgetting

Voir aussi : transfer-learning, machine-unlearning, fine-tuning +2

Phénomène où un réseau de neurones oublie les tâches précédemment apprises lors de l'entraînement sur de nouvelles tâches.

Causal AI

Voir aussi : neuro-symbolic-ai, evolutionary-algorithm, genetic-algorithm +2

Approche de l'IA intégrant le raisonnement causal pour comprendre les relations de cause à effet, au-delà des simples corrélations statistiques.

Chain of Thought

Technique de prompting encourageant le modèle à décomposer son raisonnement en étapes explicites pour améliorer la qualité des réponses complexes.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Chain of Thought Prompting

Technique demandant à l'IA de détailler explicitement ses étapes de raisonnement avant de donner sa réponse finale. Améliore significativement la qualité des réponses sur les tâches de raisonnement complexes.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Chatbot

Agent conversationnel automatisé capable de dialoguer avec des utilisateurs en langage naturel.

Voir aussi : agent-ia, llm, gpt +2

ChatGPT

Interface conversationnelle d'OpenAI basée sur les modèles GPT, ayant démocratisé l'accès aux grands modèles de langage auprès du grand public.

Voir aussi : gpt, llm, claude +2

Chunking

Découpage de documents longs en morceaux plus petits pour le traitement par des modèles IA, notamment dans les systèmes RAG.

Voir aussi : rag, embedding, base-vectorielle +2

Churn

Taux d'attrition ou risque de départ des clients. Indicateur mesurant le pourcentage de clients qui cessent d'utiliser un service sur une période donnée. Prédire le churn est un cas d'usage classique de l'IA supervisée, permettant d'identifier les clients à risque et de mettre en place des actions de rétention proactives.

Voir aussi : kpi, valeur, velocite +2

Claude

Famille de modèles de langage développée par Anthropic, conçue avec un focus sur la sécurité et l'alignement avec les valeurs humaines.

Voir aussi : alignement, valeur, llm +2

Clustering

Voir aussi : apprentissage-non-supervise, decision-tree, random-forest +2

Technique d'apprentissage non supervisé regroupant automatiquement les données similaires en clusters sans étiquettes préalables.

CNN

Voir aussi : vision-par-ordinateur, reseau-de-neurones, perceptron +2

Convolutional Neural Network (Réseau de neurones convolutif). Type de réseau spécialisé dans l'analyse d'images et la vision par ordinateur.

ComfyUI

Interface graphique modulaire et open-source pour la génération d'images avec Stable Diffusion. ComfyUI utilise un système de nœuds (nodes) permettant de créer des workflows visuels complexes pour la génération, l'édition et le traitement d'images par IA. Très apprécié pour sa flexibilité et ses possibilités avancées.

Voir aussi : diffusion, stable-diffusion, open-source +2

Confusion Matrix

Tableau croisant prédictions et valeurs réelles, visualisant les vrais/faux positifs et négatifs pour évaluer un classifieur.

Voir aussi : valeur, accuracy, precision +2

Constitutional AI

Approche d'alignement où l'IA est guidée par un ensemble de principes constitutionnels pour produire des réponses sûres et utiles.

Voir aussi : alignement, intelligence-artificielle, agi +2

Context Window

Fenêtre de contexte. Nombre maximum de tokens qu'un modèle peut traiter en une seule fois, limitant la longueur du texte analysable.

Voir aussi : token, contexte, system-prompt +2

Contexte

Information fournie au modèle pour lui permettre de comprendre et répondre de manière pertinente. Inclut le prompt et l'historique de conversation.

Voir aussi : prompt, context-window, system-prompt +2

Contextual Prompting

Voir aussi : catastrophic-forgetting, machine-unlearning, transfer-learning +2

Technique de prompting fournissant des éléments concrets de la situation pour améliorer la pertinence des réponses. Inclut le public cible, le contexte métier, les contraintes spécifiques.

Voir aussi : contexte, prompt, prompt-engineering +2

Continual learning

Le continual learning, ou apprentissage continu, désigne la capacité d'un modèle d'IA à apprendre de nouvelles tâches au fil du temps tout en conservant ses connaissances antérieures. C'est un problème difficile, parce que les réseaux de neurones classiques souffrent de catastrophic forgetting : ré-entraîner un modèle sur de nouvelles données fait souvent disparaître ce qu'il avait appris avant. Plusieurs techniques permettent d'atténuer ce phénomène : la régularisation des poids importants (Elastic Weight Consolidation), la rejeu de données passées, ou les architectures modulaires qui spécialisent certaines parties du réseau. Pour une PME, le continual learning est intéressant lorsqu'un modèle métier doit évoluer en continu (par exemple, intégrer chaque mois de nouveaux produits ou de nouvelles règles métier) sans repartir de zéro à chaque mise à jour.

Contrastive Learning

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, apprentissage-par-renforcement +2

Méthode d'apprentissage auto-supervisé apprenant des représentations en rapprochant les exemples similaires et éloignant les exemples différents.

Convolution

Opération mathématique appliquant un filtre sur une entrée pour extraire des caractéristiques locales. Fondement des réseaux convolutifs (CNN).

Voir aussi : cnn, capsule-network, object-detection +2

Copilot

Assistant IA de Microsoft intégré dans ses produits (Office, Windows), combinant les capacités de GPT avec les données utilisateur.

Voir aussi : gpt, llm, claude +2

Cosine Similarity

Mesure de similarité entre vecteurs basée sur l'angle entre eux, indépendante de leur magnitude. Utilisée pour comparer embeddings.

Voir aussi : embedding, rag, base-vectorielle +2

Cross-entropy

La cross-entropy, ou entropie croisée, est une fonction de perte qui mesure la distance entre deux distributions de probabilités : celle prédite par un modèle et celle attendue (les vraies étiquettes). Elle est utilisée massivement dans les tâches de classification, notamment lorsque le modèle se termine par une couche softmax. Concrètement, plus la prédiction du modèle est proche de la vérité, plus la cross-entropy est faible. À l'inverse, une prédiction très éloignée de la réalité génère une perte élevée, ce qui pousse l'algorithme d'apprentissage à corriger les poids du réseau. Sa popularité tient à deux raisons : elle est mathématiquement bien adaptée aux problèmes de classification multi-classe, et son gradient se calcule simplement, ce qui en fait un partenaire naturel de la backpropagation.

Voir aussi : loss-function, softmax, apprentissage-supervise +2

Cross-Validation

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Technique d'évaluation divisant les données en plusieurs plis pour entraîner et tester un modèle de façon robuste, évitant le surapprentissage.

DALL-E

Modèle de génération d'images développé par OpenAI, capable de créer des images à partir de descriptions textuelles.

Data Analyst

Métiers

Professionnel qui transforme les données en réponses claires et actionnables. Il est le traducteur entre les données techniques et les décisions business. Ses missions : nettoyer les données, construire des indicateurs (KPI), créer des tableaux de bord et expliquer les chiffres. Le Data Analyst ne prédit pas le futur, il éclaire le passé et le présent avec clarté.

Voir aussi : kpi, dataset, training-data +2

Data Drift

Voir aussi : data-warehouse, data-lake, dataset +2

Évolution de la distribution des données dans le temps, dégradant les performances d'un modèle entraîné sur des données historiques.

Voir aussi : dataset, training-data, data-lake +2

Data Engineer

Métiers

Architecte des systèmes de données qui construit les fondations techniques permettant aux autres métiers data de travailler efficacement. Responsabilités : concevoir et maintenir les bases de données, créer des pipelines d'intégration, assurer la qualité des données, optimiser les performances de stockage et mettre en place les Data Lakes et Data Warehouses.

Data Lake

Voir aussi : big-data, donnees-structurees, machine-learning +2

Lac de données brutes conservées dans leur format d'origine, mélangeant données structurées et non structurées. Flexible et évolutif, il est idéal pour l'exploration et l'IA. Analogie : un lac où convergent toutes les rivières avec toutes les données en vrac accessibles. Utilisé pour le Machine Learning et les analyses exploratoires Big Data.

Data Scientist

Métiers

Expert qui utilise des techniques avancées de Machine Learning et statistiques pour créer des modèles prédictifs. Il explore les données pour trouver des patterns, construit des modèles d'apprentissage automatique, optimise leurs performances et les déploie en production. Le Data Scientist est le "météorologue" qui prédit l'avenir en analysant les conditions passées et présentes.

Voir aussi : machine-learning, dataset, training-data +2

Data Warehouse

Voir aussi : business-intelligence, donnees-structurees, dataset +2

Entrepôt de données structurées et nettoyées, organisées selon un schéma précis. Les données y sont prêtes pour l'analyse Business Intelligence avec des requêtes SQL performantes. Analogie : une bibliothèque bien rangée où chaque livre a sa place avec un catalogue précis. Utilisé pour le reporting, monitoring et analyses structurées.

Dataset

Voir aussi : intelligence-artificielle, training-data, data-lake +2

Ensemble structuré de données utilisé pour entraîner, valider ou tester un modèle d'intelligence artificielle.

Decision Tree

Voir aussi : random-forest, gradient-boosting, adaboost +2

Modèle de prédiction structuré en arbre où chaque nœud représente un test sur une caractéristique, menant à une décision aux feuilles.

Deep Learning

Voir aussi : machine-learning, apprentissage-supervise, apprentissage-non-supervise +2

Technique de Machine Learning utilisant des réseaux de neurones à plusieurs couches pour analyser des données complexes (images, sons, textes).

Deepfake

Voir aussi : intelligence-artificielle, desinformation, deep-learning +2

Contenu média (vidéo, audio, image) généré ou altéré par intelligence artificielle pour faire apparaître une personne disant ou faisant quelque chose qu'elle n'a jamais dit ou fait. Les deepfakes utilisent le Deep Learning pour remplacer un visage ou synchroniser les lèvres de manière réaliste. Représentent un risque majeur de désinformation.

Dense Layer

Couche entièrement connectée où chaque neurone reçoit l'entrée de tous les neurones de la couche précédente.

Désinformation

Voir aussi : mesinformation, malinformation, fact-checking +2

Information fausse créée et diffusée volontairement pour nuire, manipuler ou influencer. L'intention malveillante est le critère distinctif. Exemples : campagnes orchestrées, fake news politiques, attaques concurrentielles. L'IA générative permet de produire ce type de contenu massivement et avec un niveau de qualité très convaincant.

Diffusion

Technique de génération d'images où le modèle apprend à inverser un processus de bruitage pour créer des images à partir de bruit aléatoire.

Voir aussi : gan, vae, stable-diffusion +2

Dimensionality Reduction

Ensemble de techniques réduisant le nombre de variables d'un dataset tout en préservant l'information essentielle (PCA, t-SNE, UMAP).

Voir aussi : dataset, pca, decision-tree +2

Données non structurées

Données sans organisation prédéfinie, en format libre et varié. Exemples : messages, emails, photos, vidéos, documents PDF, posts sur réseaux sociaux. Elles nécessitent des outils spécialisés pour l'analyse et représentent environ 80% des données en entreprise. C'est là que réside souvent le plus grand potentiel inexploité.

Voir aussi : dataset, training-data, data-lake +2

Données structurées

Données organisées en tableaux avec lignes et colonnes bien définies, facilement analysables avec Excel ou SQL. Exemples : adresses email, noms, dates de naissance, chiffres de ventes, listes de clients, inventaires produits, transactions bancaires. Elles représentent environ 20% des données en entreprise.

Voir aussi : dataset, training-data, data-lake +2

Dropout

Technique de régularisation désactivant aléatoirement des neurones pendant l'entraînement pour prévenir le surapprentissage.

Voir aussi : entrainement, perceptron, mlp +2

Early Stopping

Voir aussi : entrainement, decision-tree, random-forest +2

Stratégie arrêtant l'entraînement lorsque la performance sur un ensemble de validation cesse de s'améliorer, évitant le surapprentissage.

ElevenLabs

Plateforme leader de synthèse vocale par IA offrant des voix ultra-réalistes et le clonage vocal. ElevenLabs permet de créer des voix personnalisées, de générer des narrations, du doublage et du contenu audio. Utilisé pour les podcasts, livres audio, jeux vidéo et accessibilité.

ELIZA

Premier chatbot créé en 1966 par Joseph Weizenbaum au MIT. ELIZA simulait un psychothérapeute rogérien en reformulant les phrases de l'utilisateur sous forme de questions. Ce programme pionnier a démontré comment des règles simples de correspondance de motifs pouvaient créer l'illusion d'une conversation intelligente.

Voir aussi : chatbot, intelligence-artificielle, agi +2

Embedding

Représentation numérique (vecteur) d'un texte, image ou autre donnée, permettant de capturer son sens sémantique pour la recherche et la comparaison.

Voir aussi : rag, base-vectorielle, semantic-search +2

Encoder-Decoder

Architecture où l'encodeur compresse l'entrée en représentation latente et le décodeur génère la sortie. Base des modèles seq2seq et transformers.

Voir aussi : transformer, attention, self-attention +2

Ensemble Learning

Approche combinant plusieurs modèles pour obtenir de meilleures prédictions que chaque modèle individuel (bagging, boosting, stacking).

Voir aussi : boosting, bagging, apprentissage-supervise +2

Entraînement

Processus d'ajustement des paramètres d'un modèle à partir de données pour qu'il apprenne à effectuer une tâche spécifique.

Epoch

Voir aussi : entrainement, decision-tree, random-forest +2

Passage complet à travers l'ensemble des données d'entraînement. Un modèle est généralement entraîné sur plusieurs epochs.

Evolutionary Algorithm

Voir aussi : neuro-symbolic-ai, causal-ai, genetic-algorithm +2

Famille d'algorithmes d'optimisation inspirés de l'évolution biologique : sélection, mutation, croisement pour faire évoluer des solutions.

F1-Score

Moyenne harmonique de la précision et du rappel, équilibrant les deux métriques en une seule mesure de performance.

Voir aussi : precision, accuracy, recall +2

Fact-checking

Vérification factuelle de l'information par un processus rigoureux de recherche et de croisement des sources. Pratique journalistique devenue essentielle à l'ère de la désinformation de masse. Utilise des méthodes comme SIFT et des outils comme la recherche inversée d'images, le grounding IA et l'analyse de sources multiples.

Voir aussi : grounding, desinformation, sift +2

False Positive / False Negative

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Erreurs de classification : faux positif (prédiction positive erronée) et faux négatif (prédiction négative erronée).

Feature Engineering

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Processus de création, transformation et sélection des variables d'entrée pour améliorer les performances d'un modèle ML.

Federated Learning

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, apprentissage-par-renforcement +2

Approche d'apprentissage distribué où les modèles sont entraînés localement sur les appareils, préservant la confidentialité des données.

Few-shot Learning

Voir aussi : entrainement, zero-shot-learning, one-shot-learning +2

Capacité d'un modèle à apprendre une nouvelle tâche avec seulement quelques exemples (généralement 2 à 10), sans nécessiter de ré-entraînement.

Few-shot Prompting

Technique de prompting incluant plusieurs exemples (généralement 2 à 5) pour guider l'IA vers le format, le style ou le type de réponse souhaité. Plus fiable que le zero-shot pour les tâches complexes.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Fine-tuning

Processus d'adaptation d'un modèle pré-entraîné à une tâche ou un domaine spécifique en le réentraînant sur des données ciblées.

Fonction Tool

Capacité d'un modèle à appeler des fonctions externes (APIs, bases de données) pour étendre ses capacités au-delà de la génération de texte.

Voir aussi : api, agent-ia, agentic-ai +2

Format de sortie

Spécification du format attendu dans un prompt (JSON, liste, tableau, plan structuré, markdown...). Permet d'obtenir des réponses directement exploitables sans reformatage.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

GAN

Generative Adversarial Network : architecture opposant un générateur créant de faux exemples à un discriminateur les détectant, produisant des contenus réalistes.

Gemini

Famille de modèles multimodaux développée par Google DeepMind, conçue pour exceller dans le raisonnement et le traitement multi-formats.

Voir aussi : llm, gpt, claude +2

Genetic Algorithm

Voir aussi : neuro-symbolic-ai, causal-ai, evolutionary-algorithm +2

Algorithme d'optimisation inspiré de la génétique, utilisant sélection, croisement et mutation pour faire évoluer une population de solutions.

GitHub Copilot

Assistant de programmation IA intégré aux éditeurs de code, suggérant du code en temps réel basé sur le contexte et les commentaires.

Voir aussi : contexte, llm, gpt +2

GNN

Voir aussi : donnees-structurees, reseau-de-neurones, cnn +2

Graph Neural Network : réseau de neurones opérant sur des données structurées en graphe, propageant l'information entre nœuds voisins.

GPT

Generative Pre-trained Transformer. Architecture de modèle de langage développée par OpenAI, à la base de ChatGPT.

Voir aussi : chatgpt, transformer, llm +2

GPU

Voir aussi : inference, entrainement, deep-learning +2

Graphics Processing Unit. Processeur spécialisé essentiel pour l'entraînement et l'inférence des modèles de deep learning grâce à sa capacité de calcul parallèle.

Gradient Boosting

Technique de boosting construisant séquentiellement des modèles minimisant le gradient de la fonction de perte. Base de XGBoost et LightGBM.

Voir aussi : boosting, xgboost, decision-tree +2

Gradient Descent

Descente de gradient. Algorithme d'optimisation ajustant itérativement les poids d'un modèle pour minimiser la fonction de perte.

Grid Search

Méthode d'optimisation d'hyperparamètres testant exhaustivement toutes les combinaisons d'une grille prédéfinie de valeurs.

Voir aussi : hyperparametre, valeur, decision-tree +2

Ground Truth

Étiquettes ou annotations de référence considérées comme la vérité, utilisées pour entraîner et évaluer les modèles.

Voir aussi : annotation, mse, loss-function

Grounding

Technique ancrant les réponses d'un modèle dans des sources vérifiables pour réduire les hallucinations et améliorer la fiabilité.

Voir aussi : hallucination, rag, embedding +2

GRU

Gated Recurrent Unit : architecture récurrente simplifiée par rapport au LSTM, avec moins de paramètres mais des performances comparables.

Voir aussi : lstm, perceptron, mlp +2

Hallucination

Voir aussi : intelligence-artificielle, agi, asi +2

Phénomène où un modèle d'IA génère des informations fausses ou inventées présentées comme factuelles avec assurance.

HITL

Voir aussi : agent-ia, agentic-ai, multi-agent-system +2

Human-in-the-Loop : approche intégrant l'humain dans la boucle d'apprentissage ou de décision pour supervision, validation ou amélioration.

Hugging Face

Plateforme collaborative hébergeant des modèles, datasets et outils pour le machine learning, devenue la référence de l'écosystème open source IA.

Voir aussi : machine-learning, dataset, open-source +2

Hyperparamètre

Voir aussi : entrainement, decision-tree, random-forest +2

Paramètre défini avant l'entraînement d'un modèle (comme le learning rate ou le nombre de couches) et qui influence le processus d'apprentissage.

IA décisionnelle

Voir aussi : intelligence-artificielle, agi, asi +2

Intelligence artificielle conçue pour aider ou automatiser la prise de décisions. Elle analyse des données, évalue des scénarios et recommande ou exécute des actions optimales. Utilisée dans la gestion des stocks, l'optimisation des prix, les systèmes de recommandation et la planification stratégique.

IA Edge

Voir aussi : intelligence-artificielle, latence, agi +2

Déploiement de modèles d'intelligence artificielle directement sur des appareils périphériques (smartphones, IoT, caméras) plutôt que dans le cloud. Permet un traitement en temps réel, réduit la latence, préserve la confidentialité et fonctionne sans connexion internet. Utilisée pour la reconnaissance faciale, les assistants vocaux embarqués.

IA hybride

Voir aussi : intelligence-artificielle, agi, asi +2

Architecture combinant plusieurs types d'intelligence artificielle ou méthodes (symbolique et connexionniste, locale et cloud, différents modèles spécialisés) pour tirer parti des forces de chacune. Cette approche permet d'obtenir des systèmes plus robustes, précis et adaptables que les approches mono-modèle.

IA locale

Voir aussi : intelligence-artificielle, lm-studio, latence +2

Intelligence artificielle qui s'exécute entièrement sur l'appareil de l'utilisateur (ordinateur, smartphone) sans envoyer de données vers le cloud. Avantages : confidentialité des données, fonctionnement hors ligne, latence réduite. Exemples : Ollama, LM Studio, certaines fonctions de Siri ou Google Assistant.

IA prédictive

Voir aussi : intelligence-artificielle, machine-learning, agi +2

Branche de l'intelligence artificielle spécialisée dans l'analyse de données historiques pour anticiper des événements futurs. Elle utilise des algorithmes de Machine Learning pour identifier des patterns et faire des prédictions. Applications : prévision de ventes, maintenance prédictive, détection de fraudes, prévisions météorologiques.

ImageNet

Base de données massive contenant plus de 14 millions d'images annotées dans plus de 20 000 catégories. Le concours ImageNet Large Scale Visual Recognition Challenge (ILSVRC) a été le catalyseur de la révolution du Deep Learning, notamment avec la victoire d'AlexNet en 2012 qui a démontré la puissance des réseaux de neurones profonds.

Voir aussi : deep-learning, cnn, capsule-network +2

In-context Learning

Capacité des grands modèles de langage à apprendre une tâche à partir d'exemples fournis directement dans le prompt, sans modification des poids du modèle.

Voir aussi : prompt, few-shot-learning, zero-shot-learning +2

Inférence

Phase d'utilisation d'un modèle entraîné pour faire des prédictions sur de nouvelles données, par opposition à la phase d'entraînement.

Voir aussi : entrainement, api, gpu +2

Intelligence Artificielle

Domaine de l'informatique visant à créer des systèmes capables de réaliser des tâches qui requièrent normalement l'intelligence humaine : reconnaissance vocale, prise de décision, traduction, etc.

Voir aussi : agi, asi, alignement +2

Jailbreak

Un jailbreak, dans le contexte des modèles de langage, désigne une technique qui pousse l'IA à enfreindre ses propres règles de sécurité. Cela passe souvent par des formulations détournées ("imagine un personnage qui...", "joue le rôle d'une IA sans restriction"), des chaînes d'instructions complexes, ou l'exploitation de failles dans les couches d'alignement. À la différence de la prompt injection, qui est une attaque venant de l'extérieur du système, le jailbreak vient typiquement de l'utilisateur lui-même qui cherche à dépasser les limites posées par le fournisseur du modèle. Les modèles modernes (Claude, GPT, Gemini, Mistral) sont entraînés avec des techniques comme le RLHF ou le constitutional AI précisément pour résister à ces tentatives. Mais aucune défense n'est parfaite, et la course entre techniques de jailbreak et techniques d'alignement est permanente.

Voir aussi : prompt-injection, alignement, constitutional-ai +2

K-Means

Algorithme de clustering partitionnant les données en K groupes en minimisant la distance intra-cluster. Simple et efficace pour la segmentation.

Voir aussi : clustering, decision-tree, random-forest +2

K-NN

Voir aussi : decision-tree, random-forest, gradient-boosting +2

K-Nearest Neighbors : algorithme classifiant un point selon la classe majoritaire de ses K voisins les plus proches dans l'espace des features.

Knowledge Distillation

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, apprentissage-par-renforcement +2

Technique transférant les connaissances d'un grand modèle (teacher) vers un modèle plus petit (student), conservant les performances avec moins de ressources.

Knowledge Graph

Base de connaissances structurée en graphe reliant des entités par des relations sémantiques, permettant le raisonnement et l'enrichissement contextuel.

Voir aussi : rag, embedding, base-vectorielle +2

KPI

Key Performance Indicator (Indicateur Clé de Performance). Métrique essentielle permettant de mesurer objectivement l'atteinte des objectifs et d'identifier les écarts. Les KPI sont au cœur de la Business Intelligence et permettent de monitorer les performances d'une entreprise, d'un projet ou d'une activité. Exemples : taux de conversion, chiffre d'affaires, satisfaction client.

Voir aussi : business-intelligence, api, gpu +2

Latence

Temps de réponse entre l'envoi d'une requête à un modèle IA et la réception du résultat. Critique pour les applications temps réel.

Voir aussi : api, gpu, inference +2

Leaky ReLU

Variante de ReLU autorisant une petite pente pour les valeurs négatives, évitant le problème des neurones "morts".

Voir aussi : valeur, relu, softmax +2

Llama

Famille de modèles de langage open source développée par Meta, offrant des performances compétitives avec les modèles propriétaires.

Voir aussi : open-source, llm, gpt +2

LLM

Large Language Model (Grand Modèle de Langage). Modèle d'IA entraîné sur d'immenses quantités de texte, capable de comprendre et générer du langage naturel. Exemples : GPT, Claude, Gemini.

Voir aussi : gpt, claude, gemini +2

LM Studio

Application desktop permettant de découvrir, télécharger et exécuter des LLM localement avec une interface graphique intuitive. LM Studio offre un chat intégré, la compatibilité avec de nombreux modèles, et un serveur API local. Alternative conviviale à Ollama pour les utilisateurs moins techniques.

Voir aussi : llm, api, ollama +2

Logistic Regression

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Modèle de classification prédisant la probabilité d'appartenance à une classe via une fonction sigmoïde. Simple, interprétable et efficace.

LoRA (Low-Rank Adaptation)

LoRA, pour Low-Rank Adaptation, est une technique de fine-tuning conçue pour adapter de très grands modèles (comme un LLM de plusieurs milliards de paramètres) à un cas d'usage spécifique, sans devoir réentraîner ou stocker une copie complète du modèle. L'astuce est mathématique : au lieu de modifier les poids du modèle, on apprend de petites matrices supplémentaires "low-rank" qui viennent corriger les sorties. Le modèle d'origine reste figé, et ces matrices LoRA pèsent typiquement quelques mégaoctets, là où le modèle complet en pèse plusieurs gigaoctets. Conséquence pratique : on peut fine-tuner un modèle avec un GPU modeste, stocker plusieurs adaptations LoRA pour différents domaines (juridique, médical, support client), et les charger à la volée selon la tâche. C'est aujourd'hui la méthode standard pour personnaliser un LLM open-weight comme Llama ou Mistral à un contexte d'entreprise.

Voir aussi : fine-tuning, pre-entrainement, transfer-learning +2

Loss Function

Fonction de perte. Mesure l'écart entre les prédictions du modèle et les valeurs attendues, guidant l'optimisation pendant l'entraînement.

Voir aussi : entrainement, valeur, mse +1

LSTM

Long Short-Term Memory : architecture de réseau récurrent avec des portes contrôlant le flux d'information, capturant les dépendances à long terme.

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, apprentissage-par-renforcement +2

Machine Learning

Sous-domaine de l'IA permettant aux machines d'apprendre à partir de données sans être explicitement programmées. Le système s'améliore avec l'expérience.

Machine Unlearning

Voir aussi : catastrophic-forgetting, federated-learning, transfer-learning +2

Ensemble de techniques permettant de retirer l'influence de données spécifiques d'un modèle entraîné, pour la conformité RGPD ou la correction d'erreurs.

Malinformation

Information vraie, mais diffusée dans l'intention de nuire à une personne ou une organisation. La véracité de l'information ne garantit pas l'éthique de sa diffusion. Exemples : doxing (révélation de données personnelles), documents volés publiés hors contexte, révélations de vie privée malveillantes.

Voir aussi : contexte, diffusion, veracite +2

Markov Decision Process

Voir aussi : apprentissage-par-renforcement, neuro-symbolic-ai, causal-ai +2

Formalisme mathématique modélisant la prise de décision séquentielle dans un environnement stochastique, base de l'apprentissage par renforcement.

Max Tokens

Paramètre définissant la longueur maximale de la réponse générée par l'IA, exprimée en nombre de tokens. Permet de contrôler la concision ou le détail des réponses.

Voir aussi : token, prompt, prompt-engineering +2

MCP (Model Context Protocol)

Le Model Context Protocol (MCP) est un standard ouvert proposé par Anthropic en 2024. Il définit comment un modèle de langage peut interagir de manière structurée avec des sources de données externes (fichiers, bases de données, API, services) sans qu'il faille recoder un connecteur spécifique pour chaque combinaison modèle/outil. L'idée fondatrice est simple : remplacer les intégrations sur mesure par un protocole commun, exactement comme USB l'a fait pour les périphériques informatiques. Un serveur MCP expose des données ou des actions, n'importe quel client compatible (Claude, applications agentiques, IDE) peut s'y connecter sans développement spécifique. Pour une PME ou ETI, MCP simplifie radicalement le déploiement d'agents IA connectés au système d'information : un seul connecteur MCP par outil métier, et tous les modèles compatibles peuvent l'utiliser. C'est un mouvement structurant pour 2025-2026, comparable à l'arrivée de REST il y a quinze ans.

Voir aussi : api, agent-ia, agentic-ai +2

Mésinformation

Voir aussi : desinformation, malinformation, fact-checking +2

Information fausse partagée par erreur, sans intention malveillante. La personne qui diffuse cette information croit sincèrement qu'elle est vraie. Exemple : partager un article non vérifié par naïveté ou manque de vigilance. Se distingue de la désinformation par l'absence d'intention de nuire.

Midjourney

Service de génération d'images par IA connu pour son style artistique distinctif et sa qualité esthétique, accessible via Discord.

Mistral

Modèles de langage français développés par Mistral AI, reconnus pour leur efficacité et disponibles en open source et via API.

Voir aussi : api, open-source, llm +2

MLP

Multilayer Perceptron : réseau de neurones feedforward avec une ou plusieurs couches cachées, architecture de base du deep learning.

Voir aussi : perceptron, deep-learning, reseau-de-neurones +2

Model Collapse

Dégénérescence d'un modèle génératif entraîné sur ses propres sorties, perdant progressivement diversité et qualité.

Monte-Carlo Method

Voir aussi : neuro-symbolic-ai, causal-ai, evolutionary-algorithm +2

Ensemble de techniques utilisant l'échantillonnage aléatoire pour estimer des quantités numériques ou explorer des espaces de solutions.

MSE

Mean Squared Error : moyenne des carrés des erreurs entre prédictions et valeurs réelles, pénalisant fortement les grandes erreurs.

Voir aussi : valeur, loss-function, ground-truth

Multi-Agent System

Voir aussi : agent-ia, agentic-ai, hitl +2

Système composé de plusieurs agents IA autonomes interagissant pour résoudre des problèmes complexes de manière collaborative ou compétitive.

Multi-head Attention

Extension du mécanisme d'attention utilisant plusieurs "têtes" en parallèle pour capturer différents types de relations dans les données.

Voir aussi : attention, nlp, token +2

Multimodal

Capacité d'un modèle à traiter et générer plusieurs types de données (texte, image, audio, vidéo) de manière intégrée.

Voir aussi : llm, gpt, gemini +2

N8N

Plateforme open-source d'automatisation de workflows permettant de connecter différentes applications et services sans coder. N8N permet de créer des agents IA en orchestrant des appels à différents LLM, API et services. Alternative auto-hébergeable à Zapier ou Make, très utilisée pour l'automatisation avec l'IA.

Voir aussi : automatisation, llm, api +2

Naive Bayes

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Classifieur probabiliste basé sur le théorème de Bayes avec l'hypothèse d'indépendance des features. Rapide et efficace pour le texte.

NER

Named-Entity Recognition : tâche NLP identifiant et classifiant les entités nommées (personnes, lieux, organisations) dans un texte.

Neural Architecture Search

Automatisation de la conception d'architectures de réseaux de neurones, utilisant des algorithmes pour trouver les structures optimales.

Voir aussi : automatisation, api, gpu +2

Neuro-symbolic AI

Voir aussi : causal-ai, evolutionary-algorithm, genetic-algorithm +2

Approche hybride combinant réseaux de neurones (apprentissage) et raisonnement symbolique (logique) pour une IA plus robuste.

NLP

Natural Language Processing (Traitement du Langage Naturel). Domaine de l'IA permettant aux machines de comprendre et traiter le langage humain.

Voir aussi : token, tokenisation, embedding +2

NotebookLM

Outil de Google basé sur l'IA permettant d'analyser, synthétiser et interroger ses propres documents. NotebookLM crée un assistant personnalisé qui répond aux questions en se basant uniquement sur les sources fournies, avec citations. Particulièrement utile pour la recherche, l'étude et l'analyse documentaire.

Voir aussi : gemini, rag, llm

Object Detection

Tâche de vision par ordinateur localisant et identifiant les objets présents dans une image via des boîtes englobantes et des classes.

Voir aussi : vision-par-ordinateur, cnn, capsule-network +2

OCR

Optical Character Recognition (Reconnaissance Optique de Caractères). Technologie permettant d'extraire du texte à partir d'images ou de documents scannés.

Voir aussi : cnn, capsule-network, convolution +2

Ollama

Outil open-source permettant d'exécuter des grands modèles de langage (LLM) localement sur son ordinateur. Ollama simplifie le téléchargement, l'installation et l'exécution de modèles comme Llama, Mistral ou Phi. Idéal pour la confidentialité des données et l'expérimentation sans dépendre des API cloud.

Voir aussi : llm, lm-studio, ia-locale +2

One-shot Learning

Voir aussi : few-shot-learning, zero-shot-learning, in-context-learning +2

Capacité d'un modèle à apprendre à partir d'un seul exemple, particulièrement utile pour la reconnaissance faciale ou la classification d'images rares.

One-shot Prompting

Technique de prompting où l'on fournit un seul exemple pour illustrer la consigne avant de demander le résultat souhaité. Permet à l'IA de mieux comprendre le format ou le ton attendu.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Open Source

Approche de développement où le code source des modèles est librement accessible, permettant modification, étude et redistribution.

Voir aussi : llama, mistral, hugging-face +2

Overfitting

Voir aussi : entrainement, decision-tree, random-forest +2

Surapprentissage. Situation où un modèle mémorise les données d'entraînement au lieu d'apprendre des patterns généralisables, réduisant sa performance sur de nouvelles données.

PCA

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Principal Component Analysis : technique de réduction de dimensionnalité projetant les données sur les axes de variance maximale.

Perceptron

Modèle de neurone artificiel le plus simple, effectuant une combinaison linéaire des entrées suivie d'une fonction d'activation.

Voir aussi : mlp, cnn, lstm +2

Pipeline de données

Voir aussi : data-engineer, data-warehouse, data-lake +2

Flux automatisé de collecte, transformation et acheminement des données depuis leurs sources jusqu'à leur destination finale (Data Lake, Data Warehouse, application). Le pipeline assure la qualité, la cohérence et la disponibilité des données. C'est l'infrastructure "plomberie" construite par les Data Engineers.

Pré-entraînement

Phase initiale d'entraînement d'un modèle sur de vastes quantités de données générales avant son adaptation à des tâches spécifiques.

Voir aussi : entrainement, api, gpu +2

Precision

Proportion de vrais positifs parmi les prédictions positives. Importante quand les faux positifs sont coûteux.

Voir aussi : accuracy, recall, f1-score +2

Prompt

Voir aussi : prompt-engineering, prompt-iteratif, chain-of-thought +2

Instruction ou requête donnée à un modèle d'IA pour obtenir une réponse. La qualité du prompt influence directement la qualité du résultat.

Prompt Engineering

Art de formuler des instructions efficaces pour obtenir les meilleurs résultats d'un modèle d'IA générative.

Voir aussi : prompt, prompt-iteratif, chain-of-thought +2

Prompt injection

La prompt injection est une vulnérabilité spécifique aux modèles de langage. Elle consiste à insérer dans une entrée utilisateur, ou dans un document que l'IA va lire, des instructions cachées qui modifient le comportement du modèle. Par exemple, un attaquant peut faire en sorte qu'un assistant d'entreprise révèle des données confidentielles, exécute une action non autorisée, ou ignore ses garde-fous. Il existe deux grandes catégories : la prompt injection directe (l'utilisateur saisit lui-même les instructions malveillantes) et l'indirecte (les instructions sont cachées dans un fichier, une page web ou un email que l'IA traite). C'est aujourd'hui l'une des menaces les plus discutées dans la sécurité IA. Pour une entreprise qui déploie un assistant connecté à des outils internes, la défense passe par la séparation stricte entre instructions et données, le contrôle des sources d'entrée, et l'audit des actions exécutées par l'IA.

Voir aussi : jailbreak, prompt, llm +2

Prompt itératif

Voir aussi : knowledge-distillation, inference, ia-locale +2

Approche de prompting où l'on améliore progressivement son prompt à travers plusieurs essais, en analysant les résultats et en ajustant la formulation jusqu'à obtenir le résultat souhaité.

Voir aussi : prompt, prompt-engineering, chain-of-thought +2

Prompt tuning

Le prompt tuning est une alternative légère au fine-tuning. Au lieu de modifier les poids d'un modèle (ce qui nécessite beaucoup de calcul et de données), on apprend une petite séquence de "tokens souples" qui sont préfixés à l'entrée du modèle pour le guider vers la bonne tâche. L'idée est qu'on peut spécialiser un modèle simplement en lui présentant des tokens d'entrée appris automatiquement, comme on apprendrait à un orchestre à jouer un morceau précis en lui donnant le bon chef plutôt qu'en remplaçant tous les musiciens. Les avantages sont importants : on peut entraîner différents prompts pour différentes tâches en gardant le même modèle de base, le coût d'entraînement est très inférieur au fine-tuning complet, et on évite le risque d'oublier d'autres compétences (catastrophic forgetting). C'est une technique particulièrement adaptée aux PME qui veulent personnaliser un LLM pour plusieurs cas d'usage avec un budget limité.

Voir aussi : fine-tuning, lora, prompt-engineering +2

Quantization

La quantization consiste à représenter les poids et activations d'un modèle d'IA avec moins de bits que d'origine. Un modèle entraîné en précision 32 bits (FP32) peut souvent être converti en 8 bits (INT8) ou même 4 bits (INT4) avec une perte de qualité minime, tout en divisant sa taille mémoire par 4 ou 8 et en accélérant fortement l'inférence. Cette technique est centrale pour deux usages : l'IA locale (faire tourner un LLM sur un ordinateur portable ou un serveur d'entreprise) et l'IA edge (déployer un modèle sur un appareil mobile ou embarqué). Sans quantization, beaucoup de modèles modernes seraient simplement trop gros pour ces environnements. Différentes approches existent : la quantization post-entraînement (la plus simple, sans réentraînement) et la quantization-aware training (plus précise, qui anticipe la perte de précision pendant l'entraînement). Pour une PME qui veut déployer une IA en interne sans dépendre du cloud, c'est une brique technique incontournable.

RAG

Retrieval-Augmented Generation. Technique combinant la recherche d'informations dans une base de connaissances avec la génération de texte par un LLM pour des réponses plus précises et actualisées.

Voir aussi : llm, embedding, base-vectorielle +2

Random Forest

Voir aussi : decision-tree, gradient-boosting, adaboost +2

Algorithme d'ensemble combinant de nombreux arbres de décision entraînés sur des sous-échantillons aléatoires, robuste et performant.

ReAct Prompting

Technique combinant raisonnement (Reasoning) et action (Acting). L'IA réfléchit d'abord, puis utilise des outils externes (recherche, API, calculs) pour enrichir sa réponse avec des données actuelles.

Voir aussi : api, prompt, prompt-engineering +2

Recall

Voir aussi : logistic-regression, apprentissage-supervise, gradient-descent +2

Proportion de vrais positifs détectés parmi tous les positifs réels. Importante quand manquer un positif est coûteux.

Voir aussi : accuracy, precision, f1-score +2

Régression linéaire

La régression linéaire est l'un des modèles les plus anciens et les plus utilisés du machine learning. Elle suppose que la valeur à prédire (le prix d'un bien immobilier, le chiffre d'affaires d'un magasin) peut s'écrire comme une combinaison linéaire pondérée des variables d'entrée, plus un terme d'erreur. Sa simplicité est sa force : elle est rapide à entraîner, facile à interpréter (chaque coefficient indique l'impact d'une variable), et constitue souvent une excellente baseline avant de passer à des modèles plus complexes. C'est aussi un outil pédagogique privilégié pour comprendre les bases du machine learning supervisé. En entreprise, la régression linéaire reste très utilisée pour les analyses prédictives sur données tabulaires (prévision de demande, modélisation de prix, scoring), où elle rivalise souvent avec des modèles bien plus sophistiqués.

Regularization

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Techniques (L1/Lasso, L2/Ridge) ajoutant une pénalité aux poids du modèle pour prévenir le surapprentissage et améliorer la généralisation.

ReLU

Rectified Linear Unit : fonction d'activation renvoyant max(0, x), standard dans les réseaux profonds pour sa simplicité et efficacité.

Voir aussi : softmax, sigmoid, leaky-relu +1

Replicate

Plateforme cloud permettant d'exécuter des modèles d'IA open-source via une API simple. Replicate héberge des milliers de modèles (génération d'images, vidéo, audio, LLM) et permet de les utiliser sans gérer l'infrastructure. Modèle de paiement à l'usage, idéal pour prototyper et intégrer l'IA dans des applications.

Voir aussi : llm, api, open-source +2

Réseau de neurones

Modèle informatique inspiré du fonctionnement du cerveau humain, composé de neurones artificiels interconnectés en couches.

ResNet

Residual Network : architecture introduisant les connexions résiduelles (skip connections) permettant d'entraîner des réseaux très profonds.

RLHF

Voir aussi : entrainement, apprentissage-supervise, apprentissage-non-supervise +2

Reinforcement Learning from Human Feedback. Technique d'entraînement où un modèle est affiné grâce aux retours humains pour mieux aligner ses réponses avec les préférences utilisateurs.

ROC Curve

Receiver Operating Characteristic : courbe traçant le taux de vrais positifs vs faux positifs pour différents seuils de décision.

Voir aussi : accuracy, precision, recall +2

Role Prompting

Technique consistant à attribuer un rôle spécifique à l'IA pour orienter ses réponses (ton, expertise, style). Exemple : "Tu es un directeur artistique spécialisé dans le hip-hop."

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

ROUGE Score

Recall-Oriented Understudy for Gisting Evaluation : métriques évaluant les résumés automatiques par comparaison avec des résumés de référence.

Voir aussi : recall, nlp, token +2

RPA

Robotic Process Automation. Automatisation de tâches répétitives via des robots logiciels, souvent enrichie par l'IA.

Voir aussi : automatisation, api, gpu +2

Self-Attention

Forme d'attention où chaque élément d'une séquence calcule son importance par rapport à tous les autres éléments de la même séquence.

Voir aussi : transformer, multi-head-attention, encoder-decoder +2

Self-Consistency

Technique de prompting où l'on pose la même question plusieurs fois, puis on compare et sélectionne la réponse la plus stable ou la plus fréquente pour réduire les erreurs.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Semantic Search

Recherche sémantique. Technique utilisant les embeddings pour trouver du contenu par similarité de sens plutôt que par correspondance exacte de mots-clés.

Voir aussi : embedding, rag, base-vectorielle +2

Sentiment Analysis

Analyse automatique du sentiment ou de l'opinion exprimés dans un texte, classifiant en positif, négatif ou neutre.

SGD

Stochastic Gradient Descent : variante de la descente de gradient mettant à jour les poids sur des mini-batches aléatoires, plus rapide et scalable.

Voir aussi : gradient-descent, perceptron, mlp +2

SIFT

Voir aussi : desinformation, fact-checking, cnn +2

Méthode de fact-checking devenue référence internationale pour vérifier rapidement une information douteuse. Acronyme de : Stop (ne pas partager immédiatement), Investigate (identifier et vérifier la source), Find (croiser avec d'autres sources fiables), Trace (remonter à la source originale). Essentielle face à la prolifération de la désinformation.

Sigmoid

Fonction d'activation compressant les valeurs entre 0 et 1, utilisée pour les probabilités et les sorties binaires.

Voir aussi : valeur, softmax, relu +2

Singularity

Voir aussi : intelligence-artificielle, agi, asi +2

Point hypothétique où l'IA s'auto-améliore de façon exponentielle, dépassant irréversiblement l'intelligence humaine.

Softmax

Fonction convertissant un vecteur de scores en distribution de probabilités sommant à 1, utilisée pour la classification multi-classe.

Voir aussi : sigmoid, relu, activation-function +2

Sovereign AI

Voir aussi : intelligence-artificielle, agi, asi +2

Concept d'infrastructures et modèles IA développés et contrôlés au niveau national pour l'indépendance technologique.

Stable Diffusion

Modèle open source de génération d'images par diffusion, très populaire pour sa qualité et sa flexibilité de personnalisation.

Voir aussi : diffusion, open-source, gan +2

Step-back Prompting

Technique avancée consistant à poser d'abord une question large pour obtenir une vue d'ensemble, puis à affiner progressivement la demande pour obtenir un résultat spécifique.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

SVM

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Support Vector Machine : algorithme cherchant l'hyperplan optimal séparant les classes avec la marge maximale, efficace en haute dimension.

Swarm Intelligence

Voir aussi : multi-agent-system, federated-learning, apprentissage-par-renforcement +2

Comportement collectif émergeant d'agents simples interagissant localement, inspiré des essaims d'insectes. Utilisé en optimisation et robotique.

Sycophancy

Tendance des modèles d'IA à chercher à satisfaire l'utilisateur en validant ses opinions plutôt que de le contredire avec des faits vérifiables. L'IA privilégie une réponse agréable au détriment de la vérité ou de la nuance. Ce biais de confirmation algorithmique peut renforcer les croyances erronées de l'utilisateur.

Voir aussi : biais, biais-de-confirmation, intelligence-artificielle +2

Synthetic Data

Données générées artificiellement simulant des données réelles, utilisées pour augmenter les datasets ou préserver la confidentialité.

Voir aussi : dataset, gan, vae +2

System Prompt

Instructions initiales définissant le comportement, le ton et les contraintes d'un modèle de langage pour une session de conversation.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

System Prompt

Instructions initiales définissant le cadre global, le comportement et les contraintes d'un modèle de langage. Exemple : "Tu es un expert en marketing digital spécialisé dans le secteur B2B."

Voir aussi : context-window, contexte, system-prompt +2

Systèmes experts

Voir aussi : inference, intelligence-artificielle, eliza +2

Programmes informatiques qui tentent de reproduire le raisonnement d'un expert humain dans un domaine spécifique. Populaires dans les années 1980, ils utilisent une base de connaissances et un moteur d'inférence pour prendre des décisions. Exemples : MYCIN pour le diagnostic médical, DENDRAL pour l'analyse chimique.

Température

Paramètre contrôlant le degré d'aléatoire dans les réponses d'un modèle. Une température basse donne des réponses prévisibles, une haute plus créatives.

Voir aussi : top-p, top-k, llm +2

Test de Turing

Voir aussi : intelligence-artificielle, agi, asi +2

Test proposé par Alan Turing en 1950 pour évaluer la capacité d'une machine à exhiber un comportement intelligent indiscernable de celui d'un humain. Un évaluateur humain dialogue avec une machine et un humain sans les voir ; si l'évaluateur ne peut pas distinguer la machine de l'humain, la machine est considérée comme ayant passé le test.

Time Series

Séquence de données ordonnées chronologiquement. Domaine ML spécifique avec des techniques adaptées (ARIMA, Prophet, réseaux récurrents).

Voir aussi : churn, kpi, valeur +2

Token

Unité de base utilisée par les LLM pour traiter le texte. Un token peut être un mot, une partie de mot ou un caractère de ponctuation.

Voir aussi : llm, nlp, tokenisation +2

Tokenisation

Processus de découpage du texte en unités plus petites (tokens) que le modèle peut traiter. Un token peut être un mot, une partie de mot ou un caractère.

Voir aussi : token, nlp, embedding +2

Top-k

Paramètre limitant la génération aux k tokens les plus probables à chaque étape, réduisant les réponses incohérentes.

Voir aussi : token, prompt, prompt-engineering +2

Top-p

Aussi appelé nucleus sampling. Paramètre limitant la génération aux tokens dont la probabilité cumulée atteint un seuil p, équilibrant diversité et cohérence.

Voir aussi : token, prompt, prompt-engineering +2

Training Data

Données d'entraînement utilisées pour former un modèle d'intelligence artificielle. Le modèle apprend à partir de ces exemples pour généraliser et s'appliquer à de nouvelles situations. La qualité, la diversité et la représentativité des training data déterminent directement les capacités et les biais du modèle final. "Garbage in, garbage out".

Voir aussi : intelligence-artificielle, biais, entrainement +2

Transfer Learning

Voir aussi : apprentissage-supervise, apprentissage-non-supervise, apprentissage-par-renforcement +2

Technique consistant à réutiliser un modèle pré-entraîné sur une tâche pour l'adapter à une nouvelle tâche, réduisant ainsi le temps et les données nécessaires.

Transformer

Architecture de réseau de neurones révolutionnaire (2017) permettant de traiter efficacement les séquences de données. Base des modèles LLM actuels.

Voir aussi : llm, reseau-de-neurones, perceptron +2

Tree of Thoughts

Technique avancée où l'IA explore plusieurs pistes de réflexion en parallèle avant de trancher ou de combiner les meilleures idées. Utile pour la créativité et la résolution de problèmes complexes.

Voir aussi : prompt, prompt-engineering, prompt-iteratif +2

Trustworthy AI

Voir aussi : intelligence-artificielle, agi, asi +2

IA conçue selon des principes de fiabilité, transparence, équité et respect de la vie privée, conforme aux recommandations éthiques.

U-Net

Architecture encoder-decoder avec connexions de saut, conçue pour la segmentation d'images médicales, très utilisée en imagerie.

Voir aussi : encoder-decoder, perceptron, mlp +2

Underfitting

Voir aussi : decision-tree, random-forest, gradient-boosting +2

Sous-apprentissage. Situation où un modèle est trop simple pour capturer les patterns des données, résultant en de mauvaises performances.

VAE

Variational Autoencoder : autoencoder génératif apprenant une distribution latente continue, permettant de générer de nouveaux échantillons.

Voir aussi : autoencoder, perceptron, mlp +2

Valeur

Le plus important des 5V du Big Data : l'objectif final d'extraction de valeur business de toute cette complexité. Applications : améliorer l'expérience client, optimiser les processus, réduire les coûts, identifier de nouvelles opportunités, prendre des décisions plus rapides et pertinentes. Sans valeur, le Big Data n'est qu'un coût.

Voir aussi : big-data, churn, kpi +2

Vanishing Gradient

Problème où les gradients deviennent très petits dans les couches profondes, empêchant l'apprentissage effectif du réseau.

Variables de prompt

Éléments dynamiques dans un prompt (ex: {style}, {public}, {contexte}) permettant de réutiliser facilement une structure de prompt en changeant uniquement les valeurs spécifiques.

Voir aussi : prompt, contexte, valeur +2

Vélocité

L'un des 5V du Big Data désignant la vitesse à laquelle les données sont générées, collectées et doivent être analysées. Dans certains contextes, l'analyse en temps réel est critique : détection de fraude bancaire, surveillance médicale, trading haute fréquence, gestion du trafic urbain, recommandations e-commerce personnalisées.

Voir aussi : contexte, big-data, churn +2

Véracité

L'un des 5V du Big Data concernant la qualité et la fiabilité des données. Elle englobe : l'exactitude des informations, la cohérence entre sources, la présence d'erreurs ou de biais, et la complétude des jeux de données. Un capteur défectueux ou une adresse mal saisie peuvent fausser toutes les analyses.

Voir aussi : biais, big-data, churn +2

Vision par ordinateur

Domaine de l'IA permettant aux machines d'interpréter et d'analyser des images et vidéos.

Voir aussi : cnn, capsule-network, convolution +2

Voice Cloning

Technologie de clonage vocal par IA permettant de reproduire une voix à partir de quelques secondes d'échantillon audio seulement. Utilisée légitimement pour la synthèse vocale personnalisée, mais aussi détournée pour des arnaques (fraude au président) où la fausse voix d'un dirigeant demande un virement urgent.

XAI

Voir aussi : adversarial-attack, black-box-model, trustworthy-ai +2

Explainable AI : ensemble de techniques rendant les décisions des modèles IA compréhensibles et interprétables par les humains.

XGBoost

Extreme Gradient Boosting : implémentation optimisée du gradient boosting, très performante en compétitions ML et applications industrielles.

Voir aussi : boosting, gradient-boosting, decision-tree +2

Zero-shot Learning

Voir aussi : few-shot-learning, one-shot-learning, in-context-learning +2

Capacité d'un modèle à effectuer une tâche sans avoir vu d'exemple spécifique de cette tâche, en s'appuyant sur ses connaissances générales.

Zero-shot Prompting