Poser les sciences de la donnée

On parle beaucoup d’intelligence artificielle.
De ses usages, de ses promesses, de ses risques.
Plus rarement des sciences de la donnée qui la rendent possible — et encore moins de ce qu’elles font à nos manières de décider et de gouverner.

Les sciences de la donnée constituent les fondations techniques des systèmes data & IA.
Mais elles ne suffisent pas à structurer la décision dans les organisations.

👉 Cette question est abordée dans notre guide dédié à l’architecture décisionnelle.

Derrière l’IA, il n’y a pas une entité autonome, mais un empilement de sciences : mathématiques, statistiques, informatique, sciences du traitement de la donnée, sciences de la décision. Des sciences qui transforment le réel en données, les données en modèles, et les modèles en options d’action.

Les sciences mobilisées par les systèmes data et IA.

L’intelligence artificielle ne repose pas sur une seule discipline, mais sur un empilement de sciences qui rendent la décision calculable, observable et parfois automatisable.

Des mathématiques qui modélisent l’incertitude, à l’informatique qui rend les calculs possibles à grande échelle, en passant par les sciences de la donnée qui produisent des modèles et les sciences de la décision qui orientent l’action.

Les sciences humaines, enfin, rappellent que ces systèmes ne fonctionnent jamais hors des collectifs, des responsabilités et des rapports de pouvoir.

Les sciences de la donnée : les fondations
Les sciences de la donnée : traitement et exploitation
Les sciences émergentes
Gouverner : science de l’architecture décisionnelle
En synthèse – Tableau de structuration des sciences de la donnée mobilisées par les systèmes data & IA

Ce schéma ne cherche pas à figer les frontières entre disciplines.
Il montre simplement que la décision augmentée par la donnée repose sur un ensemble de sciences qui se superposent et se répondent.

Poser les sciences de la donnée, ce n’est pas chercher l’exhaustivité ni produire une cartographie figée. C’est accepter de regarder les coulisses : les cadres intellectuels, les hypothèses implicites, les choix de représentation qui orientent silencieusement ce que l’on voit — et ce que l’on ne voit pas.

Cette question est indissociable de celle de la gouvernance de la donnée. Non pas au sens d’une appropriation ou d’un inventaire exhaustif — souvent illusoire dans des systèmes complexes — mais comme une attention portée aux flux de données : là où elles circulent, se transforment, s’anonymisent, produisent (ou non) un impact réel pour les équipes, les produits et les décisions.

Dans les organisations, la donnée n’appartient jamais vraiment à quelqu’un. Elle traverse les métiers, les systèmes, les outils. Chercher à en être “propriétaire” relève souvent davantage de jeux de pouvoir que d’une gouvernance effective. Suivre les flux, en revanche, permet de relier le développement aux usages, les métiers aux clients, et les décisions aux effets observables.

Cet article n’a pas vocation à expliquer l’IA ni à prescrire une méthode. Il ouvre un espace de réflexion sur les fondations scientifiques qui structurent nos environnements décisionnels, et sur la manière dont la donnée peut redevenir un appui pour décider — plutôt qu’un prétexte pour diluer la responsabilité.

Dans l’esprit du Campus, ce texte est volontairement vivant. Il évoluera au fil de l’année, en fonction de l’actualité, des débats émergents, des transformations observées sur le terrain. Les sections qui suivent ouvrent des champs de pensée. Elles seront enrichies, précisées, parfois déplacées, à mesure que le Campus continue d’explorer ce que décider, livrer et gouverner veulent dire à l’ère de la donnée et de l’IA.

Pour une exploration approfondie des tensions invisibles que révèle la gouvernance de la donnée, voir aussi notre article précédent :
“Gouvernance des données : révélateur des tensions invisibles”.

Les sciences de la donnée : les fondations

Ce sont celles qui rendent la donnée lisible, visible. Ce sont les bases.

Mathématiques & statistiques

Probabilités
Statistiques descriptives et inférentielles
Modélisation, optimisation
Séries temporelles

➡️ Elles répondent à : “Que peut-on inférer ? Avec quel niveau de confiance ?”

Ici on trouve :

Algorithmique
Bases de données
Architecture des systèmes
Cloud, calcul distribué

➡️ “Comment stocker, traiter et faire circuler la donnée à l’échelle ?”

Ce qu’il est important de noter c’est que l’IA est d’abord algorithmique pour gérer la complexité. Cela permet :
Structures de données, graphes, heuristiques
➡️ “Comment transformer un problème en procédure calculable ?”

Parmi les branches importantes de la théorie de l’information de Shannon, on peut citer :

la cryptographie.

le codage de l’information ;

la mesure quantitative de redondance d’un texte ;

la compression de données ;

Cela permet notamment d’analyser : signal, bruit, compression, entropie… Pour répondre à la question :
➡️ “Qu’est-ce qui constitue réellement de l’information dans un flux de données ?”

C’est très pertinent pour parler :

des LLM.

de qualité de donnée

de signal vs bruit

Les sciences de la donnée : traitement et exploitation

Ici c’est le prolongement mathématique ou les sciences de l’ingénierie qui permettent de rendre la donnée exploitable, et résoudre des problèmes associés

La data science et l’ingénierie des données sont deux domaines interconnectés qui explorent l’utilisation des données pour résoudre des problèmes et générer des informations exploitables.

Exploration de données
Modélisation statistique
Visualisation
Expérimentation

➡️ “Qu’est-ce que les données racontent vraiment ?”

Apprentissage supervisé / non supervisé
Deep learning
NLP, vision, systèmes de recommandation

➡️ “Que peut-on automatiser, prédire ou générer ?”

Pipelines de données
Qualité, fiabilité, traçabilité
Gouvernance technique

➡️ “Comment rendre la donnée utilisable, robuste et durable ?”

C’est le cœur technique du système data.

Les sciences de la décision et de la valeur

C’est là que la donnée devient une action organisationnelle.

Aide à la décision

Modèles multicritères
Optimisation sous contraintes
Théorie des jeux

➡️ “Comment décider dans la complexité ?”

KPI , voir notre série Déambulations de Romain qui montre comment un étudiant charche à comprendre les indicateurs de performances et les indcateurs de valeurs.
Mesure de valeur
Expérimentation produit
Pilotage stratégique

➡️ “À quoi sert la donnée pour l’action ?”

Les sciences humaines et sociales autour de la donnée

Parce que les organisations ne sont pas des machines de calcul, a décision implique notamment :

responsabilité

cognition

perception

biais

pouvoir

C’est pourquoi les sciences humaines sont impliquées.

Biais cognitifs

Prise de décision humaine

Interaction humain–IA

Charge mentale informationnelle

➡️ “Comment les humains comprennent (ou maltraitent) la donnée ?”

Voir également la synthèse des travaux de Gérald Bronner sur les Biais cognitifs & désinformation.

Pouvoir et données , c’est voir la :

Donnée comme instrument de contrôle ou d’émancipation
Dynamiques collectives
Effets organisationnels des outils data & IA

➡️ “Que fait la donnée aux collectifs ?” Exemple : How malicious AI swarms can threaten democracy-The fusion of agentic AI and LLMs marks a new frontier in information warfare ou encore notre ebook Le monde d’après

RGPD, privacy, souveraineté

Éthique de l’IA
Responsabilité algorithmique
Justice, équité, transparence

➡️ “Que peut-on faire ? Que doit-on refuser ?”

Les sciences émergentes

C’est la gouvernance des systèmes décisionnels augmentés par la donnée.

Capacité à lire, questionner, critiquer la donnée

Acculturation non technique

Donnée comme produit

Valeur d’usage vs valeur business

Arbitrage humain / automatisation

Voir notre série sur les Acteurs Produits Data et IA et notamment le rôle de Data Product Manager

Human-in-the-loop
Cadres de responsabilité
Décision augmentée (et non déléguée)

Au coeur des travaux du campus en 2026 : “Décider, livrer et gouverner à l’ère de l’IA«

Exemple :

Cybernétique et systèmes adaptatifs
Boucles de rétroaction, régulation, pilotage
➡️ “Comment un système apprend de ses propres effets ?”

Cela relie directement donnée → décision → impact → ajustement.

Gouverner : science de l’architecture décisionnelle

Gouverner ne consiste pas à décider à la place.
Gouverner consiste à concevoir et expliciter l’architecture dans laquelle les décisions deviennent possibles, responsables et cohérentes.

Dans un environnement data & IA, gouverner signifie :

définir les lieux d’instruction (données, modèles, outils),
clarifier les lieux d’arbitrage,
expliciter les responsabilités,
organiser les boucles d’impact,
aligner usage, valeur et responsabilité.

Gouverner est donc une fonction transversale :

aux mathématiques (fiabilité des modèles),
à l’informatique (robustesse des systèmes),
à l’exploitation (qualité des flux),
à la décision (arbitrage),
aux sciences humaines (comportements, pouvoir, culture).

Les sciences de la donnée rendent les modèles possibles.
Mais elles ne disent pas comment les décisions doivent être portées dans l’organisation.

Cette question est approfondie dans notre page dédiée à l’architecture décisionnelle à l’ère de l’IA, qui explore comment organiser les lieux d’instruction, d’arbitrage et de responsabilité dans des systèmes décisionnels augmentés par la donnée.

👉 Pour une exploration plus approfondie de cette notion, voir la page :
Architecture décisionnelle à l’ère de l’IA

En synthèse – Tableau de structuration des sciences de la donnée mobilisées par les systèmes data & IA

Les sciences de la donnée ne servent pas à produire des chiffres.
Elles servent à transformer l’incertitude du monde en hypothèses d’action.

👉 la vraie maturité data commence quand la donnée cesse d’être un objet technique pour devenir un objet relationnel et politique.

Domaine scientifique	Ce que la science étudie	Rôle dans les systèmes data / IA	Exemples concrets dans les organisations
Probabilités & statistiques (mathématiques)	Modélisation de l’incertitude et inférence	Estimation, prédiction, apprentissage statistique	scoring client, prévision de demande, détection fraude
Optimisation (mathématiques)	Recherche de la meilleure solution sous contraintes	Entraînement des modèles, allocation de ressources	optimisation logistique, pricing dynamique
Théorie de l’information	Mesure du signal, du bruit et de l’information	Encodage des données, apprentissage ML, compression	embeddings, tokenisation des LLM
Séries temporelles	Modélisation de phénomènes dans le temps	Prévision, détection d’anomalies	prévision ventes, monitoring systèmes
Algorithmique (informatique)	Procédures calculables et complexité	Construction des pipelines et modèles	moteurs de recommandation, recherche
Bases de données	Organisation et interrogation des données	Stockage et structuration de la donnée	data warehouses, data lakes
Systèmes distribués / cloud	Calcul et stockage à grande échelle	Scalabilité des traitements data	plateformes data, infrastructures IA
Data engineering	Conception des flux de données	Fiabilité et circulation de la donnée	pipelines ETL, ingestion temps réel
Data science	Analyse et modélisation de données	Transformation des données en connaissances	segmentation client, modèles prédictifs
Machine learning / IA	Apprentissage automatique à partir des données	Automatisation de tâches cognitives	recommandation, NLP, vision
Recherche opérationnelle	Optimisation des décisions complexes	Planification et allocation optimale	supply chain, planning ressources
Business / product analytics	Analyse de la performance et de la valeur	Pilotage produit et stratégique	A/B testing, KPI produit
Sciences cognitives	Fonctionnement de la cognition humaine	Interaction humain–IA et biais	interprétation des dashboards
Sociologie des organisations	Dynamiques de pouvoir et coordination	Impact organisationnel des systèmes data	gouvernance data, conflits d’usage
Droit et éthique de l’IA	Normes et responsabilité	Encadrement des systèmes algorithmiques	RGPD, audit algorithmique
Cybernétique	Boucles de rétroaction et contrôle	Pilotage de systèmes informationnels	monitoring IA, systèmes adaptatifs
Théorie des systèmes	Interaction entre éléments d’un système	Vision systémique des organisations data	architecture data & gouvernance
Data literacy	Capacité à lire et critiquer la donnée	Appropriation par les équipes	culture data
Data product management	Gestion de la donnée comme produit	création de valeur à partir des données	data products, API data
Gouvernance décisionnelle	Architecture des responsabilités	alignement décision / donnée	human-in-the-loop

Facebook Tweet Pin LinkedIn

Les sciences mobilisées par les systèmes data et IA.

Les sciences de la donnée : les fondations

Les sciences de la donnée : traitement et exploitation

Les sciences de la décision et de la valeur

Les sciences humaines et sociales autour de la donnée

Les sciences émergentes

Gouverner : science de l’architecture décisionnelle

En synthèse – Tableau de structuration des sciences de la donnée mobilisées par les systèmes data & IA

Architecture décisionnelle & IA : pourquoi les organisations ne savent plus décider

Architecture décisionnelle : structurer la décision à l’ère de l’IA

Cartographier les décisions : comprendre l’architecture décisionnelle des organisations

Architecture décisionnelle : le défi des plateformes de santé à l’ère de l’IA

Un cadre de gouvernance à l’ère de l’IA : l’architecture décisionnelle