Poser les sciences de la donnée

On parle beaucoup d’intelligence artificielle.
De ses usages, de ses promesses, de ses risques.
Plus rarement des sciences de la donnée qui la rendent possible — et encore moins de ce qu’elles font à nos manières de décider et de gouverner.

Derrière l’IA, il n’y a pas une entité autonome, mais un empilement de sciences : mathématiques, statistiques, informatique, sciences du traitement de la donnée, sciences de la décision. Des sciences qui transforment le réel en données, les données en modèles, et les modèles en options d’action.

Poser les sciences de la donnée. Dela donnée à la décision

Les sciences mobilisées par les systèmes data et IA.

L’intelligence artificielle ne repose pas sur une seule discipline, mais sur un empilement de sciences qui rendent la décision calculable, observable et parfois automatisable.

Des mathématiques qui modélisent l’incertitude, à l’informatique qui rend les calculs possibles à grande échelle, en passant par les sciences de la donnée qui produisent des modèles et les sciences de la décision qui orientent l’action.

Les sciences humaines, enfin, rappellent que ces systèmes ne fonctionnent jamais hors des collectifs, des responsabilités et des rapports de pouvoir.

Ce schéma ne cherche pas à figer les frontières entre disciplines.
Il montre simplement que la décision augmentée par la donnée repose sur un ensemble de sciences qui se superposent et se répondent.

Poser les sciences de la donnée, ce n’est pas chercher l’exhaustivité ni produire une cartographie figée. C’est accepter de regarder les coulisses : les cadres intellectuels, les hypothèses implicites, les choix de représentation qui orientent silencieusement ce que l’on voit — et ce que l’on ne voit pas.

Cette question est indissociable de celle de la gouvernance de la donnée. Non pas au sens d’une appropriation ou d’un inventaire exhaustif — souvent illusoire dans des systèmes complexes — mais comme une attention portée aux flux de données : là où elles circulent, se transforment, s’anonymisent, produisent (ou non) un impact réel pour les équipes, les produits et les décisions.

Dans les organisations, la donnée n’appartient jamais vraiment à quelqu’un. Elle traverse les métiers, les systèmes, les outils. Chercher à en être “propriétaire” relève souvent davantage de jeux de pouvoir que d’une gouvernance effective. Suivre les flux, en revanche, permet de relier le développement aux usages, les métiers aux clients, et les décisions aux effets observables.

Cet article n’a pas vocation à expliquer l’IA ni à prescrire une méthode. Il ouvre un espace de réflexion sur les fondations scientifiques qui structurent nos environnements décisionnels, et sur la manière dont la donnée peut redevenir un appui pour décider — plutôt qu’un prétexte pour diluer la responsabilité.

Dans l’esprit du Campus, ce texte est volontairement vivant. Il évoluera au fil de l’année, en fonction de l’actualité, des débats émergents, des transformations observées sur le terrain. Les sections qui suivent ouvrent des champs de pensée. Elles seront enrichies, précisées, parfois déplacées, à mesure que le Campus continue d’explorer ce que décider, livrer et gouverner veulent dire à l’ère de la donnée et de l’IA.

Pour une exploration approfondie des tensions invisibles que révèle la gouvernance de la donnée, voir aussi notre article précédent :
Gouvernance des données : révélateur des tensions invisibles”.

Les sciences de la donnée : les fondations

Ce sont celles qui rendent la donnée lisible, visible. Ce sont les bases.

Mathématiques & statistiques

  • Probabilités
  • Statistiques descriptives et inférentielles
  • Modélisation, optimisation
  • Séries temporelles

➡️ Elles répondent à : “Que peut-on inférer ? Avec quel niveau de confiance ?”

Ici on trouve :

  • Algorithmique
  • Bases de données
  • Architecture des systèmes
  • Cloud, calcul distribué

➡️ “Comment stocker, traiter et faire circuler la donnée à l’échelle ?”

Ce qu’il est important de noter c’est que l’IA est d’abord algorithmique pour gérer la complexité. Cela permet :
Structures de données, graphes, heuristiques
➡️ “Comment transformer un problème en procédure calculable ?”

Parmi les branches importantes de la théorie de l’information de Shannon, on peut citer :

la cryptographie.

le codage de l’information ;

la mesure quantitative de redondance d’un texte ;

la compression de données ;

Cela permet notamment d’analyser : signal, bruit, compression, entropie… Pour répondre à la question :
➡️ “Qu’est-ce qui constitue réellement de l’information dans un flux de données ?”

C’est très pertinent pour parler :

des LLM.

de qualité de donnée

de signal vs bruit

Les sciences de la donnée : traitement et exploitation

Ici c’est le prolongement mathématique ou les sciences de l’ingénierie qui permettent de rendre la donnée exploitable, et résoudre des problèmes associés

La data science et l’ingénierie des données sont deux domaines interconnectés qui explorent l’utilisation des données pour résoudre des problèmes et générer des informations exploitables.

  • Exploration de données
  • Modélisation statistique
  • Visualisation
  • Expérimentation

➡️ “Qu’est-ce que les données racontent vraiment ?”

  • Apprentissage supervisé / non supervisé
  • Deep learning
  • NLP, vision, systèmes de recommandation

➡️ “Que peut-on automatiser, prédire ou générer ?”

  • Pipelines de données
  • Qualité, fiabilité, traçabilité
  • Gouvernance technique

➡️ “Comment rendre la donnée utilisable, robuste et durable ?”

C’est le cœur technique du système data.


Les sciences de la décision et de la valeur

C’est là que la donnée devient une action organisationnelle.

Aide à la décision

  • Modèles multicritères
  • Optimisation sous contraintes
  • Théorie des jeux

➡️ “Comment décider dans la complexité ?”

  • KPI , voir notre série Déambulations de Romain qui montre comment un étudiant charche à comprendre les indicateurs de performances et les indcateurs de valeurs.
  • Mesure de valeur
  • Expérimentation produit
  • Pilotage stratégique

➡️ “À quoi sert la donnée pour l’action ?”


Les sciences humaines et sociales autour de la donnée

Parce que les organisations ne sont pas des machines de calcul, a décision implique notamment :

  • responsabilité
  • cognition
  • perception
  • biais
  • pouvoir

C’est pourquoi les sciences humaines sont impliquées.

Biais cognitifs

Prise de décision humaine

Interaction humain–IA

Charge mentale informationnelle

➡️ “Comment les humains comprennent (ou maltraitent) la donnée ?”

Voir également la synthèse des travaux de Gérald Bronner sur les Biais cognitifs & désinformation.

Pouvoir et données , c’est voir la :

  • Donnée comme instrument de contrôle ou d’émancipation
  • Dynamiques collectives
  • Effets organisationnels des outils data & IA

➡️ “Que fait la donnée aux collectifs ?” Exemple : How malicious AI swarms can threaten democracy-The fusion of agentic AI and LLMs marks a new frontier in information warfare ou encore notre ebook Le monde d’après

RGPD, privacy, souveraineté

  • Éthique de l’IA
  • Responsabilité algorithmique
  • Justice, équité, transparence

➡️ “Que peut-on faire ? Que doit-on refuser ?”

Les sciences émergentes

C’est la gouvernance des systèmes décisionnels augmentés par la donnée.

Capacité à lire, questionner, critiquer la donnée

Acculturation non technique

Donnée comme produit

Valeur d’usage vs valeur business

Arbitrage humain / automatisation

Voir notre série sur les Acteurs Produits Data et IA et notamment le rôle de Data Product Manager

  • Human-in-the-loop
  • Cadres de responsabilité
  • Décision augmentée (et non déléguée)

Au coeur des travaux du campus en 2026 : “Décider, livrer et gouverner à l’ère de l’IA« 

Exemple :

Cybernétique et systèmes adaptatifs
Boucles de rétroaction, régulation, pilotage
➡️ “Comment un système apprend de ses propres effets ?”

Cela relie directement donnée → décision → impact → ajustement.


Gouverner : science de l’architecture décisionnelle

Gouverner ne consiste pas à décider à la place.
Gouverner consiste à concevoir et expliciter l’architecture dans laquelle les décisions deviennent possibles, responsables et cohérentes.

Dans un environnement data & IA, gouverner signifie :


Les sciences de la donnée rendent les modèles possibles.
Mais elles ne disent pas comment les décisions doivent être portées dans l’organisation.

Cette question est approfondie dans notre page dédiée à l’architecture décisionnelle à l’ère de l’IA, qui explore comment organiser les lieux d’instruction, d’arbitrage et de responsabilité dans des systèmes décisionnels augmentés par la donnée.

👉 Pour une exploration plus approfondie de cette notion, voir la page :
Architecture décisionnelle à l’ère de l’IA

En synthèse – Tableau de structuration des sciences de la donnée mobilisées par les systèmes data & IA


Les sciences de la donnée ne servent pas à produire des chiffres.
Elles servent à transformer l’incertitude du monde en hypothèses d’action.


👉 la vraie maturité data commence quand la donnée cesse d’être un objet technique pour devenir un objet relationnel et politique.

Domaine scientifiqueCe que la science étudieRôle dans les systèmes data / IAExemples concrets dans les organisations
Probabilités & statistiques (mathématiques)Modélisation de l’incertitude et inférenceEstimation, prédiction, apprentissage statistiquescoring client, prévision de demande, détection fraude
Optimisation (mathématiques)Recherche de la meilleure solution sous contraintesEntraînement des modèles, allocation de ressourcesoptimisation logistique, pricing dynamique
Théorie de l’informationMesure du signal, du bruit et de l’informationEncodage des données, apprentissage ML, compressionembeddings, tokenisation des LLM
Séries temporellesModélisation de phénomènes dans le tempsPrévision, détection d’anomaliesprévision ventes, monitoring systèmes
Algorithmique (informatique)Procédures calculables et complexitéConstruction des pipelines et modèlesmoteurs de recommandation, recherche
Bases de donnéesOrganisation et interrogation des donnéesStockage et structuration de la donnéedata warehouses, data lakes
Systèmes distribués / cloudCalcul et stockage à grande échelleScalabilité des traitements dataplateformes data, infrastructures IA
Data engineeringConception des flux de donnéesFiabilité et circulation de la donnéepipelines ETL, ingestion temps réel
Data scienceAnalyse et modélisation de donnéesTransformation des données en connaissancessegmentation client, modèles prédictifs
Machine learning / IAApprentissage automatique à partir des donnéesAutomatisation de tâches cognitivesrecommandation, NLP, vision
Recherche opérationnelleOptimisation des décisions complexesPlanification et allocation optimalesupply chain, planning ressources
Business / product analyticsAnalyse de la performance et de la valeurPilotage produit et stratégiqueA/B testing, KPI produit
Sciences cognitivesFonctionnement de la cognition humaineInteraction humain–IA et biaisinterprétation des dashboards
Sociologie des organisationsDynamiques de pouvoir et coordinationImpact organisationnel des systèmes datagouvernance data, conflits d’usage
Droit et éthique de l’IANormes et responsabilitéEncadrement des systèmes algorithmiquesRGPD, audit algorithmique
CybernétiqueBoucles de rétroaction et contrôlePilotage de systèmes informationnelsmonitoring IA, systèmes adaptatifs
Théorie des systèmesInteraction entre éléments d’un systèmeVision systémique des organisations dataarchitecture data & gouvernance
Data literacyCapacité à lire et critiquer la donnéeAppropriation par les équipesculture data
Data product managementGestion de la donnée comme produitcréation de valeur à partir des donnéesdata products, API data
Gouvernance décisionnelleArchitecture des responsabilitésalignement décision / donnéehuman-in-the-loop