Poser les sciences de la donnée

On parle beaucoup d’intelligence artificielle.
De ses usages, de ses promesses, de ses risques.
Plus rarement des sciences de la donnée qui la rendent possible — et encore moins de ce qu’elles font à nos manières de décider et de gouverner.

Derrière l’IA, il n’y a pas une entité autonome, mais un empilement de sciences : mathématiques, statistiques, informatique, sciences du traitement de la donnée, sciences de la décision. Des sciences qui transforment le réel en données, les données en modèles, et les modèles en options d’action.

Poser les sciences de la donnée, ce n’est pas chercher l’exhaustivité ni produire une cartographie figée. C’est accepter de regarder les coulisses : les cadres intellectuels, les hypothèses implicites, les choix de représentation qui orientent silencieusement ce que l’on voit — et ce que l’on ne voit pas.

Cette question est indissociable de celle de la gouvernance de la donnée. Non pas au sens d’une appropriation ou d’un inventaire exhaustif — souvent illusoire dans des systèmes complexes — mais comme une attention portée aux flux de données : là où elles circulent, se transforment, s’anonymisent, produisent (ou non) un impact réel pour les équipes, les produits et les décisions.

Dans les organisations, la donnée n’appartient jamais vraiment à quelqu’un. Elle traverse les métiers, les systèmes, les outils. Chercher à en être “propriétaire” relève souvent davantage de jeux de pouvoir que d’une gouvernance effective. Suivre les flux, en revanche, permet de relier le développement aux usages, les métiers aux clients, et les décisions aux effets observables.

Cet article n’a pas vocation à expliquer l’IA ni à prescrire une méthode. Il ouvre un espace de réflexion sur les fondations scientifiques qui structurent nos environnements décisionnels, et sur la manière dont la donnée peut redevenir un appui pour décider — plutôt qu’un prétexte pour diluer la responsabilité.

Dans l’esprit du Campus, ce texte est volontairement vivant. Il évoluera au fil de l’année, en fonction de l’actualité, des débats émergents, des transformations observées sur le terrain. Les sections qui suivent ouvrent des champs de pensée. Elles seront enrichies, précisées, parfois déplacées, à mesure que le Campus continue d’explorer ce que décider, livrer et gouverner veulent dire à l’ère de la donnée et de l’IA.

Pour une exploration approfondie des tensions invisibles que révèle la gouvernance de la donnée, voir aussi notre article précédent :
Gouvernance des données : révélateur des tensions invisibles”.

Les sciences de la donnée : les fondations

Ce sont celles qui rendent la donnée lisible, visible.

Mathématiques & statistiques

  • Probabilités
  • Statistiques descriptives et inférentielles
  • Modélisation, optimisation
  • Séries temporelles

➡️ Elles répondent à : “Que peut-on inférer ? Avec quel niveau de confiance ?”

Ici on trouve :

  • Algorithmique
  • Bases de données
  • Architecture des systèmes
  • Cloud, calcul distribué

➡️ “Comment stocker, traiter et faire circuler la donnée à l’échelle ?”

Les sciences de la donnée : traitement et exploitation

Ici c’est le prolongement mathématique ou les sciences de l’ingénierie qui permettent de rendre la donnée exploitable, et résoudre des problèmes associés

La data science et l’ingénierie des données sont deux domaines interconnectés qui explorent l’utilisation des données pour résoudre des problèmes et générer des informations exploitables.

  • Exploration de données
  • Modélisation statistique
  • Visualisation
  • Expérimentation

➡️ “Qu’est-ce que les données racontent vraiment ?”

  • Apprentissage supervisé / non supervisé
  • Deep learning
  • NLP, vision, systèmes de recommandation

➡️ “Que peut-on automatiser, prédire ou générer ?”

  • Pipelines de données
  • Qualité, fiabilité, traçabilité
  • Gouvernance technique

➡️ “Comment rendre la donnée utilisable, robuste et durable ?”


Les sciences de la décision et de la valeur

Aide à la décision

  • Modèles multicritères
  • Optimisation sous contraintes
  • Théorie des jeux

➡️ “Comment décider dans la complexité ?”

  • KPI , voir notre série Déambulations de Romain qui montre comment un étudiant charche à comprendre les indicateurs de performances et les indcateurs de valeurs.
  • Mesure de valeur
  • Expérimentation produit
  • Pilotage stratégique

➡️ “À quoi sert la donnée pour l’action ?”


Les sciences humaines et sociales autour de la donnée

Biais cognitifs

Prise de décision humaine

Interaction humain–IA

Charge mentale informationnelle

➡️ “Comment les humains comprennent (ou maltraitent) la donnée ?”

Voir également la synthèse des travaux de Gérald Bronner sur les Biais cognitifs & désinformation.

Pouvoir et données

  • Donnée comme instrument de contrôle ou d’émancipation
  • Dynamiques collectives
  • Effets organisationnels des outils data & IA

➡️ “Que fait la donnée aux collectifs ?” Exemple : How malicious AI swarms can threaten democracy-The fusion of agentic AI and LLMs marks a new frontier in information warfare ou encore notre ebook Le monde d’après

  • RGPD, privacy, souveraineté
  • Éthique de l’IA
  • Responsabilité algorithmique
  • Justice, équité, transparence

➡️ “Que peut-on faire ? Que doit-on refuser ?”


Les sciences émergentes

Capacité à lire, questionner, critiquer la donnée

Acculturation non technique

Donnée comme produit

Valeur d’usage vs valeur business

Arbitrage humain / automatisation

Voir notre série sur les Acteurs Produits Data et IA et notamment le rôle de Data Product Manager

  • Human-in-the-loop
  • Cadres de responsabilité
  • Décision augmentée (et non déléguée)

Au coeur des travaux du campus en 2026 : “Décider, livrer et gouverner à l’ère de l’IA« 


En synthèse

Les sciences de la donnée ne servent pas à produire des chiffres, mais à rendre le monde prédictible.
👉 la vraie maturité data commence quand la donnée cesse d’être un objet technique pour devenir un objet relationnel et politique.