1. médialab Sciences Po
  2. Activités
  3. Traces et Méthodes numériques

Traces et Méthodes numériques

Comment donner forme aux traces numériques et les interpréter ?

L’axe Traces et Méthodes numériques réunit l’ensemble des activités de conception et de développement de méthodes et d’outils de traitement de données numériques, de leur collecte à leur analyse en passant par leur modélisation ou visualisation.

Recherche

Le médialab s’attache à concevoir des chaînes de traitement innovantes pour modéliser les dynamiques sociales à partir des traces qu’elles laissent dans des environnements variés : déplacements d’œuvres d’art dans les registre muséaux, photos de la nature à Paris publiées sur Twitter, articles de presse dénonçant les risques de l’intelligence artificielle, posts de militants antivax sur Facebook, etc. La philosophie des outils développés au médialab est ainsi d’offrir une infrastructure robuste et modulaire permettant d’assurer tout ou partie des maillons nécessaires à ces chaînes de traitement de données.

Un premier ensemble de nos travaux consiste à « mettre sous veille » une partie de l’espace public numérique, en créant des outils de collecte de données web afin de fabriquer des collections pérennes de traces ayant circulé, notamment sur les réseaux sociaux (tweets, posts sur Facebook ou Instagram, etc.) ou sur des sites plus classiques (articles de presse, sites institutionnels, etc.).

La modélisation de ces données fait également l’objet d’une recherche spécifique qui se focalise particulièrement sur leur nature hétérogène. De la rigidité formelle des textes de lois à la syntaxe aléatoire des commentaires d’un forum, la modélisation de ces contenus s'efforce d'intégrer la très grande diversité des formes que peut prendre l’énonciation, notamment en ligne. Les données du web sont également complexes de par leur nature composite : il ne s’agit pas “simplement” d’analyser un contenu flottant mais d’intégrer dans sa modélisation l’environnement dans lequel la situation d’énonciation se déploie. C’est pourquoi nous travaillons dans l’axe Traces et méthodes numériques à la transformation des contenus textuels dans des espaces géométriques qui incorporent également des données relationnelles, voire visuelles. 

Tout un autre pan de notre recherche porte sur le développement de solutions de représentation des données et de leurs modèles, qu’il s’agisse par exemple d’outils légers de visualisation de réseaux, ou de solutions complètes d’exploration visuelle et analytique, dites « datascapes », permettant d’articuler les données originales et leur reconstruction dans leurs contextes et à différentes échelles, des données brutes granulaires à des vues globales agrégées.

Dans le respect des principes de l’Open Science chers au laboratoire, et afin de garantir la qualité et la pérennité des collectes et traitements, l’ensemble des codes et outils développés sont systématiquement publiés en Open Source sous licence libre, notamment sur le compte GitHub du médialab.