1. médialab Sciences Po
  2. Actualités
  3. MetAt - Journal de bord du 9 juin 2026

MetAt - Journal de bord du 9 juin 2026

Partager nos savoir-faire et pratiques méthodologiques.

Rendez-vous, Atelier

Salle du Conseil, 13 rue de l'Université, 75007 Paris

NOTA BENE



Qu’est-ce que le METAT ?


Le METAT est un atelier d’accompagnement aux méthodes de recherche : chaque mois, un créneau de trois heures pour vous aider à résoudre les difficultés d’ordre méthodologique que vous rencontrez dans le cadre d’un projet scientifique.

À qui s’adresse le METAT ?


Le METAT s’adresse à toute personne souhaitant être accompagné ponctuellement pour l’utilisation d’un outil ou d’une méthode de recherche. Tous les profils sont les bienvenus : étudiant-e-s, doctorant-e-s, chercheur-e-s, métiers de l’ingénierie de recherche ou autre, internes et externes à Sciences Po, sans restriction de statut ou d’affiliation.

Comment s’inscrire ?


L’inscription est obligatoire via le formulaire disponible sur la page du METAT

Séance du 14/04/2026

Lieu : Sciences Po, 13 rue de l'Université, 75007 Paris.

Nombre de participant·e·s : 3

Encadrant·e·s :  Béatrice MazoyerMaxime Crépel, Salomé Do, Audrey Baneyx, Blazej Palat, César Pichon, Guillaume Plique, Benjamin Ooghe-Tabanou, Marine Chuberre

Tentative d’extraction de données d’un groupe privé Facebook sur la BD 

Accompagnement d’un·e chercheur·euse qui prolonge son travail de thèse en étudiant une communauté de bédéphiles, présents notamment sur un groupe Facebook “Club BIMBO” privé, dont il/elle a obtenu les droits d’administrateur·ice. Il/Elle souhaiterait collecter des posts, images et commentaires postés sur ce groupe.

Nous avons exploré ensemble les possibilités du moment avec Facebook. L’outil Zeeschuimer ne gère pas cette plateforme et nous n’avons pas trouvé d’alternative semblant fonctionner. Nous avons exploré ensemble les requêtes AJAX de Facebook ainsi que le contenu des pages en vue d’essayer de scraper ces données (ainsi qu’essayé de demander à Gemini de produire un tel travail), mais toutes ces tentatives se sont avérées trop complexes, longues et sans garantie de succès pour la durée de l’atelier.

Un travail qualitatif sera réalisé auprès des membres du groupe, afin de leur demander de réaliser un export RGPD de leurs données sur la plateforme. Une prochaine séance du MetAt pourra être consacré à l’examen d’un tel export pour faire un outil permettant de filtrer uniquement les éléments relatifs à sa recherche sans conserver les données personnelles des enquêté·es. 

Mise au clair d’une politique de récolte de données d’entretiens semi dirigés et codage R

Accompagnement d’un·e étudiant·e qui a identifié des problèmes lors de l’analyse et la réutilisation de données récoltées pendant des entretiens auprès d’élu·es : aucun formulaire officiel n’a été mis en place, posant des soucis juridiques notamment pour un éventuel rapport de stage. Concernant son travail d’analyse de programmes politiques, nous avons recherché un moyen de codage pour utiliser les résultats.

Nous avons conseillé à l’étudiant·e de se rapprocher de son équipe accompagnante de recherche ainsi qu’un.e DPO au sujet des questions de données. Au sujet des données de programmes, un codage sur R a été réalisé et expliqué dans le but d’une réutilisation personnelle de la recherche. 

Une analyse graphique ou une analyse des proportions pourra être réalisée prochainement malgré le peu de données quantitatives qui ont pu être exploitées.

Protocole méthodologique / Mapping web avec Hyphe et Gephi

Accompagnement d’un·e doctorant·e venu·e pour explorer les capacités du logiciel Hyphe pour arriver à crawler le wayback machine, et éventuellement pour l’utilisation de Gephi. La séance a été consacrée à renforcer le protocole de traitement des réseaux et envisager d’autres pistes de traitement données pouvant alimenter le travail de thèse et d’articuler les liens entre question de recherche, traitement et données.

Nous avons discuté de la catégorisation des propriétés des entités qui composent le réseau d’un jeu de données (thématiques, types d’acteurs, positionnement politique) pour faciliter par la suite l'interprétation de la topologie, y compris sur le plan pratique l’utilisation et le test de LLM pour catégoriser le réseau de 7000 web entités à partir du CSV des noeuds extrait de Gephi. Nous avons également discuté de méthodes de TAL (traitement automatique du langage) sur un corpus d’articles scientifiques ou de presse en s’inspirant de travaux publiés au médialab sur le traitement médiatique de l’IA et plus spécifiquement de la gestion de la dimension temporelle des réseaux/clusters de termes. Enfin, nous avons également discuté et imaginé des indicateurs et métriques statistiques associées au réseau pour rendre compte de la stabilité des acteurs, thèmes à travers le temps pour une analyse temporelle effectuée par une succession de graphe temporelle tous les 5 ans sur une durée de 25 ans sur le thème de l’anthropocène.