1. médialab Sciences Po
  2. News
  3. MetAt - May 12, 2026 logbook

MetAt - May 12, 2026 logbook

Share our methodological expertise and skills.

Event, Workshop

Salle du Conseil, 13 rue de l'Université, 75007 Paris

NOTA BENE



Qu’est-ce que le METAT ?


Le METAT est un atelier d’accompagnement aux méthodes de recherche : chaque mois, un créneau de trois heures pour vous aider à résoudre les difficultés d’ordre méthodologique que vous rencontrez dans le cadre d’un projet scientifique.

À qui s’adresse le METAT ?


Le METAT s’adresse à toute personne souhaitant être accompagné ponctuellement pour l’utilisation d’un outil ou d’une méthode de recherche. Tous les profils sont les bienvenus : étudiant-e-s, doctorant-e-s, chercheur-e-s, métiers de l’ingénierie de recherche ou autre, internes et externes à Sciences Po, sans restriction de statut ou d’affiliation.

Comment s’inscrire ?


L’inscription est obligatoire via le formulaire disponible sur la page du METAT

Séance du 14/04/2026

Lieu : Sciences Po, 13 rue de l'Université, 75007 Paris.

Nombre de participant·e·s : 4

Encadrant·e·s :  Audrey Baneyx, Blazej Palat, César Pichon, Guillaume Plique, Benjamin Ooghe-Tabanou, Guillaume Levrier, Lydia Passet, Marine Chuberre, Véronique Michot, Paul Passy

Extraction d’informations sur des documents PDF

Accompagnement d’un·e doctorant·e pour extraire des données spécifiques sur des documents PDF (par exemple, les noms des personnes concernées par le document, des lieux, etc). 

Un modèle de LLM en local a été installé pour tenter d’extraire ces informations avec un prompt. Il a été téléchargé sur Ollama. Cela n’a pas fonctionné pour deux raisons : la “context window” est plus petite que les documents eux-mêmes et les modèles installables en local ne sont pas assez performants. Une autre option a été d’extraire ces données par mots-clés avec du code automatisé en langage Python. Cette solution fonctionne pour les informations qui sont standardisées sur les documents PDF, les recherches sont dans du texte hétérogène sont plus compliquées. Ces données ont été versées sur un fichier CSV. L’analyse de ces données sera ensuite réalisée par le/la doctorant·e.

Exploiter des corpus sur le traitement du réchauffement climatique à Lyon

Accompagnement d’un·e étudiante qui dispose de plusieurs types de corpus différents : un appui méthodologique a été réalisé pour trouver une méthodes et des manières d’exploiter au mieux ces corpus en vue de son mémoire de stage

Nous lui avons proposé de classer les entrées de ses corpus dans des tableurs dans lesquels il/elle pourra ajouter les catégories et sous ctégories qui permettent de classer ses ressources. Cela permettra d’avoir une vue d’ensemble sur les points importants de ses données.

Explorer les méthodes d’utilisation de Hyphe

Accompagnement d’un·e post-doctorant·e qui avait participé auparavant à une précédente séance du MetAt. Cette nouvelle participation a pour objectif de mieux comprendre un certain nombre de bonnes pratiques à mettre en œuvre lorsqu’on travaille avec Hyphe.

Nous avons présenté plusieurs fonctionnalités avancées de Hyphe notamment l’import de CSV et le crawl sur les archives du web. Nous avons également discuté du rôle et statut épistémologique de Hyphe comme outil avant tout exploratoire et non à visée de production de résultat statistique sur un ensemble exhaustif de données web. 

Tour d’horizon des méthodes TAL

Accompagnement d’un·e ingénieur·e d’études sur les différentes méthodes de traitement automatique du langage (TAL), de la lexicométrie aux embeddings sémantiques. Un cas d’usage pratique de lexicométrie a été réalisé sur les datasets de Speeches of the Union (discours sur l’état de l’Union, aux Etats-Unis).