1. médialab Sciences Po
  2. Actualités
  3. MetAt - Journal de bord du 8 octobre 2024

MetAt - Journal de bord du 8 octobre 2024

Partager nos savoir-faire et pratiques méthodologiques.

Rendez-vous, Atelier

CEPED, 45 rue des Saints Pères, Paris

NOTA BENE



Qu’est-ce que le METAT ?


Le METAT est un atelier d’accompagnement aux méthodes de recherche : chaque mois, un créneau de trois heures pour vous aider à résoudre les difficultés d’ordre méthodologique que vous rencontrez dans le cadre d’un projet scientifique.

À qui s’adresse le METAT ?


Le METAT s’adresse à toute personne souhaitant être accompagné ponctuellement pour l’utilisation d’un outil ou d’une méthode de recherche. Tous les profils sont les bienvenus : étudiant-e-s, doctorant-e-s, chercheur-e-s, métiers de l’ingénierie de recherche ou autre, internes et externes à Sciences Po, sans restriction de statut ou d’affiliation.

Comment s’inscrire ?


L’inscription est obligatoire via le formulaire disponible sur la page du METAT

Séance du 08/10/2024

Lieu : CEPED, 45 Rue des Saints Pères, 75006 Paris

Nombre de participant·e·s : 9

Encadrant·e·s : Diego Antolinos Basso, Audrey Baneyx, Maxime Crépel, Béatrice Mazoyer, Eric Opigez, Blazej Palat, Sandra Hamiche.

Traitement automatique du langage sur un corpus de textes des Nations Unies

Accompagnement de deux chercheur·euse·s au sujet de l’outil d’analyse textuelle le plus pertinent dans le cadre de requêtes sur du texte augmenté de catégories syntaxiques. Dans un premier temps, l’outil de traitement automatique du langage TXM a été installé. Les encadrant·e·s ont ensuite sensibilisé les participant·e·s au langage de requêtes mais aussi à la veille sur les paquets R qui permettent la lemmatisation.

Extraction de données Europresse et traitement avec Python

Accompagnement d’étudiant·e·s cherchant à collecter et analyser un grand nombre de données d’Europresse. Il s’agissait plus précisément d’extraire au format tableur (.csv) à partir de l’html des pages d’Europresse. En ce sens, les encadrant·e·s ont suggéré l’outil Europarser. Les étudiant·e·s ont ensuite été accompagnés pour la prise en main des bibliothèques de Python SpaCy et NLTK, dédiées au traitement naturel du langage.

Visualisation de réseaux Youtube

Accompagnement d’un·e étudiant·e pour visualiser des réseaux de chaînes Youtube. Une discussion d’ordre méthodologique a été menée au sujet des outils Youtube Data Tools et Gephi, permettant respectivement d’extraire des données de la plateforme et de les cartographier. Les encadrant·e·s ont aussi donné des conseils sur la suite de l’analyse.

Stockage, codification et valorisation de données

Accompagnement de trois doctorant·e·s souhaitant connaître des outils de stockage, de codification et de valorisation des données (notamment dans le cas d’images et de vidéos). Les encadrant·e·s ont suggéré l’utilisation de Zotero pour le stockage et la codification des données. Divers outils de valorisation des données ont ensuite été présentés à l’instar de Timeline JS, Tesselle qui permet l’annotation de grands corpus d’images en haute définition ou encore Dicto (édition de médias) et Khartis, qui génère des cartes thématiques. Enfin, les doctorant·e·s et les encadrant·e·s ont discuté de la pertinence des OCR lorsqu’il s’agit de sélectionner du texte dans des images.

Identification des participants à un sondage à partir de données de géolocalisation avec QGIS

Accompagnement d’un·e étudiant·e cherchant à identifier quel·le·s répondant·e·s à un sondage sont localisé·e·s à proximité d’un chemin de fer. L’étudiant·e disposait de coordonnées des participant·e·s (dans un fichier .csv) et de l’ensemble de coordonnées des points correspondant au passage du chemin de fer (fichier .shp). Les encadrants ont suggéré l’utilisation du logiciel QGIS, qui peut traiter les données sous les deux formats. Ensuite, utiliser un tampon de la largeur souhaitée autour de la ligne de chemin de fer permet de répertorier l’ensemble des répondant·e·s dans la zone autour de celle-ci. Les résultats peuvent être exportés sous différents formats en tant que masque ou coordonnées GPS. Cependant, les données doivent être correctement fusionnées et identifiées avant le traitement définitif.