1. médialab Sciences Po
  2. Actualités
  3. Ingénieur⋅e de recherche orienté⋅e données (2 ans) sur la propagation de la désinformation en ligne

Ingénieur⋅e de recherche orienté⋅e données (2 ans) sur la propagation de la désinformation en ligne

Le médialab recrute un·e ingénieur·e de recherche pour outiller et alimenter deux projets sur la propagation de la désinformation en ligne (contrat de 2 ans).

Annonce, Emploi

Date limite :

Ce poste s’inscrit dans le cadre de 2 projets tous deux dédiés à l’étude de la désinformation en ligne : 75 % du temps sera consacré au projet DE FACTO et 25 % au projet SPSM.

Les projets

DE FACTO est un projet collaboratif financé par la Commission Européenne pour 3 ans, rassemblant le médialab, l’AFP, le CLEMI et xWiki, sous la direction de Dominique Cardon. L’ambition du projet consiste à développer le hub national français de la plateforme EDMO, qui vise à observer, analyser et répondre à la désinformation en ligne grâce au travail collectif de journalistes, d'académiques et d'éducateurs. La dimension recherche du projet vise notamment à produire des analyses indépendantes et détaillées des thèmes, acteurs et voies de diffusion de la désinformation en ligne en France, ainsi qu’à mesurer ses impacts sur l’opinion publique et sur l’agenda et la régulation des diffuseurs d’information.

Le projet SPSM, dirigé par Achim Edelmann et financé par l’Institut McCourt pour 3 ans, étudie le rôle des acteurs scientifiques et politiques dans la propagation de la désinformation aux États-Unis et en France sur les réseaux sociaux à la fois publics et privés. Les plateformes publiques seront analysées à l’aide de méthodes numériques (Social Media Analysis & TAL notamment) tandis que les outils de discussion privée seront approchés par la mise en place d’un ensemble d’expérimentations aléatoires et contrôlées dans le but d’évaluer comment les prises de position scientifiques ou politiques participent à endiguer ou accélérer la diffusion de la désinformation.

Objectifs du poste

Les principaux objectifs de ce poste seront de développer et améliorer des outils logiciels, de réaliser des collectes de données sur un large éventail de plateformes numériques, et de participer à leur analyse. L’ingénieur⋅e participera notamment aux activités suivantes :

  • agréger, enrichir et tenir à jour une base de données d’articles de fake news, construite à partir d’un ensemble de fact-checkeurs tels que les partenaires de De Facto et Facebook ou encore d’autres agences de fact-checking aux USA ;
  • enrichir et développer le catalogue d’outils open source du médialab afin de tracer, collecter et analyser les contenus de différents média sociaux (Facebook, Twitter, YouTube, Instagram, TikTok…) et plus largement du web public ;
  • identifier, collecter et traiter les interactions sociales (commentaires, partages, likes…) liées aux articles de désinformation sur les plateformes publiques ;
  • mettre en œuvre des analyses TAL/ML, algorithmes de détection d’évènements et analyses de réseau sur les articles et leurs réactions pour évaluer, visualiser et mesurer la circulation, la reprise et l’impact de la désinformation en ligne ;
  • implémenter des expériences aléatoires et contrôlées en ligne pour tester comment les prises de position institutionnelles participent à endiguer ou accélérer la diffusion de la désinformation sur les plateformes privées (WhatsApp, Telegram…) ;
  • contribuer à la préparation et à la rédaction d’articles académiques et de rapports sur la propagation de la désinformation s’appuyant sur les activités précitées.

Vous pouvez consulter les différents outils de collecte et d’analyse de données déjà développés au médialab sur notre Github.

Expériences et compétences attendues

  • Python est le langage de programmation préféré de notre équipe, les autres sont les bienvenus, la connaissance complémentaire du langage R est un plus
  • Rédaction de code open source collaboratif avec git
  • Expérience de la collecte de données en ligne (outils de collecte, scraping, APIs)
  • Expérience avec des jeux de données volumineux sur des serveurs distants
  • Expérience des librairies Python et/ou R de TAL et ML pour extraire des thèmes et classifier ou catégoriser des contenus et leurs auteurs
  • Expérience de l’analyse de réseaux sociaux et/ou de la théorie des graphes
  • Expérience des technologies d’indexation comme ElasticSearch appréciée
  • Une expérience en design web et/ou développement en JavaScript serait un plus
  • Français et Anglais courants

Expérience minimum : 2 ans

Contexte de travail

Vous serez intégré⋅e à l’équipe technique du médialab à Sciences Po (Paris 7, métro rue du Bac) et travaillerez avec son équipe de chercheur⋅se⋅s, de designer⋅euse⋅s, d’ingénieur⋅e⋅s et de spécialistes des données. C’est une bonne opportunité de découvrir et contribuer à un large éventail d’outils open source dédiés à la science des données (collecte, traitement automatique du langage, machine learning, analyse de réseau) appliqués à l’analyse socio-politique.

Les ingénieur⋅e⋅s de recherche du médialab sont encouragé⋅e⋅s à participer comme co-auteur⋅rice⋅s aux articles académiques ainsi qu’à porter leur propres publications s’ils le souhaitent.

Le poste est pour 2 ans, avec un début aussitôt que possible suivant la disponibilité.

Salaire compétitif suivant l’expérience. Le poste inclut une couverture santé complète, 40 jours de congés payés par an et 5 RTT ainsi que des tickets restaurant. Le travail à distance est possible deux jours par semaine maximum en temps normal, extensible en fonction du contexte pandémique.

Procédure de recrutement

Envoyez un CV et une lettre de motivation détaillant vos expériences et compétences pertinentes pour le poste ainsi que des liens vers des exemples de code et/ou de publications scientifiques à l'adresse électronique suivante avec la mention “[DEFACTO-SPSM]” dans le sujet de l’e-mail : recrutement.medialab@sciencespo.fr 

Pour toute question complémentaire au sujet du poste, vous pouvez contacter : benjamin.ooghe@sciencespo.fr ; achim.edelmann@sciencespo.fr

L’examen des candidatures commencera dès leur arrivée afin que la personne recrutée puisse commencer dans les prochains mois, idéalement dès le mois de juillet 2022. Merci d’indiquer dans votre candidature à partir de quelle date vous êtes disponible.