1. médialab Sciences Po
  2. Actualités
  3. L'analyse de contenu computationelle : comment, quand et pourquoi ?

L'analyse de contenu computationelle : comment, quand et pourquoi ?

Salomé Do soutiendra sa thèse sur l'analyse de contenu computationnelle le 17 octobre 2024

Annonce, Soutenance de thèse

Le jeudi 17 octobre 2024, Salomé Do présentera son travail de thèse intitulée « L'analyse de contenu computationelle: comment, quand et pourquoi ? Mesurer la prévalence du cadrage stratégique dans la presse politique ». Cette recherche a été réalisée sous la direction de Thierry POIBEAU et de Jean-Philippe COINTET, et préparée au Lattice (Ecole normale supérieure-PSL / CNRS) et au médialab (Sciences Po), au sein de l’Ecole Doctorale Lettres, Arts, Sciences humaines et sociales (ED540) de l’ENS-PSL.
 

Résumé

Cette thèse explore les théories du cadrage médiatique et leur mise en œuvre dans des études computationnelles, en mettant en évidence le potentiel et les défis de l'automatisation de la détection de ces cadres. L'analyse empirique se concentre sur la détection du cadrage stratégique dans les articles politiques du journal Le Monde (1945-2018). Deux indicateurs spécifiques ont été développés et diverses méthodes d'annotation testées, montrant que les modèles de langage modernes peuvent atteindre des performances comparables à celles des annotateurs humains. La thèse examine l'importance des annotations expertes pour améliorer la précision des modèles, puis propose un cadre quantitatif pour comparer les méthodes automatisées et traditionnelles d'analyse de contenu.
Ce cadre est essentiel pour informer le choix entre approches computationnelles et manuelles pour la recherche en sciences sociales. L’étude souligne l’importance d’une analyse rigoureuse des erreurs et de l’estimation de l’incertitude dans les applications de l’apprentissage supervisé, suggérant des pistes de recherche future pour améliorer la fiabilité et l’applicabilité de l’apprentissage automatique dans l’analyse de contenu. Les résultats défendent une utilisation informée des méthodes automatisées dans les études médiatiques.

Composition du jury

François YVON - CNRS, Sorbonne Université - Rapporteur
Baldwin VAN GORP -  KU Leuven - Rapporteur
Sophie MÜTZEL - University of Lucerne - Examinatrice
Dallas CARD - University of Michigan - Examinateur
Chloé CLAVEL - INRIA - Examinatrice
Thierry POIBEAU  - CNRS, École Normale Supérieure - Directeur de thèse
Jean-Philippe COINTET -  Sciences Po Paris -  Directeur de thèse

Informations pratiques

La soutenance se déroulera le jeudi 17 octobre 2024 à 14h dans l’amphithéâtre Evariste Galois, École Normale Supérieure, 45 rue d’Ulm, Paris.