Ce que le big data fait à l’analyse sociologique des textes : Un panorama critique des recherches contemporaines
Jean-Philippe Cointet, Sylvain Parasie
Publications – Article/chapitre
Depuis les années 2000, de nouvelles techniques d’analyse textuelle font leur apparition au croisement des mondes informatiques, de l’intelligence artificielle et du traitement automatique de la langue. Bien qu’élaborées en dehors de toute préoccupation sociologique, ces techniques sont aujourd’hui mobilisées par des chercheurs – sociologues comme non-sociologues – dans le but de renouveler la connaissance du social en tirant parti du volume considérable de matériaux textuels aujourd’hui disponibles. En dressant un panorama des enquêtes sociologiques qui reposent sur la mise en données et le traitement quantitatif de corpus textuels, cet article identifie à quelles conditions ces approches peuvent constituer une ressource pour l’enquête sociologique. Les trois conditions qui émergent de notre analyse concernent : 1) la connaissance du contexte de production des inscriptions textuelles ; 2) l’intégration à l’enquête de données extérieures au texte lui-même ; 3) l’ajustement des algorithmes au raisonnement sociologique.