1. médialab Sciences Po
  2. Productions
  3. Coder avec la machine

Coder avec la machine

Jean-Philippe Cointet, Maxime Crépel, Sylvain Parasie

Le codage de texte est au coeur de la pratique des sociologues et renvoie à toute une variété de pratiques, de types de matériaux textuels et de corpus et plus largement de modalités de production de connaissance. Différentes options se présentent à l’analyste lorsqu’il souhaite coder avec une machine. Entre les méthodes inductives entièrement non-supervisées venant de l’informatique et la reconnaissance de motifs lexicaux assistés par ordinateur, nous proposons une troisième voie qui s’appuie sur les capacités d’inférence de l’apprentissage machine tout en garantissant un contrôle des catégories analytiques utilisées pour le codage. Une méthode de codage supervisé actif est ainsi appliquée à deux corpus textuels: un ensemble de commentaires collectés sur un corpus de commentaires publiés sur le web, et un corpus d’articles de presse.