Explorer les internets avec Hyphe
Mathieu Jacomy
Publications – Communication
Le web c’est grand, surtout vers le fond. Et ce n’est pas très organisé, même si ce n’est pas non plus le chaos. Quelle est la structure du web, et comment s’y orienter ? Question plus difficile encore, comment trouver et identifier l’information pertinente sans amasser de téraoctets inutiles ? Le web nous oppose des défis à la fois méthodologiques et technologiques. Le médialab de Sciences Po a développé HYPHE, un robot amasseur de données web aussi appelé «crawler», ajusté aux besoins de la recherche en sciences sociales. Il s’adresse aux sociologues qui veulent investiguer le web comme terrain d’enquête qualitative et en tirer des indicateurs quantitatifs. S’appuyant sur le modèle du web «en couches», il guide son utilisateur pour construire, itération après itération, un corpus de ressources et/ou d’acteurs. Le travail manuel de sélection et de qualification de l’information est récompensé par un réseau de ressources que l’on peut exploiter de différentes manières: en analysant sa topologie avec GEPHI, en exportant ses textes vers un logiciel de traitement du langage, ou encore en construisant un moteur de recherche dédié. Le médialab vous propose une présentation de ce logiciel libre et open source, et une initiation à ses principaux concepts. Des exemples tirés des travaux des chercheurs l’ayant utilisé illustreront ses possibilités. Une démo de HYPHE est également disponible en ligne - hyphe.medialab.sciences-po.fr