1. médialab Sciences Po
  2. Productions
  3. Hyphe

Hyphefait par le médialab

un crawler guidé par l'utilisateur visant à créer, nettoyer et catégoriser un corpus d'acteurs web et le réseau de liens hypertextes entre eux

Outils – Logiciel

Mathieu Jacomy, Benjamin Ooghe-Tabanou, Paul Girard

Hyphe est un logiciel libre de crawler web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique (par exemple, l'huile de palme ou le coronavirus).

Ces pages web sont sélectionnées par les chercheurs et peuvent être regroupées en « webentités », qui peuvent être des pages individuelles, des sites web, des sous-domaines ou même une combinaison de ceux-ci. Ces entités représentent différents acteurs de la problématique à traiter (par exemple, une personne, une organisation, etc.).

En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités.

De nouvelles webentités sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. Les chercheurs peuvent ensuite les examiner dans un processus itératif et qualitatif.

Hyphe permet aux chercheurs de choisir et de catégoriser manuellement les acteurs qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un outil quali-quantitatif.

collecte, exploration et curation

tous publics

utilisable

2013