1. médialab Sciences Po
  2. Productions
  3. Issue2navicrawler

Issue2navicrawlerfait par le médialab

une librairie python pour transformer un fichier XML produit par l'IssueCrawler de DMI en un fichier wxsf (xml) pour Navicrawler

Outils – Code

Paul Girard

Cette librairie Python (aujourd'hui dépréciée) permettait de transformer un corpus web créé par l'outil IssueCrawler (de la Digital Methods Initiative à Amsterdam) vers le format utilisé par le Navicrawler.

Les deux approches pouvaient ainsi être hybridées : créer un corpus par un crawl automatique, puis raffiner les résultats à la main dans un navigateur web spécialement équipé.

Elle a rendu possible les expérimentations qui ont mené plus tard au développement de Hyphe et du Hyphe Browser associé.

traitement

développeur.e.s

archivé

2010