Des archives du commerce à des données quantifiables : une longue chaîne de transformation des données
Paul Girard, Méthodes Analyses Terrains Enquêtes En Sciences Humaines
Nous proposons de présenter les enjeux de gestion de données historiques rencontrés à l'occasion de deux projets de recherches portant sur l'histoire de l'économie. Le premier projet dénommé RICARDO s'attache à créer une base de données du commerce mondial du XIXème siècle. Il est dirigé par Béatrice Dédinger du Centre D'Histoire de Sciences Po. Le deuxième dénommé TOFLIT18 concerne le commerce de la France au XVIIIème siècle. Il fait l'objet d'un financement ANR, est dirigé par Guillaume Daudin de Paris Dauphine et Loïc Charles de l'INED. Le médialab de Sciences Po participe en effet à ces deux projets pour y apporter son expertise méthodologique. Au delà de la différence de période et de périmètre les deux projets diffèrent dans les détails des flux de commerce. Ricardo propose des flux bilatéraux miroirs mais ne propose que les valeurs des flux. TOFLIT18 en revanche ne couvre que les échanges entre la France et ses partenaires mais précise en revanche le détails des marchandises échangées avec quantité et prix par marchandises. Dans les deux cas il s'agissait de mettre au point des méthodes de gestion de données permettant de transformer les données sources telles que transcrites en une base de données permettant des analyses quantitatives. Il s'agit de mêlé Histoire, Économie ingénierie informatique. Conscient de la responsabilité scientifique liée à toute création de base de données (Bowker 2000) nous avons tenté de définir une chaîne de traitement des données qui soit réversible afin de garantir une circulation de la référence depuis la quantification jusqu'aux sources (Latour 1993).