Présentation du médialab et description des corpus web — iNA DLWeb - Saison 5 atelier 5 : Web archivé et archives scientifiques

Paul Girard, Benjamin Ooghe

Publications – Communication

Friday 13 June 2014

Girard, Paul and Benjamin Ooghe. 2014. "Présentation du médialab et description des corpus web: INA DLWeb - Saison 5 atelier 5 : Web archivé et archives scientifiques." ⤤

De plus en plus structurées, formatées et interopérables, les données de la recherche contribuent elles-mêmes au développement du web des données. Mais qu’en est-il de leur préservation sur le long terme? Comment conserver les archives scientifiques quand elles intègrent des corpus multimédias ou issus du Web? Comment garantir les conditions d’un retour à la source dans le cadre de corpus issus du web constitués spécifiquement pour des projets de recherche? Quel sont les outils, les plateformes, les projets qui concourent à partager et diffuser les fonds d’archives scientifiques et, inversement, à archiver les contenus en ligne quand ils sont constitués en objets d’étude? Dans quelle mesure les techniques et les politiques d’archivage du web peuvent-elles compléter ou interférer avec celles de l’archivage scientifique? Y a-t-il une concurrence entre les acteurs, ou les plateformes sont-elles au contraire appelées à s’articuler en exploitant les nouvelles possibilités de partage et les nouvelles manières de construire des corpus?