Cartographie web des médias français
Maxime Crépel, Béatrice Mazoyer
Publications – Grey literature
Notre communication vise à rendre compte du processus et des enjeux méthodologiques, ainsi que des difficultés rencontrées autour de trois principaux points. Tout d'abord, la définition de ce qu’est un média et les conséquences que ce choix implique sur le type d’analyse qui peut être réalisé. Nous avons souhaité à partir d’un processus collaboratif élaborer une définition large de ce qu’est un média et nous assurer de leur visibilité en ligne afin de répondre aux objectifs principaux du projet. Ce mode de sélection produit un certain type d’écosystème et pose certaines limites relatives à l’analyse ou au maintien des données dans le temps. Nous souhaitons également discuter des méthodes basées sur l'extraction du web qui permettent d’identifier les structures relationnelles en ligne mais soulèvent un ensemble de limites et difficultés, telles que les problèmes techniques liés au crawl des sites web, les difficultés d’exhaustivité du crawl pouvant impacter la structure de la cartographie, ou encore les limites des techniques de spatialisation et de clustering dans l’exploration du réseau d’entités. Enfin, notre communication mettra en avant les difficultés et les enjeux liés à l’enrichissement des données à partir d’une variété de sources hétérogènes de métadonnées (limitations de diffusion, exhaustivité des données, etc.) mais également aux enjeux de mise à jour du corpus constitué à travers le temps (politique des plateformes, évolution des API, etc.).