1. médialab Sciences Po
  2. Actualités
  3. Guerrilla scraping: research ethics, internet law and programming tricks for critical computational sociology

Guerrilla scraping: research ethics, internet law and programming tricks for critical computational sociology

Le prochain séminaire du médialab accueillera Marion Lieutaud, sociologue et chercheuse post-doctorale, et Sophie Stalla-Bourdillon, chercheuse et co-directrice du Brussels Privacy Hub. Leur présentation portera sur les difficultés des sociologues à accéder aux données des plateformes numériques de travail et sur les stratégies alternatives pour mener une recherche quantitative éthique et indépendante.

Rendez-vous, Séminaire de recherche

Salle B.010, 1 Place Saint-Thomas d'Aquin, 75007 Paris

Résumé

En partant d'une réflexion sur l'expérience de la collecte de données de recherche sur les plateformes numériques de travail sur Internet, nous discutons de la résistance et de l'intimidation juridique que les plateformes en ligne à but lucratif peuvent opposer aux sociologues pour collecter des données quantitatives et étudier le travail sur les plateformes. À mesure que les fenêtres de coopération entre chercheurs et plateformes, incarnées par les API, se rétrécissent, les plateformes numériques de travail (Uber, Deliveroo, TaskRabbits, etc.) imposent un monopole de données de plus en plus strict sur de larges pans du marché du travail qu'elles médiatisent et supervisent - et ce malgré l'approche créative adoptée par certaines juridictions, telles que le législateur européen, en vue de forcer les très grandes plateformes à partager davantage de données avec les chercheurs. Là où la recherche qualitative reste possible, bien qu'elle soit loin d'être facile (voir par exemple la recherche Fairwork (Spilda et al. 2022)), nous nous demandons si les sociologues quantitatifs et computationnels en particulier ne devraient pas développer une approche « guérilla » de la recherche en ligne et des données hébergées par des plateformes privées. Nous nous référons en particulier aux situations où la coopération et le partage des données sont jugés impossibles, et où des approches plus autonomes, dangereuses, contradictoires et/ou furtives peuvent être considérées comme nécessaires.

Nous examinons les lignes directrices existantes sur la recherche basée sur Internet dans diverses universités britanniques et européennes et menons des entretiens d'experts avec des chercheurs en sciences sociales au Royaume-Uni et dans l'Union européenne, spécialisés dans le web-scraping et l'exploration de données en ligne, afin de déterminer si de telles approches de « guérilla » sont déjà courantes ; dans quelle mesure les conseils éthiques et juridiques et les pratiques disciplinaires émis par les institutions de recherche (ou leur absence) aident à résoudre les conflits sur le terrain et/ou les poussent vers de telles approches ; quelles étapes éthiques, juridiques et pratiques ou « astuces du métier » les chercheurs mettent en place pour se protéger et protéger les individus étudiés ; et enfin dans quelle mesure cela a un impact sur la substance et la pratique de la recherche sur Internet. La dernière partie du projet est une tentative d'élaboration de voies méthodologiques pratiques vers un examen sociologique quantitatif indépendant, éthique, légalement (plus) sûr et socialement essentiel des plateformes en ligne et du travail médiatisé par les plateformes. Cela implique d'utiliser avec précaution des techniques de traitement des données préservant la vie privée et basées sur l'évaluation des risques, d'adopter une interprétation favorable à la recherche de la portée des droits de propriété intellectuelle en accord avec la jurisprudence récente, et d'aborder avec un certain degré de combativité les conditions d'utilisation restrictives et les pratiques de contrôle des platesformes. Nous traduisons cela en suggestions de programmation sur la manière d'utiliser et d'écrire le code de manière créative pour la collecte de données en ligne.

Biographie

Marion Lieutaud est sociologue et chercheuse postdoctorante dans le département de Méthodologie à la London School of Economics and Political Science (LSE). Elle est aussi représentante antiprécarité dans le comité syndical de la branche UCU à LSE.

Sophie Stalla-Bourdillon travaille à l'interface du droit et de la technologie au BrusselsPrivacyHub et à l'UoS, et auparavant à Immuta.

Informations pratiques

Ce séminaire se déroulera en présentiel et en anglais, le jeudi 22 mai 2025 de 14h à 16h, en salle B.010, 1 Place Saint-Thomas d'Aquin, 75007 Paris.

L'inscription est obligatoire via ce lien.