1. médialab Sciences Po
  2. Productions
  3. CorTexT

CorTexTrecommandé par le médialab

L'initiative CorTexT de l'IFRIS propose des outils pour explorer et analyser la dynamique sémantique dans des corpus de textes.

Outils – Logiciel

IFRIS (Jean-Philippe Cointet, Philippe Breucker, Guillaume Orsal, Marc Barbier et Lionel Villard)

La plateforme CorTexT est une plateforme numérique piloté par le laboratoire LISIS et l’INRAE, fondée grâce à un projet lancé et soutenu par l’IFRIS et l’Unité INRA SenS en 2010.   

Elle s’inscrit dans le courant de la recherche ouverte et vise à promouvoir les études en sciences humaines sur la dynamique de la science, de la technologie et de la production de connaissances en permettant l'analyse textuelle et la visualisation de jeux de données préalablement collectés.

Le workflow de base est le suivant:

- télécharger des fichiers bruts de diverses bases de données bibliographiques scientifiques (ISI Thomson Web of Science, Pubmed, etc.) ou de simples fichiers CSV

- transformer des fichiers texte en base de données afin d’en faire des corpus standardisés

- effectuer une série d'analyses graphiques pour produire :

- des analyses statistiques

- des graphs d'entités

- des chronologies fondées sur la reconstruction de phylogénies

- télécharger les résultats obtenus dans un format compatible avec des logiciels tiers.

traitement, exploration et visualisation

tous publics

utilisable

2008