Je suis docteur en informatique de l’université Paris 6, spécialisée en ingénierie des connaissances et en text mining.

Mes recherches se situent au confluent de l’intelligence artificielle, en particulier de la modélisation des connaissances, et du traitement automatique de la langue. Après avoir travaillé quelques années spécifiquement sur l’analyse textuelle et la représentation des connaissances en médecine notamment à l’Inserm, j’ai depuis quatre ans réinvestis mes acquis méthodologiques et techniques au service des SHS.

Au sein du médialab, j’interviens comme chef de projet et expert en modélisation des connaissances. Mes activités de recherche se déclinent en trois axes :

1. Apporter des pistes pour résoudre le problème de l’hétérogénéité des données numériques à l’aide d’ontologies afin d’améliorer notre compréhension des communautés de savoirs. Les recherches menées concernent la construction de réseaux épistémiques centré sur la façon dont ces communautés se forment, comment elles évoluent, interagissent et, plus largement, aux types de processus de collaboration qui les animent. L’enjeu est double : d’une part, caractériser l’émergence et l’enchevêtrement de ces communautés à différents niveaux de granularité et, d’autre part, exhiber les objets des collaborations entre individus au sein de ces communautés.

2. Rendre compte de la complexité de la production scientifique au sens large, de ses mécanismes et fonctionnements (Scholarscape, Sciencescape). A l’heure des classements internationaux des universités, les enjeux sont de taille pour un domaine tel que les SHS qui doit être en mesure de rendre compte de ses activités à des fins d’évaluation alors même que la plupart des disciplines qui le compose sont bien mal représentées dans les grandes bases de données bibliométriques normalisées (Scopus, Web of Science par exemple).

3. Développer des outils de traitement automatique du langage adaptés aux recherches en SHS permettant d’aller de la constitution d’un corpus textuel numérique (ANTA v2) à la modélisation des connaissances qu’il contient.