Le projet ModOAP est conçu autour de deux objectifs principaux. En premier lieu, nous souhaitons développer une boîte à outils d’analyse de données massives pour des projets consacrés aux Sciences Humaines et Sociales. Elle reposera sur des modèles pouvant être aisément adaptés à différents types de corpus textuels et graphiques, et comportera des programmes réutilisables par les institutions et laboratoires impliqués dans le Labex, et plus généralement par l’ensemble de la communauté scientifique en SHS. Ces outils (classification d’images, d’unités textuelles, reconnaissance de structures, détection de similarités…) feront l’objet d’une élaboration collective en partenariat avec d’autres projets du Labex et d’ateliers de formation à destination des chercheurs. En second lieu, ce projet vise à expérimenter ces outils sur deux corpus particulièrement importants pour l’analyse de la construction d’une mémoire collective : les manuels scolaires, à travers les fonds numérisés par la BnF, et le photoreportage, par le biais du fonds Kagan conservé à La Contemporaine. Grâce à l’analyse de données massives permise par les outils d’apprentissage profond, nous souhaitons explorer la construction d’une mémoire institutionnelle et scolaire et sa transmission par les manuels, et comprendre la manière dont la presse peut contribuer à la formation d’une mémoire collective médiatique, par la réutilisation et la rediffusion d’images sur le temps long.
Responsable du Projet
Julien SCHUH , Université Paris Nanterre - CSLF EA 1586
Partenaires au sein du labex
- Bibliothèque nationale de France (BnF)
- Centre des Sciences des Littératures en langue Française (CSLF) - EA 1586
- La contemporaine | bibliothèque, archives, musée des mondes contemporains
- Modèles, Dynamiques, Corpus (MoDyCo) - UMR 7114
- IR* Huma-Num
Autres partenaires associés
Projet ANR "Numapresse"
http://www.numapresse.org/
Projet ARTEC "La preuve par l'image"
http://eur-artec.fr/2020/02/03/la-preuve-par-limage-de-la-contre-histoire-au-complotisme/
Projet IUF "Synthétismes fin de siècle"
https://crimel.hypotheses.org/1317
Durée du projet
24 moisMots-clés
apprentissage profond, intelligence artificielle, boîte à outils, humanités numériques