Dans la cadre du projet ANR EcoLe, Sorbonne Université et l’équipe STIH recrutent un.e post-doc spécialisé.e en humanité numériques et TAL, dont la mission principale sera d’implémenter des outils de textométrie sur les corpus rassemblés dans le cadre du projet ANR EcoLe qui sont disponibles sur la plateforme EMAN.
Durée de la mission : 24 mois à partir du 01/09/2024.
Ce poste est à pourvoir au sein de la Faculté des Lettres : http://lettres.sorbonne-universite.fr
Localisation (Direction/service) : STIH EA 4509
Activités principales :
Les principales tâches sur lesquelles il/elle sera amené.e à travailler sont :
· L’étiquetage morpho-syntaxique d’un corpus textuel longitudinal en français (13e-18e s.).
· L’étiquetage des connecteurs logiques et de la ponctuation noire et blanche ; l’identification des chaînes de références.
· La désambiguïsation d'entités nommées.
· Il/elle devra être capable d’utiliser des techniques de machine learning et deep learning pour l'extraction d'informations
· Il /elle devra aussi être capable d’assurer du traitement hors-ligne (Back-office)
Connaissances transversales requises :
-Doctorat en TAL ou Humanités numériques
-Compétences en apprentissage automatique (machine learning et deep learning), avec une capacité à appliquer ces techniques à des problématiques d'analyse textuelle.
-Appétence pour les questions de linguistique textuelle et d’humanités numériques.
-Il/Elle devra être capable d’exploiter des API.
-Il/Elle devra avoir une connaissance approfondie des langages de programmation utilisés dans les sciences humaines (ex. Python et, si possible, aussi PHP)
-Il/Elle devra avoir des connaissances en interfaces.
-Il/Elle devra avoir la capacité de travailler en équipe : créer et améliorer l'esprit d'équipe, travailler en synergie avec les autres chercheurs et l’ingénieure d’études.