User Tools

Site Tools

Agence Nationale de la Recherche

internships-2018-atilf-m2-1

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

internships-2018-atilf-m2-1 [2017/11/20 22:44]
matthieu.constant created
internships-2018-atilf-m2-1 [2017/11/20 22:47] (current)
matthieu.constant
Line 3: Line 3:
   * **Domaine:** traitement automatique des langues     * **Domaine:** traitement automatique des langues  
   * **Lieu du stage:** [[http://www.atilf.fr|ATILF]], Nancy     * **Lieu du stage:** [[http://www.atilf.fr|ATILF]], Nancy  
-  * **Encadrants:** [[https://apps.atilf.fr/homepages/mconstant/|Mathieu Constant]]  +  * **Encadrants:** [[https://apps.atilf.fr/homepages/mconstant/|Mathieu Constant]] et [[http://www.info.univ-tours.fr/~savary/|Agata Savary]]
   * **Durée du stage:** 4 à 6 mois     * **Durée du stage:** 4 à 6 mois  
   * **Rémunération:** gratification réglementaire     * **Rémunération:** gratification réglementaire  
Line 13: Line 13:
 ===== Contexte du stage ===== ===== Contexte du stage =====
  
-Le stage se déroulera dans le cadre du projet ANR PARSEME-FR qui étudie les liens entre expressions polylexicales et l’analyse syntaxico-sémantique automatique. Les expressions polylexicales (EP), comme //pomme de terre//, //se voiler la face//, //Afrique du Sud//, //prendre une décision//, sont des groupes de mots aux propriétés imprédictibles. En particulier, leur sens ne peut souvent être directement calculé à partir du sens de leurs composants. Pour cette raison, elles posent des problèmes majeurs au traitement automatique et leur traitement nécessite une description explicite dans un lexique.+Le stage se déroulera dans le cadre du projet ANR PARSEME-FR qui étudie les liens entre expressions polylexicales et l’analyse syntaxico-sémantique automatique. Les expressions polylexicales (EP), comme //pomme de terre//, //se voiler la face//, //Afrique du Sud//, //prendre une décision//, sont des groupes de mots aux propriétés imprévisibles. En particulier, leur sens ne peut souvent être directement calculé à partir du sens de leurs composants. Pour cette raison, elles posent des problèmes majeurs au traitement automatique et leur traitement nécessite une description explicite dans un lexique.
 Un des objectifs du projet PARSEME-FR est de construire à la fois un lexique d’EP incluant des descriptions linguistiques fines, et un corpus annoté en EP pour le français. Un des résultats les plus notables jusqu’à présent est l’annotation des données françaises (Candito et al. 2017) pour la Shared Task PARSEME sur l’identification des expressions verbales (Savary et al. 2017). Un des objectifs du projet PARSEME-FR est de construire à la fois un lexique d’EP incluant des descriptions linguistiques fines, et un corpus annoté en EP pour le français. Un des résultats les plus notables jusqu’à présent est l’annotation des données françaises (Candito et al. 2017) pour la Shared Task PARSEME sur l’identification des expressions verbales (Savary et al. 2017).
 Les deux ressources créées ont pour but d’être exploitées dans des applications du traitement automatique des langues telles que l’analyse syntaxique et sémantique, mais aussi d’être explorées pour des études linguistiques. Les deux ressources créées ont pour but d’être exploitées dans des applications du traitement automatique des langues telles que l’analyse syntaxique et sémantique, mais aussi d’être explorées pour des études linguistiques.
Line 23: Line 23:
 Le travail à réaliser comportera les tâches suivantes: Le travail à réaliser comportera les tâches suivantes:
   * étudier les propriétés linguistiques des expressions polylexicales du français, en explorant le lexique des expressions verbales extrait des tables du lexique-grammaires (Gross 1984)   * étudier les propriétés linguistiques des expressions polylexicales du français, en explorant le lexique des expressions verbales extrait des tables du lexique-grammaires (Gross 1984)
-  * Développer un outil pour lier automatiquement les expressions verbales annotées et leurs entrées correspondantes dans le lexique, en s’appuyant sur des procédures de normalisation des expressions. Par exemple, les expressions annotées sur corpus //Luc a cassé du sucre sur le dos de Paul//, //du sucre a été cassé sur son dos// devront être liée à l’entrée //casser du sucre sur le dos [de]// du lexique. +  * développer un outil pour lier automatiquement les expressions verbales annotées et leurs entrées correspondantes dans le lexique, en s’appuyant sur des procédures de normalisation des expressions. Par exemple, les expressions annotées sur corpus //Luc a cassé du sucre sur le dos de Paul//, //du sucre a été cassé sur son dos// devront être liée à l’entrée //casser du sucre sur le dos [de]// du lexique. 
-  * Développer une interface web avec l’objectif de chercher des expressions annotées via des filtres multicritères et visualiser leur description linguistique arborescente +  * développer une interface web avec l’objectif de chercher des expressions annotées via des filtres multicritères et visualiser leur description linguistique arborescente 
-  * De manière optionnelle, étendre le travail à toutes les expressions polylexicales, ce qui impliquera la conversion automatique d’un dictionnaire existant de composés nominaux, adjectivaux et adverbiaux dans le format arborescent PARSEME-FR, en particulier en utilisant les informations syntaxiques fournies dans le corpus annoté. +  * éventuellement, étendre le travail à toutes les expressions polylexicales, ce qui impliquera la conversion automatique d’un dictionnaire existant de composés nominaux, adjectivaux et adverbiaux dans le format arborescent PARSEME-FR, en particulier en utilisant les informations syntaxiques fournies dans le corpus annoté. 
  
  
Line 48: Line 48:
 **Procédure de candidature:** **Procédure de candidature:**
  
-Les candidatures doivent être envoyées par mail à Mathieu.Constant@univ-lorraine.fr. Le dossier de candidature contiendra un cv, une lettre de motivation, et, éventuellement, la recommandation d'un enseignant. +  * Les candidatures doivent être envoyées par mail à Mathieu.Constant@univ-lorraine.fr. Le dossier de candidature contiendra un cv, une lettre de motivation, et, éventuellement, la recommandation d'un enseignant. 
- +  **Date limite de candidature:** 15 janvier 2018 (ou jusqu’à ce ce que le poste soit pourvu)
-**Date limite de candidature:** 15 janvier 2018 (ou jusqu’à ce ce que le poste soit pourvu)+
  
  
  
internships-2018-atilf-m2-1.txt · Last modified: 2017/11/20 22:47 by matthieu.constant