User Tools

Site Tools

Agence Nationale de la Recherche

internships-2016-ligm-m2-1

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

internships-2016-ligm-m2-1 [2015/12/09 22:32]
matthieu.constant [Candidater]
internships-2016-ligm-m2-1 [2015/12/09 23:04] (current)
matthieu.constant [Reconnaissance d'expressions polylexicales verbales et apprentissage profond] links
Line 2: Line 2:
  
   * **Domaine:​** traitement automatique des langues  ​   * **Domaine:​** traitement automatique des langues  ​
-  * **Lieu du stage:​** ​ALPAGE, Université Paris-Diderot ou LIGM, Université Paris-Est Marne-la-Vallée ​  +  * **Lieu du stage:​** ​[[http://​alpage.inria.fr|Alpage]][[http://​www.univ-paris-diderot.fr|Université Paris-Diderot]] ou [[http://​ligm.u-pem.fr/​|LIGM]][[http://​www.u-pem.fr|Université Paris-Est Marne-la-Vallée]]   
-  * **Encadrant principal:​** ​Matthieu Constant (UnivParis-Est Marne-la-Vallée,​ LIGM, CNRS et équipe ALPAGE, INRIA) ​ +  * **Encadrant principal:​** ​[[http://​igm.univ-mlv.fr/​~mconstan|Matthieu Constant]] ​ 
   * **Durée du stage:** 6 mois  ​   * **Durée du stage:** 6 mois  ​
   * **Rémunération:​** gratification réglementaire  ​   * **Rémunération:​** gratification réglementaire  ​
-  * **Financement:​** Université Paris-Est Marne-la-Vallée ​sur les crédits du projet ANR PARSEME-FR  ​+  * **Financement:​** Université Paris-Est Marne-la-Vallée
  
 ----------------- -----------------
Line 13: Line 13:
 ===== Contexte du stage ===== ===== Contexte du stage =====
  
-Une des tâches fondamentales du traitement automatique des langues est de développer des analyseurs produisant automatiquement une représentation linguistique d'un texte donné en entrée: ex. segmentation lexicale, étiquetage grammatical,​ analyse syntaxique, analyse sémantique,​ ... Les stages proposés ci-dessous concernent la segmentation lexico-sémantique et, en particulier,​ l'​identification des expressions polylexicales,​ qui forment des combinaisons de mots avec un certain degré d'​idiomaticité. Ces expressions sont très fréquentes et extrêmement variées. Par exemple, ​*pomme de terre**prendre en grippe**alors que**en effet**en dépit de*, ... Elles posent de sérieux problèmes pour les applications du traitement automatique des langues comme la traduction automatique. Cette proposition de stage se place dans le cadre du projet ANR PARSEME-FR qui vise à intégrer ce type d’expressions au sein d’analyseurs syntaxiques à grande échelle. Ce stage pourra éventuellement se poursuivre en thèse.+Une des tâches fondamentales du traitement automatique des langues est de développer des analyseurs produisant automatiquement une représentation linguistique d'un texte donné en entrée: ex. segmentation lexicale, étiquetage grammatical,​ analyse syntaxique, analyse sémantique,​ ... Les stages proposés ci-dessous concernent la segmentation lexico-sémantique et, en particulier,​ l'​identification des expressions polylexicales,​ qui forment des combinaisons de mots avec un certain degré d'​idiomaticité. Ces expressions sont très fréquentes et extrêmement variées. Par exemple, ​//pomme de terre////prendre en grippe////alors que////en effet////en dépit de//, ... Elles posent de sérieux problèmes pour les applications du traitement automatique des langues comme la traduction automatique. Cette proposition de stage se place dans le cadre du projet ANR PARSEME-FR qui vise à intégrer ce type d’expressions au sein d’analyseurs syntaxiques à grande échelle. Ce stage pourra éventuellement se poursuivre en thèse.
  
  
 ===== Objectifs ===== ===== Objectifs =====
  
-L'​objectif de ce stage est d’incorporer dans un outil d’identification d'​expressions polylexicales des techniques d’apprentissage profond (ou deep learning), afin d’améliorer ses performances. Dans un premier temps, les techniques seront mises au point pour le français, la langue de travail du projet PARSEME-FR. Puis, elles seront adaptées à un certain nombre de langues européennes avec, pour objectif, à moyen terme de participer à la compétition internationale sur la reconnaissance d’expressions verbales qui se tiendra dans le cadre de l’action européenne COST PARSEME entre 2016 et 2017.+L'​objectif de ce stage est d’incorporer dans un outil d’identification d'​expressions polylexicales des techniques d’apprentissage profond (ou deep learning), afin d’améliorer ses performances. Dans un premier temps, les techniques seront mises au point pour le français, la langue de travail du projet PARSEME-FR. Puis, elles seront adaptées à un certain nombre de langues européennes avec, pour objectif, à moyen terme de participer à la compétition internationale sur la reconnaissance d’expressions verbales qui se tiendra dans le cadre de l’action européenne COST [[http://​typo.uni-konstanz.de/​parseme/​|PARSEME]] entre 2016 et 2017.
 L’un des enjeux importants du stage sera de mettre en oeuvre des méthodes d’apprentissage profond tenant compte d’informations linguistiques provenant de lexiques. ​ L’un des enjeux importants du stage sera de mettre en oeuvre des méthodes d’apprentissage profond tenant compte d’informations linguistiques provenant de lexiques. ​
  
-Le stagiaire recruté sera amené à collaborer avec des chercheurs de l’équipe Alpage de l’INRIA et du laboratoire Lattice.+Le stagiaire recruté sera amené à collaborer avec des chercheurs de l’équipe ​[[http://​alpage.inria.fr|Alpage]] de l’[[http://​www.inria.fr|INRIA]] et du laboratoire ​[[http://​www.lattice.cnrs.fr|Lattice]].
  
 ------------------------------ ------------------------------
internships-2016-ligm-m2-1.1449696749.txt.gz · Last modified: 2015/12/09 22:32 by matthieu.constant