Qu'est-ce ReSyf ?
Il s'agit d'une ressource de synonymes. La particularité de ReSyf est que les degrés de difficulté des synonymes (colorés du vert au rouge) ont été automatiquement obtenus à partir de corpus et grâce à un modèle prédictif. Ce
modèle s'appuie sur des variables formelles et psycholinguistiques mesurant la complexité lexicale (français langue première). La catégorie morpho-syntaxique et la polysémie des entrées sont également prises en compte.
La version 1.0 de ReSyf contient plus de 30,000 lemmes désambiguïsés issus du réseau JeuxDeMots, étiquetés avec TreeTagger et filtrés avec Lexique 3 et le
Trésor de la Langue Française Informatisé (TLFi).
Quel est l'intérêt de ReSyf ?
ReSyf peut être utilisé comme ressource pédagogique pour des apprenants du français. Il est aussi utilisé dans des outils de simplification automatique de textes (technologies d'aide à la lecture-travaux en cours dans le cadre du
projet ANR Alector).
Comment utiliser ReSyf ?
Dans la fenêtre de recherche, écrivez un mot (une aide contextuelle vous sera proposée). Le résultat obtenu montre les sens du mot en fonction de sa catégorie grammaticale. Les synonymes en vert sont les plus faciles, les orange
et rouge les plus difficiles. La notion de complexité tient compte de différents facteurs et a été validée par des annotateurs humains sur un échantillon d'une centaine d'entrées.
Bibliographie
-
Billami, M. B., François, T. et Gala, N. (2018) ReSyf: a French lexicon with ranked synonyms. Proceedings of COLING 2018, August, 20-26, Santa
Fe, USA.
-
François, T., Billami, M. B., Gala, N. et Bernhard, D. (2016) Bleu, contusion, ecchymose : tri automatique de synonymes en fonction de leur
difficulté. Actes de la conférence Traitement Automatique des Langues Naturelles. Paris.
-
Gala, N., Billami, M. B., François, T. et Bernhard, D. (2015) Graded lexicons: new resources for educational
purposes and much more. 22nd Computer-assisted language learning conference (EUROCALL-2015). Padova (Italie), août 2015.
-
Gala, N., François T., Bernhard, D. et Fairon, C. (2014) Un modèle pour prédire la complexité lexicale et graduer les mots. Actes de Traitement
Automatique des Langues Naturelles (TALN 2014), Marseille, juillet 2014.
-
Gala, N., François, T. et Fairon, C. (2013) Towards a French lexicon with difficulty measures: NLP helping to bridge
the gap between traditional dictionaries and specialized lexicons. Actes de Electronic lexicography in the 21st century: thinking outside the paper (eLex 2013). Tallinn (Estonie), octobre 2013.
Contributeurs :
- Núria Gala, LPL, Aix Marseille Université, Brain and Language Reseach Institute, ILCB.
- Mokhtar B. Billami, LIF-TALEP, Aix Marseille Université, Brain and Language Reseach Institute, ILCB.
- Thomas François, Cental, Université Catholique de Louvain
- Cédrick Fairon, Cental, Université Catholique de Louvain.
- Delphine Bernhard, LiLPa, Université de Strasbourg.
- Site Web :
- Dorian Ricci, étudiant à l'Université Catholique de Louvain (2017).
- Brayan Delmée, étudiant à l'Université Catholique de Louvain (2017).
- Mohamed Nader Janhaoui, étudiant du master IDL Grenoble Alpes (2015-2016).