Le blog de Fabien DUMINY

Un blog utilisant WordPress

Skip to: Content | Sidebar | Footer

RMLL 2009 : Unitex : un logiciel libre pour le TAL

18 juillet, 2009 (12:23) | Java, RMLL 2009 | By: fabien

Durant la RMLL 2009, j’ai assisté à la conférence intitulée Unitex : un logiciel libre pour le TAL.

Sébastien PAUMIER nous présente le logiciel unitex pour le traitement automatique des langues (TAL). Ce logiciel prend des dictionnaires et un texte à analyser en entrée et produit en sortie une liste de mots simples, composés ou inconnus.

Voici quelques fonctionnalités d’unitex :

  • définir une priorité entre les différents dictionnaires afin de résoudre les conflits pour un même mot.
  • rechercher toutes les occurences d’un verbe conjugué dans un texte
  • visualiser graphiquement un mot (‘un sujet est suivi d’un verbe’ …)
  • rechercher des mots en utilisant une expression régulière, le type grammatical (verbe, nom, …), les opérations binaires (et, ou, …) ou le contexte (‘si suivi de’ …)

Sébastien souligne que tous les logiciels produits par la recherche publique devraient être des logiciels libres. En effet, cela s’inscrit parfaitement dans l’esprit scientifique, qui veut que toute expérimentation soit reproductible.

J’ai aussi assisté à la conférence intitulée Vers un nouvel outil libre pour l’analyse syntaxique.
Agnès Souque nous explique que les logiciels libres de correction grammaticale existants ne sont pas adaptés au français et nous donne pour exemple le cas de LanguageTool. Elle nous expose ensuite ses recherches pour résoudre ce problème afin de réaliser un logiciel adaptable (on espère!) à d’autres languages.

Be Sociable, Share!
Share and Enjoy

Write a comment





If your website is claim enabled, it will be notified that you have posted here.

MySQL query error