Home

article

image

Contents

1. La Figure 1 illustre les r sultats de cette m thode pour le verbe abandonner 1 a montre les scores de similarit de 3 synonymes avec la d finition TLFi Quitter un lieu ne plus l occuper du verbe abandonner calcul s par 3 mesures de similarit diff rentes Dans le tableau 1 b la mesure de similarit est fixe Recouvrement de mots tendu avec normalisation mais les scores sont affich s pour un synonyme et plusieurs d finitions On voit par exemple que le synonyme d loger atteint le score maximal pour la d finition 1 1 1 1 1 2 1 Quitter un lieu Il sera consid r comme synonyme d abandonner avec le sens repr sent par cette d finition Enfin Banerjee amp Pedersen 2003 inclut en outre dans la mesure de similarit les d finitions des hyponymes hy peronymes m ronymes holonymes et troponymes donn s par le Princeton WordNet pour les mots impliqu s dans les textes compar s Nous n avons pas pu prendre en compte cette extension du fait de la couverture relativement pauvre de l EuroWordNet Fran ais 2349 verbes contre e g 5077 verbes pour Le Petit Robert Le WOLF Sagot amp Fiser 2008 contient 979 verbes 1544 synsets verbaux et est imparfait car r sultant d un processus d acquisi tion automatique Il serait n anmoins int ressant de voir dans quelle mesure l information qu il contient impacte la qualit des r sultats SContrairement 4 les dimensions de l espace vectoriel con
2. poursuivre une action une recherche renoncer une entreprise un projet abandonner des re cherches http www crisco unicaen fr cgi bin cherches cgi Sens synonymes et d finitions 5 Quitter qqn s en s parer laisser qqn lui m me le laisser seul 6 Laisser qqn la possession ou le soin d un bien ou d une pers laisser qqc l enti re disposition de qqn abandonner qqn le soin de faire qqc 7 Laisser qqc ou qqn en proie qqc gen une force hostile abandonner une terre aux ravages abandonner un enfant au bagne Toute la partie sup rieure de l espace s mantique rassemble des synonymes comme s avouer vaincu se rendre caler c der interrompre repousser qui correspondent au sens 4 En des cendant vers la droite de l espace s mantique on arrive via la notion de renoncement et de d possession des synonymes comme jeter l cher larguer jeter qui correspondent selon que l objet est humain ou non aux sens 1 et 5 La partie inf rieure gauche de l espace s man tique rassemble des synonymes comme d guerpir fuir qui correspondent plut t au sens 2 Si une telle exploration continue peut faire le bonheur d un lexicographe ou d un s manticien on voit qu elle est plus difficile exploiter automatiquement de par sa granularit trop fine Les exp riences de d sambigu sation men es partir des espaces s mantiques de dicosyn Venant 2007 Venant 2008 ont n cessit
3. un regroupement manuel des cliques les nuances de sens en sens macroscopiques correspondant des d finitions du TLF1 De plus comme on a pu le voir ici on n a pas acc s des discriminations de sens en fonction de la nature de l objet ou du sujet On voit donc ici toute la compl mentarit des deux approches L id al serait terme d tablir des correspondances entre les deux ressources en projetant sur les cliques les appariements synonymes d finitions que nous avons obtenus WOLF Le WOLF WOrdnet Libre du Fran ais est une ressource lexicale s mantique pour le fran ais librement disponible Sagot amp Fiser 2008 Il s agit d un wordnet construit partir du Princeton WordNet PWN et de diverses ressources multilingues Sagot amp Fiser 2008 au moyen de deux approches compl mentaires Comme dans tout WordNet les unit s lexicales sont r parties en cat gories et organis es en une hi rarchie de n ud structur e par des rela tions s mantiques Chaque n ud repr sente un concept et est associ un synset ensemble de synonymes d notant ce concept Le WOLF reprend la structure de PWN Pour chaque lex me monos mique du PWN on cr e l entr e fran aise correspondante via une ressource bilingue anglais fran ais Les lex mes polys miques ont t trait s au moyen d une approche reposant sur l alignement en mots d un corpus parall le en cinq langues dont le fran ais Diff rents lexiques mu
4. Abstract we present a method for grouping the synonyms of a word into sets represen ting the possible meanings of that word The possible meanings are given by the definitions of a general dictionary for French the TLFi Tr sor de la langue fran aise informatis and the method is applied to the synonyms of 5 synonym dictionnaries To evaluate the method we manually constructed a gold standard where for each word definition pair 4 lexicographers specified the set of synonyms they judge adequate The method scores an F measure of 0 602 when no distinction is made between pronominal and non pronominal use and 0 706 when it is Falk Gardent Jacquey Venant 1 Introduction L importance de la s mantique lexicale pour le TAL n est plus d montrer La question de la repr sentation du sens et de l acc s l information dans les ressources lexicales devient fonda mentale pour la r solution de nombreux probl mes actuels tels que la construction d ontologies la recherche d information et la g n ration de textes Cette question est d autant plus importante que pour le fran ais on manque encore de ressources s mantiques de qualit structur es libre ment accessibles et non limit es un domaine sp cialis Dans cet article nous pr sentons une m thode visant regrouper les synonymes d un mot en sous ensembles correspondant aux diff rents sens possibles de ce mot Les sens possibles sont donn s par les d fini
5. Gardent Jacquey Venant Dicosyn Dicosyn est un dictionnaire lectronique disponible en ligne Il est issu de la fusion de 7 dictionnaires Le travail initial a t r alis par Ploux amp Victorri 1998 On explore ce dictionnaire sous la forme d un graphe les sommets sont les entr es du dictionnaire Un lien est trac entre deux sommets lorsque le dictionnaire atteste de leur synonymie Pour tudier la s mantique d un mot donn on extrait du graphe de synonymie le sous graphe constitu par ce mot et tous ses synonymes et seulement ses synonymes La construction des espaces s mantiques repose sur le m me constat que celui voqu pr c demment un synonyme ne suffit pas en g n ral pour d finir un sens du mot tudi La Figure 2 a montre un extrait du graphe de synonymie de abandonner On y voit que laisser est la fois synonyme de quitter et de confier qui correspondent deux sens diff rents de abandonner L id e est donc ici aussi de caract riser un sens par un ensemble de synonymes Plus pr cis ment Dicosyn utilise les cliques du graphe de synonymie Une clique est un ensemble de sommets deux deux synonymes le plus grand possible Le graphe de la Figure 2 a pr sente ainsi 2 cliques abandonner confier donner d poser laisser abandonner d laisser laisser quitter renoncer L id e sous jacente la construction des espaces s mantiques est qu une clique abandonner cal
6. cette nouvelle proc dure sont donn s dans la seconde s rie de r sultats Tableau 1 Ils montrent un gain net en pr cision comme en rappel avec une F mesure de 0 706 pour le recouvrement tendu normalis contre 0 602 sans la distinction pronominal non pronominal Sans diff pron vs non pron Avec diff pron vs non pron Mesure sim R P F R P F baseline 0 497 0 315 0 385 0 440 0 433 0 437 Recouvrement 0 725 0 508 0 598 0 697 0 685 0 691 Rec tendu 0 723 0 508 0 597 0 697 0 685 0 691 Rec tendu norm 0 729 0 513 0 602 0 711 0 670 0 706 Vecteurs 1 ordre 0 727 0 510 0 560 0 704 0 693 0 698 Vecteurs 24 ordre sans tf idf 0 715 0 503 0 590 0 698 0 686 0 692 Vecteurs 24 ordre avec tf idf 0 717 0 505 0 592 0 701 0 689 0 695 TAB 1 Pr cision rappel et F mesure pour les diff rentes mesures de similarit avec et sans la distinction pronominal non pronominal En r sum la m thode propos e permet une nette am lioration par rapport un assignement synonymes d finitions fait au hasard F Mesure de 0 706 vs 0 437 La diff rence entre r sultats avec et r sultats sans pr traitement des pronominaux montrent en outre qu un pr traitement fin des d finitions du TLFi est une composante importante pour des r sultats de qualit 4 Comparaison interaction possibles avec les ressources fran aises exis tantes Falk
7. dictionnaire html Sens synonymes et d finitions divergences et de fusionner l information contenue par chacun de ces dictionnaires nous pre nons les d finitions du TLFi comme r pertoire des sens possibles d un lex me et nous utilisons des mesures de similarit pour associer chacun des synonymes r pertori s dans les diff rents dictionnaires de synonymes avec les sens d finitions du TLF1 ad quats La m thode employ e comprend les trois grandes tapes suivantes Extraction des d finitions du TLFi et cr ation d un index par d finition L index est une s quence de mots pleins lemmatis s apparaissant dans la d finition apr s h ritage cf in fra et en prenant en compte les champs des entr es dictionairiques portant sur le domaine technique la synonymie et l antonymie et les indicateurs d emploi Mesure de la similarit entre index Etant donn un verbe V un synonyme S de V les index extraits des d finitions TLFi D D de V et l union des index extraits des d finitions Dsi de Si des mesures de similarit sont appliqu es pour d terminer la d finition D de V la plus similaire des d finitions de S Association Synonyme D finition Chaque synonyme est associ avec la les d finition s D3 de V la plus similaire l ensemble de ses d finitions 2 1 Traitement des d finitions et cr ation des index Parce que les calculs de similarit op rent sur les index cr s
8. diff rents degr de pr traitement linguistique L chantillon de r f rence Nous avons s lectionn un chantillon de verbes variant en terme de fr quence polys mie et g n ricit Pour chaque dimension nous avons identifi des verbes illustrant trois valeurs basse moyenne et lev e induisant un total de 27 verbes 3 La fr quence est estim e partir d une liste de fr quence extraite d une analyse avec Syntex de 10 ans du Monde Bourigault amp Fabre 2000 la g n ricit partir de la position du verbe dans le module fran ais de l EuroWordNet et la polys mie partir du nombre de d finitions lis t es dans le TLFi Pour chacun des verbes s lectionn s chaque d finition TLFIi a t associ e manuellement un ou plusieurs synonymes de la base par quatre lexicographes ou linguistes Sur un total de 7 047 triplets Verbe D finition Synonyme le pourcentage d accord inter annotateurs varie entre 74 et 87 pour les paires d annotateur et descend 63 pour les 4 annotateurs Aucune des paires ne pr sente un accord parfait ce qui montre la difficult de la SPour les deux autres exemples pr sent s ici l accord lexicographes syst me est de 5 6 et 5 7 respectivement Sens synonymes et d finitions t che Pour l valuation nous utilisons la r f rence cr e par le premier annotateur de la paire ayant l accord le plus lev 87 Variantes et r sultats Dans un premi
9. et tous ses synonymes Les points de cet espace sont les cliques du graphe Les coordonn es d une clique d pendent des synonymes qu elle contient La Figure 2 b montre l espace s mantique associ abandonner Il s agit d une vision partielle puisque l espace tant de grande dimension il faut le projeter pour pouvoir en obtenir une vision 2D Nous voyons ici la projection selon les deux premiers axes de l analyse en composantes principales De telles visualisations permettent une visualisation globale de la s mantique d une unit Leur int r t principal est de rendre compte de la continuit du sens de la difficult tracer des fronti res nettes entre les sens de la ressemblance de famille existant entre les diff rents sens d une unit Sur la Figure 2 on voit ainsi se d gager 4 p les de sens et la fa on dont on peut passer contin ment d un de ces p les un autre en passant par des nuances de sens interm diaires Comparons ces p les aux 7 sens principaux que l on peut extraire du TLFi 1 Rompre le lien qui attachait une chose ou une personne renoncer un pouvoir des doirs la possession d un bien ou l utilisation d une chose 2 Quitter un lieu ne plus l occuper abandonner un pays un domicile 3 Cesser de d fendre une cause renoncer des principes une id e en la rejetant ou simplement en s en s parant abandonner une cause des principes 4 Renoncer
10. lection distributionnelle pour d sambiguiser les adjectifs In Trai tement Automatique des Langues Naturelles Toulouse France VENANT F 2008 Repr sentation g om trique et calcul dynamique du sens lexical application la polys mie de livre Langages 172 Vhttp talc loria fr
11. partir des d finitions TLFI il est important de normaliser et d enrichir ces d finitions autant que possible Il importe par exemple d viter que deux formes soient consid r es comme distinctes alors qu elles repr sentent le m me lemme chat chats ou encore de pallier le fait que certaines d finitions du TLFi sont vides de contenu parce que le texte de la d finition est suppos donn par h ritage partir des niveaux sup rieurs de l entr e dictionnairique Nous d taillons dans ce qui suit la structure des entr es du TLFi et indiquons comment cette structure est utilis e pour construire les index sur lesquels seront appliqu es les mesures de similarit Les diff rents types d information d une entr e du TLFi L information fournie dans le TLF1 se subdivise en trois grands ensembles 1 diff rents types d informations non r trocon verties au format XML donc non exploitables ici tymologie fr quences dans le corpus de r f rence du dictionnaire d riv s orthographe et prononciation 2 information relative l organisation hi rarchique marques de niveau hi rarchique marques de plan retraits puces et tirets et 3 l information lexicographique proprement dite qui est divis e en blocs d infor mation coh rents pouvant contenir un domaine d emploi ferronnerie justice etc un indicateur d emploi figur familier pronominal etc des crochets informa tions tr s diverses une d
12. w dans l ensemble des d finitions de V Pour un synonyme Sy le poid de w est le nombre d occurences de w dans les d finitions de Sy divis par le nombre d occurences de w dans l ensemble des d finitions de V Le score de similarit d une d finition Di de V et un synonyme Sy et le produit scalaire des deux vecteurs correspondants 5 Vecteurs du second ordre avec et sans seuil tf idf sont d riv s des vecteurs du premier ordre de la mani re suivante pour chaque d finition d un verbe ou synonyme le vecteur de deuxi me ordre est la somme des vecteurs de premier ordre correspondants aux mots pleins qu elle contient Les vecteurs de second ordre permettent le calcul d une direction moyenne pour un ensemble de vecteurs Quand pour une d finition les vecteurs de ses mots montrent dans une certaine direc tion la dimension correspondante sera pr pond rante dans le vecteur du second ordre Autrement dit les vecteurs du second ordre permettent de cerner le poids des diff rentes dimensions d une d finition Etant donn une mesure de similarit M l ensemble Dy des d finitions TLFi du verbe V Iy l index de Dy et I l index de la d finition Dt de V on calcule pour un synonyme Sy de V les scores de similarit Sim m Is I pour chaque index 1 On consid re que Sy est un synonyme de V pour le sens repr sent par la d finition D si Simmu lsy I Max SimmlIsy Iy et SimmlIsy Iy gt 0 DyEDv
13. SUEL Passer dans un projecteur qui contient un domaine l index cin ma audiovisuel passer projecteur et la d finition Eclaircir Synon jeter quelque lumi re qui comporte un synonyme l index claircir jeter lumi re 2 2 Calculs des regroupements synonymiques Pour un verbe V un synonyme Sy de ce verbe et un ensemble de d finitions Dy d d extraits du TLFi pour ce verbe nous cherchons identifier les d finitions d Dy de V pour lesquelles Sy est synonyme de V Pour attribuer un synonyme Sy une d finition d nous proc dons de la mani re suivante 1 Nous comparons l index de chaque d finition d Dy avec l ensemble des d finitions de Sy en appliquant une mesure de similarit bas e sur les lemmes des d finitions 2 Sy sera attribu aux d finitions pour lesquelles la mesure de similarit est la meilleure pour autant qu elle ne soit pas nulle Afin d estimer l impact de la mesure de similarit utilis e nous avons compar les 6 mesures de similarit suivantes 1 Recouvrement de mots Simple word overlap le score obtenu est le nombre de mots communs aux deux textes compar s 2Les d finitions TLFi sont d ja lemmatis es et cat goris es et les lemmes sont aussi accessibles dans le XML 3Le sens du synonyme consid r n tant pas identifi par les dictionnaires de synonymes il est impossible de d terminer la ou les d finitions pertinentes pour la compa
14. TALN 2009 Senlis 24 26 juin 2009 Sens synonymes et d finitions Ingrid Falk Claire Gardent Evelyne Jacquey Fabienne Venant 1 INRIA Universit Nancy 2 2 CNRS LORIA Nancy 3 CNRS ATILF Nancy 4 Universit Nancy 2 ingrid falk loria fr claire gardent loria fr evelyne jacquey atilf fr fabienne venant loria fr R sum Cet article d crit une m thodologie visant la r alisation d une ressource s man tique en fran ais centr e sur la synonymie De mani re compl mentaire aux travaux existants la m thode propos e n a pas seulement pour objectif d tablir des liens de synonymie entre lex mes mais galement d apparier les sens possibles d un lex me avec les ensembles de sy nonymes appropri s En pratique les sens possibles des lex mes proviennent des d finitions du TLF1 et les synonymes de cinq dictionnaires accessibles l ATILF Pour valuer la m thode d appariement entre sens d un lex me et ensemble de synonymes une ressource de r f rence a t r alis e pour 27 verbes du fran ais par quatre lexicographes qui ont sp cifi manuellement l association entre verbe sens d finition TLFi et ensemble de synonymes Relativement ce standard talon la m thode d appariement affiche une F mesure de 0 706 lorsque l ensemble des param tres est pris en compte notamment la distinction pronominal non pronominal pour les verbes du fran ais et de 0 602 sans cette distinction
15. ager se d sister exposer finir fuir larguer livrer l cher n gliger planter rejeter renier r signer rompre sacrifier semer tomber 1 1 1 1 2 1 Renoncer poursuivre une action une recherche renoncer une entr un projet confier se d mettre d missionner se d partir se d sister d teler flancher laisser l cher plaquer reculer re noncer se r tirer 1 1 1 1 1 2 1 Quitter un lieu ne plus l occuper donner d guerpir d loger d m nager d serter laisser l cher quitter rabattre se s parer vacuer c Groupements de synonymes par d finition La mesure de similarit est recouvrement de mots tendu avec normali sation FIG Mesures et scores de similarit pour quelques synonymes de abandonner Exemple de calculs de regroupement de synonymes 1 c montre les ensembles de synonymes obtenus par la m thode exemplifi e ci dessus Par rapport la r f rence 5 des 6 synonymes attribu s par le syst me au sens 1 1 1 1 2 1 Renoncer ont aussi t attribu s ce sens par un lexicographe 3 R sultats Afin d valuer la qualit des r sultats obtenus de comparer les mesures de similarit et de me surer l impact du pr traitement linguistique nous avons manuellement cr un chantillon de r f rence permettant de calculer le rappel et la pr cision de la m thode propos e et de diff rentes variantes de cette m thode diff rentes mesures de similarit
16. e dictionnaire synonymique r sultant Remerciements Nous remercions Christiane Jadelot Aur lie Merlot et Mick Grzesitchak pour leur participation la cr ation de l chantillon de r f rence Rohan Ra lkar pour sa contri bution l implantation du processus d h ritage et l ATILF pour la mise disposition des sources dictionnairiques TLF1 et Base des synonymes Ce projet a t partiellement financ par le p le TALC Traitement automatique des langues et des connaissances du contrat plan Etat R gion MISN Mod lisation information et syst mes num riques R f rences BANERJEE S amp PEDERSEN T 2003 Extended gloss overlaps as a measure of semantic relatedness BOURIGAULT D amp FABRE C 2000 Approche linguistique pour lanalyse syntaxique de corpus Rapport interne Universit Toulouse Le Mirail Cahiers de Grammaires no 25 MANGUIN J L FRAN OIS J EUFE R FESENMEIER L OZOUF C amp S N CHAL M 2004 Le dic tionnaire lectronique des synonymes du crisco un mode d d emploi trois niveaux Les Cahiers du CRISCO 17 PLOUX S amp VICTORRI B 1998 Construction d espaces s mantiques l aide de dictionnaires informatis s des synonymes In Traitement automatique des langues volume 39 p 161 182 SAGOT B amp FISER D 2008 Building a Free French WordNet from Multilingual Resources In Proc of Ontolex Marrakech Maroc VENANT F 2007 Utiliser des classes de s
17. er temps l chantillon de r f rence a t utilis pour valuer l impact de la mesure de similarit utilis e sur le rappel et la pr cision Le rappel est le nombre de triplets V Df Sy trouv s par le syst me et contenus dans la r f rence divis par le nombre de triplets contenus dans la r f rence La pr cision est le nombre de triplets V Di Sy trouv s par le syst me et contenus dans la r f rence divis par le nombre de triplets trouv s par le syst me Les r sultats obtenus pour les diff rentes mesures sont donn s en Tableau 1 avec pour ligne de base baseline une association arbitraire entre synonymes et paires V Di Dans la premi re s rie de r sultats sans prise en compte de la distinction pronominal vs non pronominal on observe que les r sultats obtenus par les mesures de similarit sont meilleurs que le baseline Les mesures utilis es permettent donc d avoir des r sultats meilleurs que le hasard On observe galement qu il y a peu de diff rence entre les diff rentes mesures et que la pr cision reste relativement basse Cependant dans la mesure o l extraction des informations lexicographiques du TLFi a pris en compte la distinction pronominal vs non pronominal il a t possible de s parer les emplois pronominaux des emplois non pronominaux Les synonymes de la forme pronominale ne sont alors compar s qu aux emplois pronominaux et vice versa Les r sultats obtenus sur la base de
18. ercanerc derlancherrequerrompre 4 abandonner calerc derrecul rrenoncerrompre abandonen c der fuir quitter s loigner p abandornerl cher pets en se retren abandonner faire cesser interrompre suspendre abandonner abolir emetire 3 A abandemnerremettr repoussar suspendre a abai abandonner dispara re fuir partir quiter s erfuir se retiren bandonnet donner exposer livrer 7 shandomnerr culerrejeterrepousser abandonner battre en retraite partir quitter d entuir se retirar Ne abandonner ul AT e quitter 77 FR T ra h o confier os A lt FN NS gt ebardomerpartr qutersertu seiners LANA ef re Fe J d x k x asser O js vi 2 _ abaromernaanearpazr e ere d narscel V Le PET abandornerpartir s eh alertrer sa r v rence N GA ne Ve erondermercogerd n laisser abandonner d querpir d lager partir plier bagage s enfuir a Un extrait du graphe de synonymie de b Espace s mantique associ au verbe abandonner abandonner FIG 2 abandonner un extrait du graph de synonymie 2 a l espace s mantique associ 2 b correspond en premi re approximation une nuance de sens possible pour le mot consid r Nous ne d taillons pas ici la technique de construction de l espace s mantique cf Ploux amp Victorri 1998 Disons simplement que l espace s mantique est l espace euclidien engendr par abandonner
19. finition pr c d e ou non d une locution d finie et ou une relation de synonymie ou antonymie C est ce dernier type d information l information lexicographique qui fournit l essentiel des informations utilis es pour construire les index L information hi rar chique est pour sa part essentiellement exploit e pour mettre en uvre l h ritage descendant d fini ci dessous Identification et cat gorisation des blocs d finitionels Afin d identifier et de cat goriser les d finitions d une entr e du TLFi les r gles d extraction suivantes ont t appliqu es D termination du nombre d emplois ou sens de chaque lex me est consid r comme un em ploi g n ral distinct tout bloc d information contenant une d finition et ou une indication de domaine technique et ou un synonyme ou antonyme Diff renciation des emplois pronominaux et non pronominaux est consid r comme un em ploi pronominal tout bloc d information contenant un indicateur d emploi contenant l in formation pronominal si le code grammatical de l entr e du verbe est ambigu ou bien tous Falk Gardent Jacquey Venant les blocs d information de l entr e d un verbe indiqu comme pronominal dans son code grammatical Identification des emplois fig s est consid r comme la description d un emploi fig ou semi fig tout bloc d information dans lequel une expression ou locution d finie pr c de une d finiti
20. ltilingues ont t extraits de ce corpus align Ces lexiques sont d sambigu s s partir des synsets des Balkanet wordnet de chaque langues qui ont la m me structure et uti lisent les m mes identifiants de synsets Le Wolf ainsi cr contient tous les synsets du PWN y compris ceux pour lesquels aucun lex me fran ais correspondant n a t trouv Le travail que nous avons r alis est compl men taire de l approche utilis e par Sagot et al La m thode qu ils ont choisie permet de cr er au tomatiquement un WordNet partir d un autre existant mais elle repose sur l hypoth se d une structuration s mantique identique en anglais et en fran ais Nous exploitons quant nous la structure s mantique du TLF1 Cette structure pr sente l avantage d tre sp cifique au fran ais Le point commun entre les deux approches r side dans l association de chaque concept avec un ensemble de synonymes On doit pouvoir envisager une interaction entre les deux ressources Par exemple une comparaison des deux structures permettrait un enrichissement mutuel d une part la validation l enrichissement ou la correction des synsets existants d autre part l exploi tation des relations s mantiques tir es du WordNet Ces informations sont sans doute pr sentes dans le TLFi mais elles sont tr s difficiles extraire et exploiter automatiquement Falk Gardent Jacquey Venant 5 Conclusion Nous avons pr sent u
21. ne m thode permettant d associer synonymes et d finitions Afin d va luer la qualit des r sultats obtenus un chantillon de r f rence a t cr manuellement avec un accord inter annotateurs variant entre 63 et 87 Les r sultats obtenus pour les diff rentes variantes explor es diff rentes mesures de similarit diff rents niveaux de pr traitement des d finitions montrent d une part que la m thode permet une pr cision proche de la borne in f rieure d limit e par l accord inter annotateur et d autre part qu un pr traitement pouss des d finitions et en particulier la diff rentiation entre usage pronominal et non pronominal est essentiel pour la bonne qualit des r sultats Nous comptons am liorer la m thode propos e par un pr traitement plus pouss des d finitions du TLFi En particulier la prise en compte des informations de sous cat gorisation devrait per mettre la fois d enrichir les index utilis s par les calculs de similarit et de faire le lien avec les lexiques syntaxiques r pertoriant les sch mas valenciels des l ments pr dicatifs Ensuite nous pensons appliquer la m thode aux dictionnaires synonymiques disponibles dont en particulier les dictionnaires des synonymes de l ATILF et le wiktionnaire du fran ais Enfin nous souhaitons mettre au point une m thodologie permettant de tirer parti des compl mentarit s de WOLF et de DicoSyn pour valuer et compl menter l
22. on H ritage de l information Nous avons proc d un h ritage descendant et contr l afin d expliciter l information laiss e implicite par le lexicographe Parmi les diff rents types d in formations certains ont t consid r s comme strictement locaux d autres comme pouvant tre propag s sur les blocs hi rarchiquement domin s Informations h ritables les indicateurs d emploi par exemple emploi pronominal les cro chets les indications de domaine technique le code grammatical de l entr e Informations locales les d finitions les synonymes et antonymes les expressions illustratives et les exemples Cr ation des index Pour chaque d finition identifi e partir des informations hi rarchiques l information extraite du TLFi comprend le texte de la d finition les synonymes et les an tonymes ventuellement associ s cette d finition et par h ritage les indicateurs de domaine technique A partir de cette information l index cr est la s quence des lemmes de cat gorie Inf infinitif S substantif A adjectif sauf cas cardinal part pass adverbe APs adverbes Pr participe pr sent sauf g rondif Ps part pass sauf cas infitinitif Par exemple dans le cas des d finitions du verbe projeter les index extraits seront les suivants la d finition Jeter loin en avant avec force est associ e l index jeter loin avant force la d finition CIN AUDIO VI
23. raison verbe synonyme C est pourquoi nous prenons comme base de comparaison l ensemble des d finitions du synonyme et non la ou les d finitions correspondant au sens impliqu Bien que cette proc dure soit ind niablement inexacte les r sultats obtenus indiquent que le bruit introduit reste acceptable Sens synonymes et d finitions 2 Recouvrement de mots tendu Extended word overlap une s quence de n mots commune entre les textes compar s est attribu e un score de n Le score donn par la mesure de recouvrement de mots tendue Banerjee amp Pedersen 2003 est la somme des scores de recouvrements de n mots 3 Recouvrement de mots tendu avec normalisation Extended word overlap normalised Le score obtenu par le Recouvrement de mots tendu 2 est normalis par le nombre de mots des d finitions compar es 4 Un vecteur du premier ordre pour un mot indique les co occurences de ce mot dans un contexte donn en l occurence une d finition du TLFi La similarit de deux mots peut alors tre calcul e par une mesure vectorielle de similarit Pour chaque verbe V nous construisons des vecteurs de mots pond r s pour chacune de ses d finitions Di et pour chacun de ses synonymes Les dimensions de ces vecteurs sont les lemmes des d finitions de V dont le tf idf est non nul Pour une d finition D le poid de chaque mot w est le nombre d occurences de w dans Di divis par le nombre d occurences de
24. siste des lemmes de toutes les d finitions du TLFi et non pas uniquement les lemmes des d finitions du verbe en question 6Par manque de place nous n avons inclus ni toutes les d finitions ni tous les synonymes TEn Fran ais contemporain le verbe d loger n est pas un synonyme du verbe abandonner N anmoins le TLFi associe d loger la d finition Sortir du lieu o l on est install Quitter le logement que l on occupe pour s installer ailleurs d o le lien de synonymie fort d tect par notre m thode Falk Gardent Jacquey Venant Synonyme r re ren Synonyme 1 1 1 1 1 1 2 1 1 1 1 1 2 1 1 1 1 1 1 2 1 d guerpir 1 1 0 067 rompre 0 213 0 060 0 000 0 000 d loger 5 8 0 778 d loger 0 000 0 042 0 000 0 778 d m nager 2 5 0 722 se d sister 0 000 0 000 0 167 0 000 b Scores de similarit par synonyme et d finition pour quelques synonymes par rapport quelques d finitions donn es par leurs identifiants La mesure de similarit est recouvrement de mots tendu avec normalisation En gras les valeurs maximales par sy nonyme et l ensemble de d finitions a Scores de similarit selon les me sures recouvrement de mots r recouvre ment tendu re et recouvrement tendu avec normalisation ren de quelques sy nonymes par rapport la d finition Quit ter un lieu ne plus l occuper 1 1 1 Rompre le lien qui attachait une chose ou une personne abjurer accorder c der d laisser d m n
25. t le travail d extraction d un word net libre pour le Fran ais WOLF pr sent dans Sagot amp Fiser 2008 et d autre part l la boration de DicoSyn Manguin et al 2004 Elle diff re de DicoSyn en ce qu elle permet d associer chaque groupe de synonymes avec une d finition repr sentant le sens de ces syno nymes Elle se d marque de l approche pr sent e dans Sagot amp Fiser 2008 en ce que les ensembles de synonymes synsets obtenus sont cr s partir de donn es francophones plu t t que par traduction partir du WordNet de Princeton pour l anglais et d sambigu sation sur des donn es multilingues Le travail pr sent ici ne porte en outre pas sur la production d une ressource mais plut t sur la pr sentation d une m thodologie possible pour la cr ation d une ressource synonymique L article est structur de la fa on suivante La section 2 pr sente la m thode mise au point pour regrouper sens et synonymes la section 3 r sume les r sultats obtenus la section 4 compare l approche propos e avec les approches adopt es pour la cr ation de DicoSyn et du WOLF et la section 5 indique les perspectives de recherche pour l avenir 2 M thode Pour un m me lex me les diff rents dictionnaires de synonymes de l ATILF donnent g n ralement un nombre de sens et des ensembles de synonymes distincts Afin de traiter de ces Inttp www crisco unicaen fr Presentation du
26. tions du TLFi et l objectif est d appliquer cette m thode la base des synonymes de l ATILE Par exemple tant donn les d finitions TLFi 2 en italiques et les synonymes 1 extraits des dictionnaires de la base de l ATILF pour le verbe achever la m thode propos e vise associer aux d finitions TLF1 le sous ensemble de synonymes appropri 2 1 Achever abattre aboutir accomplir aiguiser am liorer an antir assommer boucler cesser clore cl turer compl menter compl ter conclure conduire consommer continuer couronner estoquer exp dier ex cuter finir parachever parfaire perfectionner raser ruiner r aliser r ussir se taire terminer tuer 2 a Mettre la derni re main pour perfectionner accomplir boucler clore cl turer conclure perfectionner b Porter un coup mortel un animal d j atteint physiquement donner le coup de gr ce assommer couronner estoquer abattre an antir ex cuter ruiner tuer c Mener sa fin compl ter l action de accomplir cesser compl menter compl ter conduire finir parfaire Pour valuer notre m thode nous avons cr manuellement une ressource de r f rence Rela tivement cette ressource notre m thode affiche une F mesure de 0 602 lorsque la distinction prononominal non pronominal n est pas prise en compte et de 0 706 lorsqu elle l est L approche propos e pr sente des similarit s avec d une par

Download Pdf Manuals

image

Related Search

article articles article furniture articles of organization articles of incorporation articles of confederation article 15 article summarizer article 92 ucmj article 134 ucmj articles of organization llc article 92 article 134 article 2 of the constitution article 1 of the constitution articles of association article 19 articles in english article 80 article furniture reviews articles of incorporation ny articles of organization florida

Related Contents

The WaTer FrameWork DirecTive moDule  B E O L I N K C O N V E R T E R  MANUEL D`UTILISATION ARM-IO-LP  GSM/GPRS/GPS Tracker (LDW-101  SigViewer User Manual  CFturbo 10  Betriebsanleitung + Bedienungsanleitung  取付説明書  EPV762 MH User Manual - Elation Professional  Verilux VT04 User's Manual  

Copyright © All rights reserved.
Failed to retrieve file