Home
résolution en corpus d une ambiguïté sur de
Contents
1. tay e par l analyse d taill e de textes de domaines distincts qu on ne peut pas forc ment utiliser des connaissances linguistiques g n rales dans des textes sp cialis s et que les textes d un domaine donn peuvent poss der des propri t s de compl mentation distinctes de celles d un autre domaine Bourigault Fabre 2000 Fabre Bourigault 2001 Basili et al 1997 Basili et al 1999 Les m thodes bas es sur l acquisition de connaissances partir des seules donn es du corpus montrent cependant des limites Dans notre analyseur une des limites concerne certains ph nom nes rares par leur nombre d occurrences dans les corpus et non moins g n raux c est dire recens s dans des dictionnaires de langue g n rale qui chappent la strat gie endog ne bas e sur la notion de productivit Bourigault 1994 D o un nombre d ambigu t s de rattachement syntaxique mal r solues notamment au niveau des pr positions r gies par des verbes C est le cas en particulier de structures verbales dont on peut penser qu elles sont d crites dans des ressources lexicales g n rales et que leur fonctionnement est stable d un corpus l autre Partant de ce constat nous faisons l hypoth se que les performances de l outil peuvent tre am lior es gr ce l introduction dans l analyseur de ressources exog nes d crites sous la forme de donn es de sous cat gorisation verbale Nous p
2. introduction de ressources exog nes dans l analyseur sont prometteurs Cette phase exp rimentale en corpus doit pr sent s accompagner de la constitution d une ressource lexicale g n rale compl te pour les liste A et B et son apport dans Syntex doit tre valu sur diff rents corpus L tude a port sur la r solution de l ambigu it cat gorielle en contexte contigu verbe de nous travaillons actuellement la r solution de l ambigu t lorsque de se trouve distance du verbe la r solution de cette double ambigu t cat gorielle et structurelle il s agit de d terminer outre la nature de la relation quel recteur se rattache de s inscrit plus globalement dans une strat gie de rattachement pr positionnel visant marier harmonieusement proc dures d apprentissage endog ne et ressources exog nes Remerciements Je remercie vivement Didier Bourigault et C cile Fabre de leurs conseils et remarques au cours de la r daction de cet article R f rences A t Mokhtar S Chanod J P 1997 Subject and Object Dependency Extraction Using Finite State Tranducers Proceedings of ACL Workshop on Automatic Information Extraction and Building of Lexical Semantic Resources for NLP Applications Madrid A t Mokhtar S Chanod J P Roux C 2002 Robustness beyond shallowness incremental deep parsing Natural Language Engineering Vol 8 2 3 pp 121 144 B Dans lexemple d duire
3. s av re fondamentale pour notre outil En effet comme l ont montr A t Mokhtar Chanod 1997 la propagation des erreurs d tiquetage affaiblit nettement les performances de reconnaissance des objets directs et pr positionnels d un analyseur syntaxique En outre dans Syntex c est partir des r sultats de l analyse syntaxique que s op re l analyse distributionnelle qui vise faire merger des classes s mantiques de mots en fonction des contextes syntaxiques partag s Bourigault 2002 Et ces contextes sont pr cis ment d termin s par les relations syntaxiques tablies par l analyseur dans le cas pr sent il s agit de la relation syntaxique entre un verbe et de marqu e OBJ compl ment d objet direct ou PREP compl ment pr positionnel Notre strat gie de r solution ne s appuie pas sur les cas d j r solus par l tiqueteur nous effa ons ses choix et affectons l tiquette Prep de C est au cours de l analyse syntaxique que l ambigu t est r solue plus exactement la reconnaissance d un compl ment d objet direct ou pr positionnel nous permet aussi de r soudre l ambigu t cat gorielle Le probl me consiste donc tablir de mani re automatique la relation syntaxique entre un verbe et de quand pour une m me configuration syntaxique donn e la nature de cette relation est ambigu tableau 1 Configuration syntaxique Compl ment d o
4. 0 256 300 Gain exog ne 8 15 Tableau 6 Evaluation de la strat gie mixte L utilisation d informations exog nes am liore les performances de l analyseur 8 sur GEO 15 sur LM Globalement ces informations agissent sur les faiblesses de l endog ne et permettent l analyseur de prendre la bonne d cision lorsque la redondance lexico syntaxique seule ne le permettrait pas On note que l cart entre le taux de r ussite des deux corpus s est consid rablement r duit il tait de 9 lors de la premi re valuation 89 80 l issue de la deuxi me valuation il n est plus que de 2 97 95 L introduction de ressources exog nes dans l analyseur am liore le traitement des deux corpus valu s mais elle semble d autant plus l am liorer que la redondance lexicale du corpus est faible et le nombre de verbes pr sents dans les ressources exog nes est lev R gle 1 93 GEO 89 LM r gle 2 90 GEO 87 LM 1 Gain exog ne taux de r ussite Syntex 1 valuation taux de r ussite Syntex 2 valuation soit pour GEO 97 89 8 et pour LM 95 80 15 5 Liste A 115 verbes pour LM 75 verbes pour GEO Proc dures d apprentissage endog ne doubl es de ressources exog nes Le gain exog ne est majoritairement apport par les verbes de la liste A et on peut se demander au vu des ambigu t s r siduelles pour PREP quel gain repr sent
5. R CITAL 2003 Batz sur Mer 11 14 juin 2003 Proc dures d apprentissage endog ne doubl es de ressources exog nes r solution en corpus d une ambigu t sur de C cile Fr rot ERSS Universit Toulouse Le Mirail Maison de la Recherche 5 all es A Machado 31058 Toulouse Cedex frerot univ tlse2 fr Mots clefs Keywords analyse syntaxique automatique approche endog ne ressource exog ne approche mixte ambigu t cat gorielle automatic parsing endogenous strategy exogenous resources hybrid approach POS ambiguity R sum Abstract Dans cette tude nous nous int ressons l apport de ressources exog nes dans un analyseur syntaxique de corpus bas sur des proc dures d apprentissage endog ne Nous menons une exp rience en corpus sur un cas d ambigu t cat gorielle du fran ais forme de en position postverbale article ou pr position Apr s avoir pr sent et valu la strat gie endog ne nous en analysons les limites Nous discutons ensuite la perspective d une approche mixte combinant des informations acquises de mani re endog ne des informations exog nes donn es de sous cat gorisation verbale sur la pr position de Nous montrons alors comment un apport maximal de ressources exog nes am liore les performances de l analyseur 8 15 sur les deux corpus valu s Nous pr sentons les premiers r sultats d une approche mixte avant de conclure sur les ori
6. bes gr ce au rep rage de configurations syntaxiques non ambigu s pour la relation PREP Il utilise ensuite ces informations pour calculer des indices bas s sur la notion de productivit Bourigault Fabre 2000 Dans la phase de r solution des cas ambigus ces indices sont exploit s conjointement aux indices obtenus pour la relation OBJ informations acquises gr ce au module de recherche des objets directs Nous illustrons cette strat gie dans le tableau 2 1 Cas ambigus Vb de les NomP OBJ ou PREP parler des sens PREP r aliser des exp riences OBJ 2 Cas non ambigus Vb de NomPluriel PREP Vb de Detindef Nom indice PREP parler de formes parler d une d sint gration 3 Cas non ambigus OBJ Vb Det Nom indice OBJ r aliser une action r aliser les figures r aliser un triage 4 Indices OBJ parler 0 OBJ r aliser 3 PREP parler 2 PREP r aliser 0 5 D cision parler des sens gt PREP r aliser des exp riences gt OBJ Tableau 2 Strat gie endog ne Les donn es se lisent ainsi pour r soudre les cas ambigus 1 analyseur s appuie sur la r solution de cas non ambigus pour PREP et OBJ 2 3 il calcule ensuite des indices en faveur de la relation PREP ou OBJ et les exploite conjointement dans la phase de r solution des cas ambigus 4 pour prendre une d cision 5 3 2 Evaluation L valuation porte sur deux corpus un ou
7. bjet direct relation OBJ Compl ment pr positionnel relation PREP Vb Prep Det NomP cr er des climats douter des ph nom nes Vb Prep Det NomsS faire de la morphologie provenir d une source Vb Prep AdjP NomP manifester de belles intentions profiter de diverses opportunit s Tableau 1 Configurations syntaxiques ambigu s 1 Pr cisons que dans l analyseur nous ne faisons aucune distinction entre groupes pr positionnels GP arguments ou circonstants Quel que soit le statut du GP nous cherchons le rattacher au verbe 2 Exemples le syst me donne des r sultats satisfaisants donne Preplde Det le r sultats les sp cialistes doutent de la nature liquide du magma doutent Preplde Det la nature Vb verbe Det d terminant NomP nom pluriel Noms nom singulier AdjP adjectif pluriel C cile Fr rot 3 Strat gie endog ne pr sentation et valuation 3 1 Illustration de la strat gie Le principe de l apprentissage endog ne est classiquement utilis dans l analyseur pour r soudre des cas d ambigu t de rattachement syntaxique adjectival pr positionnel Ici ce principe est mis en uvre non pour lever une ambigu t de rattachement mais pour d terminer la nature de la relation syntaxique OBJ ou PREP tablir entre un verbe et de en contexte contigu La proc dure est la suivante l analyseur acquiert des informations sur la compl mentation des ver
8. ctes de la conf rence TALN 215 224 Giguet E Vergne J 1997 From Part of Speech Tagging to Memory based Deep Syntactic Analysis Proceedings of the International Workshop on Parsing Technologies MIT Boston 77 88 Habert B Nazarenko A Zweigenbaum P 1998 Extending an Existing Specialized Semantic Lexicon Proceedings of Coling ACL 98 Granada 663 668 Hamon T Nazarenko A Gros C 1998 A step towards the detection of semantic variants of terms in technical documents Proceedings of Coling ACL 98 498 504 Leconte J 1998 Le cat goriseur Brill14 JL5 Winbrill 0 3 Morin E 1998 Prom th e un outil d aide l acquisition de relations s mantiques entre termes Actes de la conf rence TALN Paris Silberztein M 2000 Manuel d utilisation d Intex 4 12
9. des prgp ph nom nes analys s des ogy conclusions int ressantes le rattachement de des og au verbe d duire n est pas pris en charge par l analyseur 14 Exemples joindre par des segments de droite des osy points carr s armer le cours d eau de prep particules tranchantes C cile Fr rot Basili R Pazienza M T Vindigni M 1997 Corpus driven Unsupervised Learning of Verb Subcategorization Frames Actes du 5 congr s AI IA 97 M Lenzerini ed Lecture Notes in Artificial Intelligence 1321 pp 159 170 Basili R Pazienza M T Vindigni M 1999 Adaptative Parsing and Lexical Learning Actes de VEXTAL 99 Venise Bourigault D 1994 Lexter un logiciel d extraction de terminologie Application l acquisition de connaissances partir de textes Th se de l Ecole des Hautes Etudes en Sciences Sociales Paris Bourigault D Fabre C 2000 Approche linguistique pour l analyse syntaxique de corpus Cahiers de grammaire Vol 25 pp 131 151 Bourigault D 2002 Upery un outil d analyse distributionnelle tendue pour la construction d ontologies partir de corpus Actes de la conf rence TALN Nancy 75 84 Fabre C Bourigault D 2001 Linguistic clues for corpus based acquisition of lexical dependencies Actes de Corpus Linguistics Conference Lancaster 176 184 Fabre C Fr rot C 2002 Groupes pr positionnels arguments ou circonstants vers un rep rage automatique en corpus A
10. e en contexte non ambigu l indice endog ne pour PREP est donc nul Citons dans GEO les verbes affluer de d river de douter de profiter de r sulter de se d solidariser de se distinguer de et dans Lorsque ces cas ne sont pas ou que partiellement r solus par l analyseur les r gles pour la r solution de l ambigu t cat gorielle sur de s appliquent tort 7 Syntex choisit par d faut la relation OBJ C cile Fr rot LM les verbes discuter de d pendre de p tir de regorger de b n ficier de C est ici la fr quence d apparition des verbes qui est responsable de l chec et plus pr cis ment l absence de redondance lexico syntaxique en contexte non ambigu sachant qu un cas ambigu a d autant plus de chance d tre r solu qu il a t rep r dans un contexte verbe relation syntaxique non ambigu Des erreurs d analyse syntaxique expliquent galement les r sultats Ces erreurs se propagent dans le calcul des indices endog nes et les gonflent artificiellement c est le cas de certains sujets invers s analys s comme des objets directs qui faussent l indice OBJ Des cas de conflit indiciel se pr sentent aussi deux indices comportent une m me valeur non nulle donc non discriminante ce conflit est la fois imputable au manque de redondance lexico syntaxique et aux erreurs d analyse La redondance lexico syntaxique des deux corpus semble une piste int ressante e
11. ensons qu une approche endog ne est n cessaire pour r soudre les sp cificit s du corpus trait mais qu une telle approche pr sente n anmoins des limites et doit tre compl t e par des ressources exog nes Les approches mixtes d j test es concernent presque exclusivement l acquisition de liens s mantiques et exploitent majoritairement des ressources existantes sp cialis es Morin 1998 Habert et al 1998 beaucoup plus rarement des ressources g n rales Basili et al 1997 Hamon et al 1998 C est ici dans le cadre d une analyse syntaxique automatique de corpus que nous souhaitons tudier la pertinence d une approche mixte exploitant des ressources lexicales g n rales Nous pr sentons un premier travail sur une mise en uvre de cette approche Nous menons une exp rience en corpus sur une ambigu t cat gorielle du fran ais concernant la forme de en position postverbale article ou pr position Apr s avoir pr sent et valu la strat gie endog ne nous en analysons les limites Nous montrons ensuite comment l apport d une ressource lexicale g n rale listant les verbes sous cat gorisant la pr position de am liore les performances de l analyseur Pour cette exp rience nous construisons cette ressource partir des corpus soumis l valuation Ce choix se justifie par l objectif m me de l tude qui vise mesurer l apport maximal d une ressource exog ne dans notre analyseu
12. entations futures du travail This paper addresses the issue of the contribution of exogenous resources within the framework of a parser based on endogenous techniques We discuss how exogenous resources could combine with endogenous techniques in the context of a POS French ambiguity the word de determiner or preposition We present and evaluate our endogenous strategy on cases where verbs are adjacent to de We highlight the limits of such a strategy and show how exogenous resources improve the parser output 8 15 on the corpus evaluated Finally we present the first results of the combined strategy and conclude on future work C cile Fr rot 1 Introduction Notre cadre de travail est la r alisation de l outil d analyse syntaxique de corpus Syntex Bourigault Fabre 2000 dont l application principale est la construction de ressources lexicales sp cialis es partir de corpus terminologies ontologies lexiques pour la traduction La sp cificit majeure de l analyseur est d tre dot de proc dures d apprentissage endog ne Bourigault 1994 qui lui permettent d acqu rir sur chaque nouveau corpus les informations n cessaires la r solution des ambigu t s de rattachement syntaxique Ce choix de ne fournir l analyseur aucune information s mantique ni donn e de sous cat gorisation est li l hypoth se forte sur l idiosyncrasie des textes sp cialis s Il s explique par la conviction
13. erait un traitement diff renci des listes B1 et B2 Les ambigu t s r siduelles concernent le cas des verbes double compl mentation compl ment d objet direct et compl ment pr positionnel Or en l tat l analyseur ne traite pas le cas de de lorsqu il se trouve distance du verbe Il semble que seule une analyse de la construction verbale dans son ensemble permettra de r soudre correctement les formes ambigu s de contigu s et distance du verbe Les ambigu t s r siduelles concernent aussi des groupes pr positionnels GP qui entretiennent avec le verbe une relation de nature circonstancielle et non argumentale L utilisation de donn es de sous cat gorisation listant la nature syntaxique des arguments ne permettra pas de lever l ambiguit On citera l exemple des compl ments de mani re fonctionner du premier coup s appr cier de diverses mani res condamner de la fa on la plus ferme et groupes adverbiaux arriver de surcro t dans un climat tendu incorporer d office ce logiciel attester de fait leur existence La r solution de ces cas implique de mettre en uvre des m thodes de traitement compl mentaires Nous envisageons ce titre de poursuivre le travail entrepris sur le rep rage automatique en corpus de GP arguments ou circonstants Fabre Fr rot 2002 pour isoler de mani re automatique et retyper ces GP au statut circonstanciel 5 Conclusions et perspectives Ces premiers r sultats sur l
14. r Pour cela il tait donc fondamental de nous mettre en situation d apport maximal c est dire de disposer pour les deux corpus valu s de l ensemble de ces verbes Proc dures d apprentissage endog ne doubl es de ressources exog nes 2 Etude de cas sur une ambigu t cat gorielle du fran ais Notre tude porte sur une ambigu t cat gorielle du fran ais concernant la forme de et les ambigu t s port es par les formes du et des Cette ambigu t est particuli rement rebelle l tiquetage morpho syntaxique lorsque de se trouve en position postverbale Leconte 1998 Silberztein 2000 Les formes du des de peuvent alors correspondre un article il a fourni des r sultats int ressants ou la pr position de il doute des conclusions Cette ambigu t est g n ralement trait e au cours de l tiquetage morpho syntaxique via l utilisation de ressources lexicales c est le cas en particulier de A t Mokhtar et al 2002 qui exploitent des donn es de sous cat gorisation verbale pour lever l ambigu t Un traitement post tiquetage est rarement envisag m me s il semble s imposer comme le constatent Giguet Vergne 1997 qui utilisent des informations sur les sujets et objets des verbes pour r soudre l ambiguit Dans le cadre de notre analyseur syntaxique nous sommes confront s cette ambigu t qui n est que partiellement lev e par l tiqueteur Or sa r solution
15. rot Cet ordre de priorit se fonde sur la performance respective des r gles 1 et 2 Les cas r solus par ces r gles constituent les contextes d acquisition partir desquels sont calcul s les indices endog nes utilis s lors de la deuxi me passe Afin de mieux contr ler les donn es d acquisition erron es nous envisageons d affecter une valeur de confiance chaque r gle en fonction de sa fiabilit et de doter galement les contextes d acquisition pour la relation OBJ d une valeur de confiance e Deuxi me passe r solution de cas ambigus La strat gie de r solution repose sur un calcul de scores Les listes B1 et B2 verbes transitifs directs et ou sous cat gorisant la pr position de constituent un indice exog ne en faveur de la relation PREP exploit conjointement aux indices endog nes L id e mise en uvre est d exploiter prioritairement les donn es bas es sur les indices endog nes et lorsque la valeur du score est jug e insuffisante de faire intervenir l information exog ne 4 3 R sultats Nous pr sentons dans le tableau 6 les r sultats de la strat gie mixte Corpus GEO LM Syntex OBJ PREP Total OBJ PREP Total Correct OBJ 622 2 624 549 1 550 PREP 23 203 226 44 256 300 Total 645 205 850 593 257 850 Taux de r ussite 97 95 Syntex 622 203 850 549 256 850 OBJ PREP OBJ PREP 100 90 100 85 622 624 203 226 549 55
16. strons la lecture des donn es sur le corpus GEO sur 624 cas OBJ l analyseur en a reconnu 618 sur 226 cas PREP il en a reconnu 142 Le taux de r ussite mesure le rapport entre le nombre de cas correctement analys s par Syntex 618 142 et le nombre de cas valid s 624 226 Nous d taillons ce taux pour les deux relations OBJ et PREP et le comparons une strat gie de base qui choisit la relation OBJ pour l ensemble des cas sur 850 cas valid s la strat gie de base prend donc la bonne d cision dans 624 cas Cette comparaison nous permet de mieux appr hender le gain de la strat gie endog ne diff rence entre le taux de r ussite de Syntex et celui de la strat gie de base 89 73 16 3 3 Analyse des r sultats Globalement les r sultats attestent du gain apport par l apprentissage endog ne par rapport une strat gie de base qui choisirait la relation OBJ dans chaque cas Sur l ensemble des donn es on retiendra le taux de r ussite pour la relation PREP qui semble t moigner des limites de la strat gie endog ne GEO 63 LM 44 C est cette relation que nous allons nous int resser en cherchant identifier les causes d chec Ces causes concernent notamment l absence ou le manque d indices en corpus C est le cas par exemple de verbes qui sous cat gorisent la pr position de et sont d crits dans des ressources lexicales g n rales Aucune occurrence de ces verbes n a t trouv
17. t tre l apport maximal d une ressource lexicale g n rale Pour cela il tait donc indispensable de nous mettre en situation d apport maximal et de disposer pour les deux corpus valu s de l ensemble de ces verbes Les listes constitu es sont les suivantes verbes qui sous cat gorisent la pr position de et ne sont pas transitifs directs liste A ii verbes sous cat gorisant la pr position de ou transitifs directs liste B1 iii verbes double compl mentation liste B2 Nous d taillons ces listes tableaux 4 5 GEO LM arriver de d pendre d river douter merger abuser de b n ficier d couler d battre d pendre faire partie jaillir parler pr juger d missionner discuter maner faire tat profiter provenir rendre compte venir faire figure grouiller jouir mourir p tir Tableau 4 Liste A 8 9 Indices oppos s c est dire l un en faveur de PREP l autre de OBJ Les listes comprennent des formes verbales complexes avoir besoin faire partie rendre compte Ce choix est li la concat nation de certaines s quences Verbe Nom lors de l tiquetage morphosyntaxique Proc dures d apprentissage endog ne doubl es de ressources exog nes GEO Verbes Transitifs directs dater des ph nom nes disposer des feuillets dater de cette poque disposer de donn es Sous ca
18. t gcorisant de Transitifs directs relever des erreurs d passer les limites LM Sous cat sorisant de relever d une grande qualit d passer de quelques m tres Liste B1 verbes transitifs directs ou sous cat gorisant de Verbes A double compl mentation A double compl mentation imbiber le premier d eau enrober de calcite des mat riaux prot ger du ruissellement des portions de la formation accuser des hommes de corruption remplir d humanit ce monstre froid faire de ce fait un dossier d actualit Liste B2 verbes double compl mentation directe et pr positionnelle Tableau 5 Listes B1 et B2 La liste A est destin e tre utilis e dans l analyseur lors de la premi re passe r solution de cas d tect s comme non ambigus Ces verbes m me s ils entrent en corpus dans une configuration syntaxique ambigu ne sont pas transitifs directs la forme de correspond donc la pr position Les verbes de la liste B1 entrent dans une construction transitive directe ou pr positionnelle qui influe directement sur leur sens de est dans ce cas une forme ambigu disposer derep donn es disposer des os feuillets Ce qui est galement le cas des verbes de la liste B2 la forme de qui suit le verbe correspond l article accuser des osyn hommes de corruption ou la pr position enrober depre calcite des mat riaux Les verbes de B1 et B2 sont actuellemen
19. t regroup s dans une seule et m me liste et font l objet d un traitement indiff renci dans l analyseur Ils sont utilis s lors de la deuxi me passe r solution de cas ambigus et constituent un indice exog ne pour PREP destin tre combin aux indices endog nes 4 2 R solution de l ambigu t Nous d crivons la proc dure de r solution de l ambigu t en contexte contigu verbe de e Premi re passe r solution de cas d tect s comme non ambigus L analyseur se base par ordre de priorit d croissante sur la liste A Si le verbe est dans la liste alors l analyseur choisit la relation PREP entre le verbe et de une relation syntaxique OBJ d j tablie par l analyseur On fait l hypoth se qu il s agit de verbes double compl mentation et que si l analyseur a rattach un compl ment d objet direct au verbe alors la forme de correspond la pr position L objet direct peut tre r alis sous la forme d un clitique une crise climatique qui le os d gage de prer tout manteau d alt ration d un pronom relatif c est l interpr tation qu og on a donn des prep mandelles ou d un nom distance du verbe exclure de prep l tude des socles les mont es tardives os faisant du pre Br sil aujourd hui au septi me rang le quatri me producteur mondial 085 r gle 1 les configurations syntaxiques non ambigu s pour la relation PREP r gle 2 C cile Fr
20. vrage de g omorphologie GEO 243 000 mots et le journal Le Monde LM 250 000 mots nous avons valu 850 cas ambigus dans chaque corpus L valuation exclut des cas entrant dans une configuration tiquet e Verbe Prep de La productivit est d termin e par le nombre de r gis diff rents avec lesquels un couple recteur pr position se combine dans le corpus 3 Le corpus ann e 1998 du journal Le Monde comportait initialement environ 700 000 mots Nous avons souhait travailler sur un nombre de mots quivalent pour les deux corpus et n avons donc exploit qu une partie de LM Proc dures d apprentissage endog ne doubl es de ressources exog nes mais qui ne rel vent pas de l ambigui t tels les sujets invers s dans ces montagnes apparaissent des rosions ou les structures causatives il a fait chuter des taux dont le traitement d pend d un autre module Les r sultats de l valuation apparaissent dans le tableau 3 Corpus GEO LM Syntex OBJ PREP Total OBJ PREP Total Correct OBJ 618 6 624 547 3 550 PREP 84 142 226 167 133 300 Total 702 148 850 714 136 850 Taux de r ussite GEO LM 89 80 Syntex 618 142 850 547 133 850 OBJ PREP OBJ PREP 99 63 99 44 618 624 142 226 547 550 133 300 Strat gie de base 73 65 OBJ 624 850 550 850 Gain endog ne 16 15 Tableau 3 Evaluation de la strat gie endog ne Illu
21. xplorer pour analyser le taux de r ussite PREP contrast entre GEO et LM taux sup rieur d environ 20 sur GEO 63 par rapport LM 44 Comme nous l avons d j pr cis l apprentissage endog ne est bas sur la notion de productivit et sa performance repose sur la redondance des structures lexico syntaxiques Si le taux de r ussite PREP est meilleur dans GEO que dans LM on peut avancer l id e que la redondance lexico syntaxique est plus forte dans GEO que dans LM Et qu elle est plus forte en contexte non ambigu Cette redondance peut s expliquer par l homog n it th matique de GEO g omorphologie face l h t rog n it th matique de LM politique conomie culture sciences et techniques et par leurs vocabulaires respectifs lexique verbal plus dense dans LM que dans GEO 4 Introduction de ressources exog nes dans l analyseur 4 1 Donn es de sous cat gorisation verbale Ce constat sur les limites du tout endog ne nous am ne envisager une strat gie alternative via l utilisation dans l analyseur d une ressource lexicale g n rale listant l ensemble des verbes sous cat gorisant la pr position de A d faut d avoir achev la constitution exhaustive de cette ressource nous constituons les donn es partir des corpus utilis s pour l exp rience GEO et LM Cette d marche se justifie par l objectif m me de notre tude nous cherchons ici mesurer quel peu
Download Pdf Manuals
Related Search
Related Contents
Sharp MXLC13 Trust Football edition - Nederland Manual_A2204_17231050 POLSKI ҚАЗАҚ РУССКИЙ DEUTSCH ENGLISH Monte Carlo Fan Company 3TSR52XXD User's Manual Leica TPS800 Series Manual del Usuario Samsung ST66 User Manual User Manual FavorPrep Tissue Total RNA Mini Kit Broward ASQ Online User Guide - Early Learning Coalition of Copyright © All rights reserved.
Failed to retrieve file