Home

Télécharger la version PDF - Les Enjeux de l`information et de la

image

Contents

1. la coordination est un ph nom ne syntaxiquement ambigu susceptible de g n rer des solutions parasites lors du processus d analyse Il s agit donc de d velopper un mod le d analyse permettant une bonne couverture linguistique du ph nom ne tout en limitant au mieux le nombre de solutions parasites Pour ces diff rentes raisons ce sujet de recherche convenait parfaitement aux objectifs et int r ts communs des deux laboratoires partenaires Nous allons tout d abord pr senter l tude linguistique du ph nom ne r alis e sur corpus Compte tenu de cette tude un mod le d analyse syntaxique g n ral est propos Nous d taillons pour conclure l implantation r alis e dans un syst me d di l analyse automatique par des grammaires LFG ainsi que l valuation sur corpus de cette implantation TUDE LINGUISTIQUE DE LA COORDINATION Corpus d tude L tude linguistique nous tudions tout particuli rement les coordinations par et et ou du ph nom ne repose sur l examen de deux corpus en particulier e un corpus technique qui est un manuel d utilisation de tracteurs Ce corpus a servi de r f rence dans le cadre du projet de d veloppement de grammaires auquel nous sommes rattach e Il s agit d un corpus de petite taille 549 phrases ou titres 6651 mots 12 11 mots par phrase en moyenne dont nous avons extrait les phrases contenant des coordinations 124 phrases ou titres 2344 mots 18 9 mots par phras
2. noms rares comme est une marque n gative NOM RARE L analyse optimale sera alors la premi re Par contre un exemple comme Il faut s orienter vers l est ne sera pas rejet car est ne peut tre qu un nom dans ce contexte syntaxique et comme c est l unique possibilit syntaxique l analyse est correctement retrouv e malgr la marque n gative Nous avons utilis cette technique pour le classement des structures coordonn es produites par notre mod le d analyse en implantant diverses heuristiques de filtrage Le premier principe est d affecter des poids en fonction du parall lisme des constructions e Lorsque des propositions compl tes coordonn es ont toutes un sujet exprim ou au contraire toutes un sujet omis nous affectons un poids lev e Lorsque toutes les pr positions sont r p t es et identiques dans un syntagme pr positionnel coordonn nous affectons un poids lev la construction e Lorsque les d terminants de chaque syntagme nominal coordonn sont de m me type d fini ind fini possessif etc nous affectons un poids lev la construction e Nous affectons un poids faible aux syntagmes nominaux coordonn s introduits par ou de Cela exprime le fait que les pr positions sont g n ralement r p t es mais que certains cas rares pr sentent une distribution de ces pr positions sur le groupe nominal coordonn e Lorsque tous les d terminants sont les m mes ou tous omis dans
3. C 3 Les r gles de cette forme entrent dans le cadre des grammaires hors contexte et sont adopt es dans la plupart des formalismes syntagmatiques actuels Ce mod le est utilis dans un grand nombre de formalismes syntaxiques pour le TALN et reste g n ral Nous proposons de surcro t d utiliser les contraintes isol es dans l tude linguistique pour restreindre l application des r gles de coordination en fonction du contexte et de lexicaliser un ensemble d expressions fig es pr positions coordonn es complexes terminologie IMPLANTATION Nous d crivons l implantation r alis e dans le syst me XLE Xerox Linguistic Environment Le processus d analyse d une phrase par XLE est le suivant e la phrase est tout d abord segment e en unit s lexicales e chaque unit lexicale subit une analyse morphologique e le r sultat de l analyse morphologique est l entr e du processus d analyse syntaxique qui combine r gles de grammaire et insertion lexicale partir du lexique LFG e la phase d analyse syntaxique proprement parler est r alis e par l analyseur et fournit comme r sultat les structures LFG c structure f structure associ es la phrase Analyse pr syntaxique La segmentation de la phrase en unit s lexicales est r alis par un transducteur tats finis Ait 97 Karttunen 94 Ce transducteur d coupe la cha ne d entr e en une s quence d unit s lexicales qui peuvent correspo
4. ce genre d exemple ne pose pas de probl mes en ce qui concerne les structures fonctionnelles En effet on peut appliquer la m ta r gle de coordination pour des l ments de cat gories diff rentes ayant la m me fonction et s attachant un 4 Nous ne d taillons pas ici l implantation de certains cas de coordination elliptiques gt Page 6 CAROLINE BRUN Coordination et analyse automatique du fran ais crit m me n ud dans la structure de constituants Le probl me se situe plut t dans la structure de constituants quelle est la cat gorie du n ud qui domine une la structure coordonn e L utilisation de cat gories sous sp cifi es nous semble ad quate Par exemple XP peut tre d finie comme une cat gorie g n rique qui se r crit en une disjonction de cat gories XP gt SA SP SN On pourra ainsi coordonner XP avec elle m me et obtenir des coordinations de type SA Conj SP la condition que SA et SP aient les m me fonctions On rel ve aussi certains exemples o les l ments coordonn s ont galement des fonctions diff rentes au sens LFG du terme 10 Ils attendent ma mort et que l affaire soit r gl e Dans le lexique LFG un verbe comme attendre poss de plusieurs sch mas argumentaux en particulier il r git soit une compl tive fonction COMP soit un compl ment d objet direct nominal fonction OBJ Cet exemple ne peut donc pas recevoir d analyse car les argume
5. Coordination et analyse automatique du fran ais crit dans le cadre de la Grammaire Lexicale Fonctionnelle Caroline Brun Caroline Brun est post doctorante au Centre de recherche Xerox Europe de Grenoble Elle a y effectu une th se sur l analyse automatique de la coordination dans le formalisme LFG Lexical Functional Grammar dans le cadre d une convention Cifre avec le laboratoire Gresec Cristal Elle travaille aujourd hui sur la d sambigu sation s mantique automatique et la g n ration automatique de documents multilingues Plan Introduction et cadre de travail tude linguistique de la coordination Mod lisation Implantation Conclusion R f rences bibliographiques INTRODUCTION ET CADRE DE TRAVAIL Le travail de th se Brun98a que nous proposons de r sumer dans cet article a t effectu dans le cadre d une collaboration entre le laboratoire Gresec quipe Cristal de l universit Stendhal Grenoble 3 et l quipe MLTT du centre de recherche Xerox Europe XRCE L activit de l quipe Cristal est fond e sur le traitement automatique de la langue crite TALN essentiellement le fran ais Le but poursuivi est la conception et la r alisation d analyseurs et de g n rateurs large couverture linguistique donc capables de supporter des affirmations en vraie grandeur Un autre ensemble de recherches est constitu par l laboration et l implantation d un syst me de traitement des connaissances l
6. aintes et indices mais en isolerons quelques exemples Ainsi si a priori tout syntagme est susceptible de se coordonner avec un syntagme de m me cat gorie ou de cat gorie diff rente certains cas sont soumis des restrictions Par exemple dans le contexte de la coordination on doit n cessairement reprendre une conjonction de subordination par elle m me ou par la conjonction que 2 Lorsque le d marreur est mis sous tension et l alimentation du thermostart est maintenue Cela indique que le d marreur est engag et l alimentation du thermostart est maintenue La reprise d une locution pr positive par elle m me ou par la pr position qui lui correspond ou de est obligatoire 3 Gr ce sa conception unique et sa taille r duite 4 Gr ce sa conception unique et sa taille r duite De la m me fa on les pronoms clitiques et n gations ne se distribuent pas sur les verbes finis 5 Vous pouvez les num riser ou copier 6 Il ne num rise ou copie pas La pr position entre s lectionne obligatoirement un compl ment coordonn ou un compl ment pluriel 7 Entre les villes et les campagnes 8 Entre le pays De plus un certain nombre d indices qui ne constituent cependant pas des contraintes fortes sont observables en particulier en ce qui concerne le parall lisme des structures coordonn es Ainsi dans la plupart des cas les pr positions et d
7. bal compl ment d objet etc Dans la mesure o la coordination d l ments de cat gories identiques et fonctions diff rentes semble proscrite il nous semble qu un des crit res permettant de v rifier si une coordination est grammaticale est l identit fonctionnelle des l ments coordonn s ce qui avait largement t constat dans la litt rature sur le sujet gt Page 2 CAROLINE BRUN Coordination et analyse automatique du fran ais crit Nous citerons entre autres Dik72 Une coordination est une construction de deux membres ou plus qui ont des fonctions grammaticales semblables et qui sont li s ensemble au m me niveau de hi rarchie structurale par le biais d un connecteur Il s agira donc de rejeter les coordinations de fonctions diff rentes mais d admettre sous certaines contraintes et en fonction de certains indices syntaxiques les coordinations d l ments de fonctions identiques Une tude quantitative des corpus sur les diff rents types de coordinations montre n anmoins que la majorit des ph nom nes observ s 94 sont des coordinations d l ments de m me cat gorie syntaxique Indices syntaxiques et contraintes L examen de corpus a galement permis d isoler un ensemble de contraintes grammaticales fortes s appliquant la coordination ainsi qu un ensemble d indices concernant les fr quences de certains ph nom nes Nous ne d taillerons pas ici l ensemble de ces contr
8. couverture linguistique et surg n ration soit n cessaire ce qui nous a conduit la d finition d un mod le g n ral Mod le g n ral L tude linguistique expos e pr c demment a conduit plusieurs conclusions que nous reprenons ici e Toutes ou presque toutes les cat gories syntaxiques sont susceptibles d tre coordonn es entre elles mais on trouve des coordinations d l ments de natures diff rentes Les coordinations d l ments de m mes cat gories sont les plus fr quentes e Les l ments coordonn s ont la m me fonction grammaticale et attendent des arguments de m me fonction e Un ensemble de contraintes du type restriction sur les cat gories contraintes gt Page 4 CAROLINE BRUN Coordination et analyse automatique du fran ais crit d accords contraintes sur la port e d l ments distribu s contraintes sur les l ments lid s etc s applique sur les l ments coordonn s et permet de d limiter la port e de la coordination e D une mani re g n rale un certain degr de parall lisme entre les l ments coordonn s est requis Nous consid rerons que la coordination est une op ration de type m tagrammatical reliant des l ments de m me type avec distribution des l ments voisins qu ils soient arguments ou pr dicats Afin d engendrer la structure ad quate il est n cessaire que la grammaire puisse contenir des r gles de la forme C gt C Conj
9. e en moyenne e Un corpus extrait du journal Lib ration 1988 qui tait galement notre disposition en ligne Nous avons jug int ressant d examiner ce corpus car la langue employ e est non restreinte et plus riche que celle du corpus technique notre but tant d crire le ph nom ne le plus g n ralement possible Il s agit d un corpus de taille importante 59987 phrases et titres 1358797 mots 22 65 mots par phrase en moyenne dont nous avons extrait les phrases contenant des coordinations 17262 phrases ou titres 510120 mots 29 55 mots par phrase en moyenne Analyse g n rale La premi re observation que l on peut faire lorsque l on tudie la coordination est qu il s agit d un ph nom ne particuli rement fr quent dans n importe quel type de corpus titre indicatif la conjonction de coordination et serait un des dix mots les plus fr quents de la langue fran aise Grevisse 911 On constate aussi que celle ci s applique tous les niveaux de la phrase c est dire qu elle peut relier deux ou plusieurs propositions P mais aussi syntagmes nominaux SN des syntagmes pr positionnels SP des syntagmes adjectivaux SA etc Nous avons galement remarqu que des l ments de nature diff rente SP amp SA SN amp SP peuvent tre coordonn s Cependant les fonctions grammaticales des l ments coordonn s sont les m mes sujet attribut du sujet modifieur du syntagme ver
10. e se r p tent devant chaque terme de la coordination alors que les autres pr positions ont tendance ne pas se r p ter Les d terminants se r p tent le plus souvent sur la coordination de groupe nominaux Lorsque des propositions sont coordonn es le sujet est n cessairement exprim ou n cessairement omis dans chacune d elles Si plusieurs structures coordonn es imbriqu es mettent en jeu syntagmes pr positionnels et nominaux on 2 Le signe indique qu un exemple est incorrect gt Page 3 CAROLINE BRUN Coordination et analyse automatique du fran ais crit observe la plupart du temps une similitude de la nature des d terminants d fini ind fini possessif etc ou des pr positions MOD LISATION tat de l art La coordination a fait l objet de nombreux travaux que ce soit dans le cadre de th ories linguistiques ou de d veloppements de syst mes de TALN De l tude du traitement de la coordination dans des formalismes comme la grammaire syntagmatique g n ralis e Chomsky 57 les grammaires cat gorielles Steedman85 les formalismes d unification Gazard et al 85 Pollard et Sag 94 ou encore certains mod les informatiques comme les ATN Woods 70 les grammaires logiques Dahl et al 95 les grammaires dynamiques Milward 94 nous pouvons d gager quatre grands types de traitements e Les traitements par r duction qui r alisent un r tablissement d ellipse pouss s au ma
11. i des textes en langue naturelle L quipe de MLTT cr e des outils de base pour l analyse linguistique multilingue tels que analyseurs morphologiques tiqueteurs morpho syntaxiques plateformes pour le parsage analyse syntaxique automatique et la g n ration ou encore outils d analyse de corpus Ces outils sont utilis s pour d crire diverses langues ainsi que les relations d une langue l autre Les projets en cours incluent des analyseurs syntaxiques tats finis pour le fran ais et l allemand une grammaire LFG Lexical Functional Grammar du fran ais ainsi que des projets en recherche documentaire multilingue en g n ration et en traduction Ce travail est rattach au d veloppement d une grammaire LFG du fran ais pour l analyse et la g n ration de texte dans le contexte d un projet plus vaste le projet ParGram 1 Butt et al 99 visant d velopper des grammaires LFG les plus parall les possibles pour le fran ais l anglais et l allemand l application vis e tant la traduction automatique entre ces trois langues 1 http www parc xerox com istl groups nltt pargram CAROLINE BRUN Coordination et analyse automatique du fran ais crit Dans ce contexte nous tudions une construction particuli re la coordination La coordination est un ph nom ne complexe analyser quel que soit le mod le choisi mais est aussi tr s largement repr sent e dans les corpus de toutes natures De plus
12. nalyses valides du fait de l application des heuristiques CONCLUSION Dans cet article nous avons tout d abord d crit une tude linguistique sur corpus de la coordination qui nous a permis d envisager ses diff rents aspects types de cat gories susceptibles de se coordonner cas particuliers contraintes et fr quence dans les corpus Il r sulte que compte tenu d un ensemble de contraintes les l ments linguistiques de m me fonction syntaxique peuvent se coordonner Cette tude ainsi que l examen de diff rentes propositions de traitements dans des formalismes pour le TALN a pu faire appara tre qu un traitement satisfaisant doit r aliser un compromis entre couverture linguistique et limitation des solutions parasites C est pour cela que le mod le g n ral que nous proposons traite les cas les plus fr quents tout en tenant compte du contexte linguistique Ensuite l implantation du mod le dans un syst me de d veloppement de grammaires LFG a t d crite Nous avons alors valid notre approche par des analyses de corpus techniques En ce qui concerne la couverture syntaxique nous pouvons analyser les constructions les plus fr quentes ainsi que certains cas particuliers Le syst me d analyse syntaxique que nous avons utilis est coupl une proc dure permettant d exprimer la pr f rence sur les analyses Nous avons utilis ce m canisme qui a donn de bons r sultats sur les corpus et qu il serait int re
13. nce et qui sont des marques positives ou n gatives Lorsque les diff rentes analyses d une phrase sont produites par le syst me la ou les structure s pr f r e s est celle dont la o structure contient le moins de marques n gatives Si l on obtient plusieurs candidats l issue de ce premier filtrage ils sont nouveau filtr s en fonction du plus grand nombre de marques positives Prenons un exemple simple mettant en jeu les probl mes d ambigu t lexicale priori un exemple comme Le d faut est corrig 5 Chanod 93 La description informatique des m canismes langagiers n est pas neutre Elle produit ses propres interpr tations hors du champ d tude de la linguistique traditionnelle Les descriptions informatiques interagissent et produisent de nombreux effets de bords ou analyses ind sirables Le parasitisme computationnel se manifeste par la production d analyses ind sirables inappropri es r sultant de l application de r gles tout fait fond es linguistiquement par ailleurs gt Page 7 CAROLINE BRUN Coordination et analyse automatique du fran ais crit obtient deux analyses selon que est est consid r comme un verbe ou comme un nom modifieur de d faut ce qui est syntaxiquement possible 12 P SN Le d faut SV AUX est V corrig 13 SN Le d faut NMOD est SA corrig La syst me de pr f rence permet de s lectionner la premi re analyse en affectant aux
14. ndre une forme fl chie une marque de ponctuation etc Les expressions mots multiples sont des suites de mots regroup s en unit s lexicales par exemple un adverbe nom comme a priori est compos de plusieurs mots mais forme une unit lexicale La deuxi me tape de la pr syntaxe est l analyse morphologique des unit s lexicales produites par la segmentation de la phrase Cette tape est aussi r alis e par un transducteur qui relie la forme fl chie la forme lexicale et vice versa La forme lexicale est une s quence comprenant la repr sentation canonique du mot le lemme un ensemble d tiquettes repr sentant le comportement morphologique du mot et sa cat gorie syntaxique Nous lexicalisons un ensemble d expressions fig es contenant des conjonctions de coordination corps et me au fur et mesure de mais aussi certains termes filtre huile 3 Ici est l toile de Kleene symbole math matique qui permet de r p ter un nombre quelconque de fois y compris 0 un l ment donn gt Page 5 CAROLINE BRUN Coordination et analyse automatique du fran ais crit en leur associant des proc dures de segmentation et d analyse morphologique ad quates ce qui a des cons quences int ressantes en terme de pr cision des analyses obtenues et de r duction du nombre de solutions parasites Brun 98b Analyse syntaxique La mod lisation syntaxique 4 propos e est appliqu e au mod le LFG Ce formali
15. nts du verbe ont des fonctions diff rentes rattach es des entr es lexicales diff rentes Les donn es reli es la coordination argumentent donc en faveur de la r union des deux fonctions COMP et OBJ sous une m me fonction OBJ La fonction OBJ se rapprocherait alors de la notion traditionnelle de compl ment d objet Cette red finition du mod le fonctionnel de LFG permet de conserver l identit fonctionnelle comme un crit re d terminant pour la coordination ce que nous cherchons r aliser compte tenu de notre tude linguistique du ph nom ne Heuristiques de classement Dans le cadre du d veloppement de grammaires syntagmatiques pour le TALN on observe des probl mes li s l exc s de solutions parasites Le point crucial est que lorsque l on obtient des analyses s mantiquement tranges ou peu plausibles il est extr mement difficile de les rejeter 5 Appliquer des contraintes syntaxiques risque de rejeter des phrases correctes dans un autre contexte Les contraintes implant es jusqu alors dans notre grammaire sont sures mais le nombre de solutions parasites reste trop important Pour pallier ce probl me nous utilisons une m thode fond e sur la th orie de l optimalit Frank et al 98 Cette m thode permet d exprimer des pr f rences sur les analyses obtenues Une nouvelle structure la o structure contient des marques d optimalit ici des attributs rang s par ordre d croissant selon la pr f re
16. rmet de traiter la coordination de fa on transparente du point de vue fonctionnel En effet le nombre des constituants n est pas restreint et ce mod le prend en compte la fois les coordinations binaires et n aires Nous limitons l application du sch ma de coordination en prenant en compte les contraintes linguistiques isol es pr c demment et ce en utilisant les m canismes d quations contraintes de LFG Cette mod lisation permet de rendre compte de la majorit des cas mais il est cependant n cessaire d adapter le mod le LFG pour traiter certains probl mes Ainsi la coordination de groupes nominaux provoque des conflits d unification car des groupes nominaux coordonn s au singulier s accordent le plus souvent avec des pr dicats pluriels Pour viter les conflits et calculer correctement le genre le nombre et la personne nous d clarons ces attributs comme non distributifs c est dire non unifiables sur les ensembles et red finissons des sch mas de coordinations sp cifiques qui prennent en compte le calcul de ces attributs en fonction du genre du nombre de la personne des diff rents constituants mis en jeu et du type de conjonction De plus les coordinations de constituants de cat gories diff rentes sont g n ralement un probl me pour les formalismes syntagmatiques LFG n chappant pas cette r gle 9 Ce voyant s allume lorsque l imprimante est en ligne et disponible La repr sentation de
17. sme utilise l unification et s appuie sur des repr sentations lexicales des ph nom nes linguistiques Bresnan et al 82 La phrase est d crite par deux types de structures La structure de surface est d crite par une repr sentation arborescente appel e structure de constituants c structure Les relations fonctionnelles relations pr dicats arguments sont repr sent es par des structures de traits codant les diff rentes fonctions grammaticales ce sont les structures fonctionnelles f structure Les fonctions grammaticales sujet objet compl tive peuvent tre cod es et modifi es dans les entr es lexicales des pr dicats qui les gouvernent c est pour cette raison que la grammaire est dite lexicale fonctionnelle La structure fonctionnelle associ e la coordination dans sa totalit n est cependant pas une structure de trait classique mais un ensemble dont les l ments sont les f structures des diff rents constituants Kaplan et Maxwell 88 Les propri t s associ es un ensemble sont distribu es ses l ments Le comportement syntaxique g n ral de la coordination est d crit l aide de m ta r gles qui prennent pour arguments les cat gories syntaxiques des constituants de la grammaire COORD C CONJ C K CONJ C LeT Jef Chacune des cat gories susceptibles de se coordonner qu elle soit lexicale ou syntagmatique peut instancier le param tre C La repr sentation par ensemble Le T pe
18. ssant de d velopper plus avant afin d am liorer la pr cision des analyses gt Page 9 CAROLINE BRUN Coordination et analyse automatique du fran ais crit R F RENCES BIBLIOGRAPHIQUES Ait 97 A t Mokhtar Du texte Ascii au texte lemmatis la pr syntaxe en une seule tape Actes du colloque TALN 97 Grenoble 1997 Bresnan et al 82 Bresnan J et Kaplan R The mental representation of grammatical relations Cambridge MA The Mit Press 1982 Brun98a Brun C tude et implantation de la coordination en vue de l analyse automatique du fran ais crit dans le cadre de la Grammaire Lexicale Fonctionnelle Th se de doctorat en science de l information et de la communication effectu e sous la direction du professeur Jacques Rouault Universit Stendhal Grenoble 3 1998 Brun 98b Brun C Terminology finite state preprocessing for computational LFG Actes de Coling ACL 98 Montr al 1998 Butt et al 99 Butt M King T H Ni o M E Segond F A Grammar Writer s CookBook CSLI Publications University of Chicago Press Stanford University para tre Chanod 93 Chanod J P Probl mes de robustesse en analyse syntaxique Actes du colloque Informatique et Langue Naturelle Nantes 1993 Chomsky 57 Chomsky N Syntactic Structures Mouton La Haye 1957 Dahl et al 95 Dahl V Tarau P Moreno L Palomar M Treating Coordination with Datalog Grammars Ac
19. tes du workshop Computational Logic for Natural Language Processing 1995 Dik 72 Dik S C Coordination Noth Holland 1972 Frank et al 98 Frank A King T Kuhn J Maxwell Optimality Theory Style Constraint Ranking in Large scale LFG Grammars Actes de LFG98 Brisbane Australie 1998 Gazdar et al 85 Gazdar Klein Pullum et Sag Generalized Phrase Structure Grammar Harward University Press 1985 Grevisse 91 Gr visse Le bon usage 12 me dition refondue par Andr Goosse Duculot 1991 Kaplan et Maxwell 88 Kaplan R et Maxwell J Constituent Coordination in Lexical Functional Grammar Actes de Coling 88 Budapest 1988 Karttunen 94 Karttunen L Constructing Lexical Transducers Actes de Coling94 Stanford EU 1994 Milward 94 Milward D Non constituent coordination Theory and Practice Actes de Coling 94 Kyoto 1994 Pollard et Sag 94 Pollard C et Sag 1 Head Driven Phrase Structure Grammar CSLI University of Chicago Press 1994 Steedman 85 Steedman M Dependency and Coordination in the Grammar of Dutch and English Language 61 2 523 568 1985 Woods 70 Woods W Transition Network Grammars for Natural Language Processing Communication de ACM13 1970 gt Page 10
20. tique du fran ais crit e Nombre de phrases ayant au moins une analyse valide 108 87 e Nombre moyen d analyses par phrases 11 75 e Dur e moyenne d une analyse CPU secs 30 45 Manuel d utilisation des imprimantes e Nombre total de phrases 1076 e Nombre de phrases test es 260 17 mots phrases e Nombre de phrases sans analyse valide 37 14 e Nombre de phrases ayant au moins une analyse valide 223 86 Nombre moyen d analyses par phrases 14 e Dur e moyenne d une analyse CPU secs 35 42 Les r sultats de l analyse des deux corpus sont sensiblement les m mes environ 86 des phrases pr sentant un ph nom ne de coordination re oit une analyse valide Signalons que certaines phrases ne re oivent pas d analyse car elles sont trop longues pour que l analyseur puisse les traiter celui ci stoppant le processus lorsqu un certain d lai est d pass Le nombre de solutions parasites est encore important pour les deux corpus puisque nous recevons en moyenne pour les deux corpus 13 analyses par phrase Cependant les heuristiques de classement et les contraintes linguistiques que nous avons d velopp es permettent un r duction de 5 analyses par phrase en moyenne En effet si l on analyse les m mes corpus sans appliquer ces m thodes le nombre moyen d analyse par phrase contenant au moins une coordination est de 18 De plus sur ces deux corpus nous n avons pas observ de rejet d a
21. un syntagme pr positionnel nous affectons nouveau un poids lev Illustrons les cons quences de ce traitement sur un exemple 14 On trouvera ci dessous une br ve explication des instruments et des t moins lumineux Nous ne rejetons pas l analyse syntaxique o le constituant une br ve explication des instruments se coordonne avec des t moins lumineux des tant un d terminant partitif mais nous lui pr f rons l analyse plus parall le o des instruments se coordonne avec des t moins lumineux car il s agit d une coordination de syntagmes pr positionnels ayant m me pr position et m me d terminant des de les Le second principe est d affecter des poids faibles aux constructions rares c est dire les coordinations de cat gories diff rentes d l ments pr sentant des ellipses et les num rations implicites sans conjonction exprim e Analyse de corpus Nous allons pour conclure d crire les r sultats obtenus sur les deux corpus techniques notre disposition le manuel d utilisation des tracteurs pr sent pr c demment et un manuel d utilisation d imprimantes Les phrases test es sont les phrases qui contiennent des ph nom nes de coordinations Manuel d utilisation des tracteurs e Nombre total de phrases 549 Nombre de phrases test es 124 18 9 mots phrases e Nombre de phrases sans analyse valide 16 13 gt Page 8 CAROLINE BRUN Coordination et analyse automa
22. ximum pour la grammaire transformationnelle et qui posent de nombreux probl mes e Les traitements exhibant un constituant similaire dans tous les cas ce que font les grammaires cat gorielles Ce traitement permet de prendre en compte un grand nombre de cas mais pose des probl mes de surg n ration et d analyses ambigu s pour les applications pratiques e Les processus m tagrammaticaux qui consid rent la phrase comme une suite de transitions la coordination permettant de r acc der des points dans l historique de l analyse c est dire de revenir en arri re vers des mots d j analys s et d utiliser l information port e par ces mots pour reprendre l analyse ce sont les traitements informatiques qui semblent donner de bons r sultats mais posent aussi des probl mes de surg n ration et d analyses parasites e La coordination au niveau du constituant propos e entre autres par les grammaires d unification qui semble linguistiquement justifi e mais qui restreint les analyses de ph nom nes plus complexes comme les coordinations ellipses De plus certains probl mes li s l unification se posent La couverture du ph nom ne augmente avec le rejet de la structuration en constituants observation faite pour les grammaires cat gorielles et les processus informatiques Parall lement la surg n ration et les probl mes d ambigu t s parasites se posent Il semble donc qu un compromis entre

Download Pdf Manuals

image

Related Search

Related Contents

Price Book - Isbak Marine Service    ALL IN ONE ARRAY SYSTEM  4ASoft Agenda v.10.01 Manuel d`utilisation 1. Introduction  Operating Instructions  Salem Baking Company 252801 User's Manual    Mumps Virus Real Time RT-PCR Kit User Manual For In  SHR-404A簡易取扱説明書 本体での操作  Manual - Lojas Colombo  

Copyright © All rights reserved.
Failed to retrieve file