Home

Molière est-il l`auteur des pièces parues sous son nom

image

Contents

1. avec plusieurs classifications automatiques Cette m thode qui va tre pr sent e plus en d tail indique que Corneille a probablement crit toutes les grandes pi ces en vers pr sent es sous le nom de Moli re mais aussi Dow Juan l Avare et les 4 5 du Bourgeois gentilhomme et du Malade imaginaire ce propos il est important de rappeler qu avant 2001 au moins trois personnes P Lou s H Poulaille et H Wouters avaient relev de nombreuses ressemblances troublantes entre les uvres de Corneille et celles pr sent es par Moli re Ces trois personnes doivent tre consid r es comme les d couvreurs notre travail n tant qu une modeste contribution la solution de cette nigme Si notre travail est d abord d ordre statistique il se place aussi sur le terrain historique auquel est consacr l essentiel de notre dernier livre et qu on abordera la fin de cette conf rence I STATISTIQUE ET ATTRIBUTION D AUTEUR En d cembre 2001 C Labb et moi m me avons propos une m thode reposant sur la combinaison d une mesure de distance avec des classifications que l on qualifie parfois d automatiques car elles ne n cessitent pas d intervention humaine La distance intertextuelle La distance entre deux textes se mesure comme la distance s parant deux objets dans l espace L unit de mesure est ici le mot Soit deux textes A et B C gt C gt La distance intertexuelle s obtient e
2. aucune correspondance Personne ne l a vu crire D ailleurs gr ce au registre tenu par La Grange un 3 Ce recensement est rendu possible gr ce un site en ligne anglais Cesar qui pr sente toutes les pi ces de th tre connues des XVIIe et XVIIIe si cle fran ais avec leur date de cr ation leur auteur et les comptes rendus 12 des com diens de la troupe on conna t son emploi du temps Celui ci ne lui donnait pas le loisir n cessaire pour composer l uvre qu on lui pr te Les deux principaux critiques de l poque ont clairement indiqu qu il n tait pas l auteur des pi ces qu il pr sentait Par exemple en 1663 Robinet du Laurens a crit On ne peut pas dire que Moli re soit une source vive mais seulement un bassin qui re oit ses eaux d ailleurs pour ne point le traiter plus mal en le comprenant dans la comparaison que quelques uns ont faite avec des nes seulement capables de porter des grands fardeaux Donneau de Vis galement en 1663 Ses enfants ont plus d un p re Tout le Parnasse s assemble quand il veut faire quelque chose Les crivains contemporains n ont gu re t plus tendres Apr s avoir fait la connaissance de Moli re en 1663 La Fontaine n a plus crit une ligne en sa faveur Boileau a compos plusieurs satires dans lesquelles il met en doute la qualit d auteur de Moli re avant d crire en 1674 qu il est un faux plaisant grossi
3. auteur et le genre sont identiques mais les dates de composition et les th mes sont plus loign s entre 2 500 et 3 500 soit l auteur est le m me et alors plusieurs facteurs ont chang soit ce sont deux auteurs diff rents travaillant la m me poque dans un m me genre sur des th mes tr s proches au dessus de 3 500 si les deux textes sont dans un m me genre alors les auteurs sont diff rents Si l auteur est le m me alors les genres sont certainement diff rents Appliqu e au corpus Corneille Moli re cette chelle confirme la proximit remarquable entre les deux menteurs de P Corneille et les principales pi ces pr sent es par Corneille annexe 3 Le XVIIe si cle fournit des contre preuves int ressantes Par exemple Corneille et Racine ont crit chacun une trag die sur l amour impossible entre un empereur romain Titus et une reine orientale B r nice Ils l ont fait au m me moment en aveugle en alexandrins et en respectant les fameuses r gles qui enserraient la cr ation th trale sp cialement la trag die Et tous deux avaient en t te la m me r f rence la liaison entre Louis XIV et Henriette d Angleterre sa belle s ur Le lieu de l action et les personnages taient donc identiques ainsi que les obstacles cet amour partag d o un vocabulaire commun important L annexe 5 pr sente le r sultat du calcul La distance entre ces deux pi ces 0 256 est plus lev e que tou
4. cessaires l quilibre conomique des troupes mais elles taient condamn es par l Eglise par une partie de la Cour et par l Acad mie Les crivains c l bres qui composaient ces com dies pr f raient donc rester dans l ombre il n y avait pas de propri t intellectuelle et les troupes n avaient pas la personnalit juridique Pour garder le contr le sur ces textes il fallait donc qu un com dien ach te la pi ce l crivain et assure son exploitation le com dien po te pr sentait la pi ce l assembl e de la troupe il avan ait une partie des sommes n cessaires pour les d cors la musique les ballets il surveillait la distribution des r les les costumes la mise en sc ne il veillait ce que la pi ce ne soit pas retir e trop vite de l affiche il surveillait le partage de la recette qui avait lieu chaque soir apr s la repr sentation il n gociait la publication avec les diteurs et il encaissait les moqueries et les critiques la place de l crivain Et Moli re Moli re tait il diff rent de ses confr res com diens et auteurs pour la galerie Etait il un grand crivain comme on le croit aujourd hui Les documents de l poque montrent que Moli re tait un riche financier qui se fait passer pour noble et serviteur du roi Dans ses deux maisons richement meubl es il n y avait pas de biblioth que ni de bureau tr s peu de livres Moli re ne laisse aucun manuscrit
5. chelle inf rieure 1 10 dans les diff rences de longueur Ces consid rations ne sont pas d velopp es ici car elles ne concernent pas l exp rience sur Corneille et Moli re le plus petit texte attribu Corneille M licerte d passe 5 000 mots ce niveau les perturbations dues aux basses fr quences dans les textes courts sont n gligeables et la plus longue pi ce Avar en compte 21 000 Ce sont les dimensions id ales la mesure enregistre l influence de 4 facteurs le genre l auteur l poque et le th me pour linfluence respective de chacun de ces facteurs voir par exemple Labb 2007a et Labb 2009 D s lors pour d terminer l auteur d un texte d origine douteuse ou inconnue il suffit de le confronter d autres dont l origine n est pas douteuse crits dans un m me genre et la m me poque La m thode La m thode d attribution d auteur a t mise au point gr ce un tr s grand nombre d exp riences r alis es dans des conditions draconiennes En voici un exemple A la demande de Gerard Ledger et de Thomas Merriam une s rie d exp riences en aveugle ont t r alis es sous leur contr le Ils ont relu le compte rendu et en ont accept la publication Labb 2007a Lors de la premi re exp rience G Ledger a soumis 52 textes anglais anonym s le corpus Oxquarry en demandant lesquels taient crits par les m mes auteurs Il avait choisi certains text
6. Elide 1664 Com die vers et prose 11 333 51 Le Tartuffe 1664 Com die vers 18271 52 Dom Juan 1665 Com die prose 17 452 53 L amour m decin 1665 Com die prose 6 147 54 Le Misanthrope 1666 Com die vers 17 180 55 M decin malgr lui 1666 Com die prose 9317 56 M licerte 1666 Com die vers 5 540 Com die pastorale 1667 Com die vers libres 732 57 Le sicilien 1667 Com die prose 5 375 58 Amphytrion 1668 Com die vers libres 15 117 59 Georges Dandin 1668 Com die prose 11 009 60 L avare 1668 Com die prose 21 033 61 M de Pourceaugnac 1669 Com die prose 11 803 62 Amants magnifiques 1670 Com die vers amp prose 11 983 63 Bourgeois gentilhom 1670 Com die prose 17 132 64 Fourberies de Scapin 1671 Com die prose 14 245 65 Escarbagnas 1671 Com die prose 5 564 Femmes savantes 1672 Com die vers 16 863 Malade imaginaire 1673 Com die prose 19 919 crite en tout ou partie par P Corneille Pi ce retir e dans les exp riences cause de sa petite taille Sources Eug ne Despois uvres compl tes de Moli re Paris Hachette 1876 Collection Les Grands crivains de la France 17 Annexe III Distances s parant les deux Menteurs Corneille et les Plaideurs Racine de toutes les pi ces de Moli re P Corneille 1642 Corneille 1643 Racine 1668 Le Menteur 1642 Vets 0 000 0 180 02 Psych Corneille 1671 Vers 0 288 0 273 0 348 La jalousie du barbouill avan
7. Paris V Luong X 1994 L analyse arbor e des donn es textuelles mode d emploi Travaux du cercle linguistique de Nice 16 p 25 42 Moni re D amp Labb D 2006 L influence des plumes de Pombre sur les discours des politiciens In Cond C amp Viprey J M Actes des 8e Journ es internationales d Analyse des donn es textuelles Besan on 19 21 avril 2006 IL p 687 696 Ruhlman M 2003 Analyse arbor e Repr sentation par la m thode des groupements Grenoble Polytech CERAT Wouters H Ville de Goyet C de 1990 Moli re ou l auteur imaginaire Bruxelles Eds Complexe 15 Annexe I Les pi ces de Pierre Corneille M lite 1630 Com die 16 690 Clitandre 1631 Tragi com die 14 402 La Veuve 1631 Com die 17 661 La Galerie du Palais 1632 Com die 16 140 La Suivante 1633 Com die 15 160 Com die des Tuileries 1634 Com die 3 627 M d e 1635 Trag die 14 269 La Place Royale 1634 Com die 13 801 L illusion comique 1636 Com die 15 428 Le Cid 1636 Tragi com die 16 677 Cinna 1641 Trag die 16 126 12 Horace 1640 Trag die 16 482 13 Polyeucte 1641 Trag die 16 472 14 Pomp e 1642 Trag die 16 492 15 Le Menteur 1 1642 Com die 16 653 16 Le Menteur 2 1643 Com die 17 675 17 Rodogune 1644 Trag die 16 842 18 Th odore 1645 Trag die 17 121 19 H raclius 1647 Trag die 17 433 20 Androm de 1650 Trag die 15 514 21 Don Sanche 1650 Com die h ro que 16 947 22 Nicom de 1651 Trag die
8. analyse en composantes principales analyse factorielle La m thode dite de la classification arbor e est classique en g n tique Felsenstein 2004 ou en linguistique historique Embleton 1986 Holm 2007 Elle repose sur la propri t suivante si toutes les distances s parant les individus tudi s sont euclidiennes il existe un arbre qui repr sente exactement les positions respectives de ces individus les uns par rapport aux autres et les meilleurs groupements possibles Appliqu e l nigme pos e par G Ledger et T Merriam corpus Oxquarry cette m thode donne la figure 2 Dans cette figure les feuilles terminales figurent chacune un texte les n uds interm diaires figurent les meilleurs groupements possibles c est dire ceux pour lesquels les distances entre les l ments qui composent le groupe sont les plus faibles possible et les distances les s parant des autres les plus grandes possibles Les segments de droite ou ar tes sont des branches quand elles relient des feuilles des n uds et des troncs quand elles relient des n uds entre eux La distance entre deux points quelconques est figur e par le chemin unissant ces points et la longueur de ce chemin est proportionnelle la distance originelle correspondante sur la construction de ces arbres voir Labb et Labb 2006 et 2008 Dans le graphique ci dessus tous les textes sont correctement attribu s leurs auteurs et aux uvres respectives
9. chances a t on de r ussir ce genre d preuves par hasard Au num rateur il y a une seule bonne combinaison au d nominateur on place le nombre de combinaisons diff rentes que l on peut r aliser avec ces 52 textes En th orie ce nombre est gal 52 factorielle de 52 soit 8 07 67 combinaisons diff rentes Toutefois le nombre r el est plus petit D une part tout auteur a au moins deux textes il faut donc liminer les combinaisons comportant des c libataires D autre part la distance intertextuelle tant sym trique il faut diviser par deux le nombre de couples possibles par 6 le nombre de trios par 8 le nombre de quatuors etc Cela donne tout de m me 6 119 combinaisons possibles Nous avions donc une chance sur 61 millions de billions de r ussir cette preuve par hasard le faux positif Ceux qui pr tendent que ce genre exercice est facile devraient y r fl chir Cette remarque vaut aussi pour la classification effectu e sur Corneille et Moli re par X Luong en 1999 figure 3 Figure 3 Classification arbor e sur l ensemble des uvres th trales de Corneille et Moli re Moli re s prose Corneille s Menteurs Moli re s verses ille s pl orneille s plays m Ce graphe a t trac par M X Luong de l universit de Nice Pour les num ros des pi ces se reporter Pannexe 1 Les traits en gras correspondent n 06 Corneille Com die des Tuileries crite par Corneille
10. genre et crits par un m me auteur une m me poque sur des th mes diff rents sont syst matiquement et nettement inf rieures celles s parant deux auteurs diff rents m ne quand ils crivent an m me moment sur un th me identique Enfin troisi me remarque les grands tableaux de chiffres sont lourds manipuler manuellement et l on peut passer c t d informations importantes Des automates peuvent faire ce travail plus efficacement et offrir des repr sentations graphiques plus simples consulter II QUELQUES CONFIRMATIONS Les classifications confirment les anomalies signal es ci dessus propos de Corneille et Moli re Deux autres tudes statistiques vont aider conclure Classifications L objectif est double rechercher les meilleurs groupements possibles sans intervention humaine Deux crit res sont utilis s D une part les distances entre les individus composant un m me groupe doivent tre les plus courtes possibles d autre part les distances s parant les diff rents groupes ainsi constitu s doivent tre les plus grandes possibles pour une pr sentation de la question Sneath amp Sokal 1973 et Benzecri 1980 offrir la meilleure repr sentation possible en deux dimensions de ce meilleur ordre possible alors que celui ci comporte un grand nombre de dimensions 1326 dans l exp rience Oxquarry Il existe un grand nombre de m thodes de classification classification automatique
11. leurs dix enfants alors que leurs revenus connus ne pouvaient y suffire CONCLUSIONS Tous nos articles sur cette question sont consultables sur le site archives en ligne du CNRS HAL SHS Nos programmes et nos donn es sont dans le domaine public La plupart des documents historiques que nous avons cit s sont en ligne les autres ont t publi s Tout est donc v rifiable Enfin depuis huit ans nous proposons nos contradicteurs de r aliser les exp riences de leur choix Quelles conclusions tirer de ce faisceau d indices pr cis s rieux concordants et tous v rifiables Du volet statistique on conclut qu il existe entre les uvres de Corneille et les principales pi ces pr sent es par Moli re des proximit s uniques dans l histoire litt raire fran aise pour deux crivains contemporains travaillant dans le m me genre sur des th mes proches Du volet historique on conclut que cette proximit est logique puisque Corneille a fait comme les autres crivains de son temps il a pr sent ses trag dies sous son nom et ses com dies sous le nom d un com dien po te C est l oubli de ce syst me du com dien po te qui a permis la l gende du Moli re grand auteur de prendre corps bien apr s sa mort dans des circonstances voqu es dans mon essai 13 D s lors il faut admettre que P Corneille a crit toutes les pi ces en vers pr sent es sous le nom de Moli re ainsi que l Avare et Dom Ju
12. on scientifique la mani re dont une langue est parl e et crite par ses usagers En effet pour les principales langues europ ennes on dispose d j de vastes chantillons repr sentatifs oraux et crits appartenant de multiples genres et provenant de toutes les classes sociales Cela permet une tude scientifique de la grammaire des structures de phrase du lexique Ce sont des outils indispensables pour l enseignement surtout ceux dont ce n est pas la langue maternelle les correcteurs orthographiques la documentation et l archivage les traducteurs automatiques Sans ces outils une langue est condamn e plus ou moins court terme la disparition dans un si cle domin par la communication De tels outils existent pour l anglais l allemand l espagnol le tch que l cossais mais pas pour le fran ais Une anecdote pour finir En 1998 quand nous avons commenc apercevoir l trange parent des principales pi ces de Moli re avec celles de Corneille nous nous sommes document s ce qui nous a permis de d couvrir que de nombreuses personnes avaient eu cette intuition avant nous C est particuli rement le cas du po te P Lou s au d but du XXe si cle du romancier H Poulaille dans les ann es 1950 et d H Wouters dans les ann es 1990 Il y en a certainement eu d autres D Boissier animateur de l excellent site corneille moliere org nous a signal le peintre J L G r me qui
13. sc ne th trale du temps Cette lecture peut tre utilement compl t e par celle de Denis Boissier 2008 dont les conclusions recoupent tr s largement les n tres Le th tre au XVIIe La clef essentielle est fournie par l examen de la production th trale du temps En effet durant la seconde moiti du XVIIe si cle 6 pi ces sur 10 ont t pr sent es par des com diens et non pas par les crivains qui les ont compos es C est le cas de 9 com dies sur 10 Notre essai voque les principaux com diens po tes confr res de Moli re Baron Br court Champmesl Dancourt Dorimond Hauteroche La Thuilerie Montfleury Poisson Raisin Rosimond Villiers En effet il s agit d un v ritable syst me qui donne son titre une com die pr sent e en 1673 par la troupe de Moli re sous le nom de Montfleury alors qu elle est de Thomas Corneille le petit fr re de Pierre En effet T Corneille comme les autres grands crivains du temps pr sentait des pi ces s rieuses sous son propre nom et des com dies sous le nom de Montfleury puis de Hauteroche Notre essai donne d autres exemples de collaborations semblables Boursault avec le com dien Poisson ou La Fontaine avec Champmesl Notre essai expose les raisons d un tel syst me Les principales sont les suivantes les com dies satiriques comme celles de Moli re plaisaient au public parisien qui tait assez frondeur elles taient n
14. textes car le fran ais est une langue flexionnelle avec de tr s nombreuses homographies En effet dans tout texte en fran ais plus du tiers des mots peuvent tre rattach s plus d une entr e de dictionnaire et ce sont les plus fr quents le pronom ou article tre ou avoir substantifs ou verbes De plus la lemmatisation repr sente le seul moyen de diminuer les effets parasites des basses fr quences voir sur ce point Labb amp Labb 2003 en th orie les diff rences de longueur sont neutralis es puisque aux arrondis pr s la somme des E sera gale N En fait l indice de la distance pr sente une l g re tendance d cro tre en fonction de l allongement de la longueur des textes Lorsque les diff rences sont trop importantes les plus longs textes se rapprochent entre eux et s loignent des plus petits Ceci s explique par la sp cialisation lexicale qui s l ve g n ralement avec la longueur des textes et par l amenuisement de lapport en mots nouveaux au fur et mesure que le texte s allonge Dans une collection de textes de tailles tr s diff rentes ce sont pratiquement toujours les textes les plus longs qui se trouvent au centre de la distribution et les plus courts qui sont les plus d cal s C est pourquoi nous avons recommand dans notre article de 2001 de ne pas appliquer le calcul sur des textes trop courts en tous cas pas moins de 1 000 mots et de s en tenir une
15. 16 923 23 Pertharite 1651 Trag die 17121 24 Oedipe 1659 Trag die 18 618 25 Toison d Or 1661 Trag die 20 343 26 Sertorius 1662 Trag die 17 675 27 Sophonisbe 1663 Trag die 16 858 28 Othon 1664 Trag die 16 971 29 Ag silas 1666 Trag die 18 227 30 Atilla 1667 Trag die 16 788 i 31 Tite et B r nice 1670 Com die h ro que 16 697 32 Pulch rie 1672 Trag die 16 630 33 Sur na 1674 Trag die 16 545 1 4 11 34 Psych Corneille 1671 Com die en vers 10 067 35 Psych Moli re 1671 Com die en vers 4 816 36 Psych Quinault 1671 _ Com dieenvers 1399 Sources Charles Marty Laveaux uvres compl tes de P Corneille Paris Hachette 1862 Collection Les Grands crivains de la France 16 Annexe II L uvre th trale repr sent e sous le nom de Moli re a 37 La jalousie Avant 1659 Com die prose 3 501 38 M decin volant Avant 1659 Com die prose 3 876 39 L tourdi 1659 Com die vers 18 671 40 D pit amoureux 1659 Com die vers 16 242 41 Pr cieuses ridicules 1660 Com die prose 6 648 42 Sganarelle 1660 Com die vers 6 042 43 Dom Garcie 1661 Com die h ro que vers 17 049 44 L cole des maris 1661 Com die vers 10 536 45 Les f cheux 1661 Com die vers 7 922 46 L cole des femmes 1662 Com die vers 16 625 47 Critique de l cole 1663 Com die prose 8 610 48 L impromptu 1663 Com die prose 7 168 49 Mariage forc 1664 Com die prose 6 058 50 Princesse d
16. 1671 Prose 0 311 0 300 0 305 66 Femmes savantes 1672 Vers 0 260 0 248 0 283 7 Malade imaginaire 1672 Prose 0 282 0 270 CE Distances s parant Dom Garcie Moli re et Psych Corneille et Moli re 18 Annexe IV des derni res pi ces de Corneille Ultimes pi ces de Corneille Dom Garcie Psych Moli re 1661 Corneille 1671 Rodogune 1644 0 245 0 231 Theodore 1645 0 234 0 245 Heraclius 1647 0 248 0 273 Androm de 1650 0 241 0 218 DonSanche 1650 0 224 0 251 Nicom de 1651 0 244 0 264 Pertharite 1651 0 235 0 263 dipe 1659 0 223 0 226 Toison d or 1661 0 221 0 220 Sertorius 1662 0 230 0 238 Sophonisbe 1663 0 228 0 236 Othon 1664 0 235 0 240 Agesilas 1666 0 234 0 233 Attila 1667 0 235 0 227 Tite et B r nice 1670 0 227 0 235 Psych 1671 0 230 Pulcherie 1672 0 230 0 226 Surena 1674 0 216 0 224 Moyenne Corneille 0 243 0 244 Moyenne Moli re 0 286 0 297 Annexe V Principales distances caract ristiques entre Corneille et Racine l poque de Tite et B r nice Tite et B r nice B r nice Corneille 1670 Racine 1670 CORNEILLE Ag silas 1666 0 159 0 278 Attila 1667 0 180 0 289 Tite et B r nice 1670 0 0 256 Pulch rie 1672 0 155 0 271 Sur na 1672 0 156 0 264 RACINE Andromaque 1667 0 259 0 225 Britannicus 1669 0 251 0 209 B r nice 1670 0 256 Bazajet 1672 0 262 0 220 Mithridate 1673 0 249 0
17. 206
18. Cet outil est videmment plus puissant que l examen manuel des distances Il soul ve deux questions Quelle est la pr cision de la m thode Quel risque d erreur Pour la premi re question dans Parbre ci dessous les longueurs des branches sont gales aux distances correspondantes avec une incertitude moyenne de 2 voir Labb et Labb 2008 La repr sentation graphique est donc fiable 2 Algorithme X Luong 1988 et 1994 Le programme utilis pour tracer la figure 2 est pr sent dans Rulhman 2003 8 8 progr P 8 P Figure 2 Classification arbor e du corpus Oxquarry Orczy Scarlet Elusive 7 4l 1M 2Y 11W Butler Chesterton 18 1E Erewhon Man 10 2U 1R 1C Morris 1P 21 News 15 2M Conrad pos Almayer 2 orris 2 Dream 2K 1Y D Z Conrad 2H PS matt ay Stevenson Lord Jim 9 Pr ik Catroniae Aa x 1G 1F 2z in Stevenson Hardy Ballantrae 28 Madding 1H 2X Hardy Toa 2P 2J Well Beloved Forster we TL 20 Room Hardy LM Hardy Tressel Wessex Judde Ragged 1A NB les noms des auteurs et des uvres ont t ajout s apr s exp rience Pour la seconde question il n y a pas de risque d erreur proprement parler puisqu on ne travaille pas sur chantillons mais sur des populations enti res En revanche on ne peut carter a priori le risque d un faux positif Quelle est la probabilit d un tel v nement Cela revient savoir combien de
19. Universit de Neuch tel Institut de Math matiques Institut d Informatique SEMINAIRE MATHEMATIQUES ET SOCIETE Mercredi 9 d cembre 2009 Jean L on G r me Une collaboration Corneille et Moli re 1874 Qui a crit Dom Juan Moli re est il l auteur des pi ces parues sous son nom Dominique Labb Institut d Etudes Politiques de Grenoble dominique labbe iep grenoble fr R sum A l occasion de la parution de son ouvrage Si deux et deux sont quatre Moli re n a pas crit Dom Juan Editions Max Milo Dominique Labb expose les raisons pour lesquelles Moli re n a pas compos les pi ces pr sent es sous son nom Apr s avoir discut les m thodes statistiques qui attribuent Corneille les com dies les plus connues de Moli re il explique pourquoi les deux hommes ont collabor et il montre que cette collaboration n avait rien d exceptionnelle Nos travaux sur Corneille et Moli re appartiennent un courant qui existe surtout dans les pays anglo saxons et qui consiste utiliser des m thodes statistiques pour attribuer un auteur connu des textes douteux ou d origine inconnue Cette attribution d auteur est un aspect particulier d un probl me plus g n ral connu des statisticiens sous le nom de classification la recherche des meilleurs groupements possibles dans les vastes populations ici des textes Nous proposons une solution originale consistant en un calcul de distance entre textes combin
20. a r alis en 1873 ou 1874 un tableau reproduit au d but de cette communication dont le titre est Corneille Moli re une collaboration On y voit Corneille lisant un texte Moli re aussi richement v tu que Corneille l est pauvrement Au fond notre seul m rite est d avoir eu notre disposition la puissance des ordinateurs modernes et d internet qui ont beaucoup facilit nos recherches statistiques et historiques R f rences Tous nos travaux cit s sont accessibles en ligne partir de notre page personnelle On consultera galement le site corneille moliere org Benzecri J P 1980 L analyse des donn es 1 La taxinomie Paris Dunod Boissier D 2008 Tout savoir sur l affaire Corneille Moli re Paris Association corn lienne de France Embleton S 1986 Statistics in Historical Linguistics Bochum Brokmevyer Felsenstein J 2004 Inferring Phylogenies Sunderland Sinauer Ass Hockey S amp Martin J 1988 OCP Users Manual Oxford Oxford University Computing Service 14 Holm H J 2007 The New Arboretum of Indo European Trees Can New Algorithms Reveal the Phylogeny and Even Prehistory of Indo European Journal of Quantitative Linguistics 14 2 p 167 214 Labb C amp Labb D 2001 Inter Textual Distance and Authorship Attribution Corneille and Moli re Journal of Quantitative Linguistics 8 3 p 213 231 Labb C amp Labb D 2003 La distance intertextue
21. agramme Par convention on fixe la limite la moyenne diminu e de deux carts types soit 70 paires de textes trop proches par rapport la moyenne du corpus si les textes d auteurs diff rents sont s par s par les distances les plus longues elles se trouvent droite du diagramme limite moyenne augment e de deux carts types soit 26 distances trop lev es par rapport la moyenne Ces 96 couples soit 7 du total des couples permettent d attribuer 47 textes sur 52 tableau 1 Apr s l exp rience T Merriam et G Ledger nous ont livr les noms des auteurs derni re colonne droite il n y a aucune erreur Les deux hypoth ses sont donc v rifi es les distances les plus faibles d signent toujours un m me auteur et les distances les plus fortes se rencontrent toujours entre auteurs diff rents De nombreuses exp riences comme celle ci ont t r alis es Jusqu ce jour elles ont toutes valid ces deux hypoth ses Tableau 1 D termination des auteurs gr ce aux distances remarquables N Textes Auteurs 1 1D 2W 1K 2R 1N 2E 1F Stevenson 2 1S 2M 2I 1C Morris 3 1E 1Q 1B 2A Butler 4 2L 2T 2 2X 1L 2D 1X 2F Hardy 5 1H 2Z 2S Hardy 6 20 2P 2V Forster 7 12 2C 1Y Tressel 8 1P 2U 1R Chesterton 9 2H 1G 10 Conrad 10 2N 2Q 2K Conrad 11 1M 2Y 1W 2G Orczy 12 1J 2B Morris Appliqu e au corpus Corneille Moli re cette m me m thode classe correcte
22. an et au moins 4 actes sur 5 du Bourgeois gentilhomme et du Malade imaginaire Certains litt raires consid rent que cette conclusion ne change rien puisque le texte se suffit lui m me et qu il mest pas n cessaire de conna tre l auteur pour l interpr ter Dans ce cas il faut cesser de chercher dans la vie imagin e de Moli re des clefs d interpr tation comme le font tous les Moli ristes c est le nom que se donnent les partisans de la th se du Moli re grand crivain Il faut admettre que les pi ces pr sent es sous le nom de Moli re r pondaient aux attentes des com diens et du public parisien qu elles s inscrivaient dans l atmosph re intellectuelle de P poque Il faut aussi admettre que l uvre des fr res Corneille est red couvrir la lumi re de leur activit de plumes de l ombre Au del de Corneille et Moli re nous voudrions souligner aussi l apport de la statistique appliqu e aux sciences du langage et analyse litt raire Pour ce qui concerne l analyse litt raire on pourra enfin conna tre le vocabulaire d un auteur d une uvre d une poque mais aussi le sens sp cifique des mots les styles les th mes pr f r s On d crira les volutions dans une uvre les ruptures les continuit s On pourra reconstituer les principaux courants litt raires clairer les filiations et les influences mutuelles Pour les sciences du langage on peut enfin tudier de fa
23. es parce qu il semblait difficile de les distinguer bien qu ayant t crits par des auteurs diff rents G Ledger et T Merriam ont fourni plusieurs indications les textes sont d un m me genre et peu pr s contemporains il s agit de romans de la seconde moiti du XIXe il y a plusieurs auteurs et chacun de ces auteurs a au moins deux textes Ces textes ont t trait s selon la norme OCP Hockey amp Martin 1988 Leurs distances mutuelles calcul es avec la formule 2 sont rang es par valeurs croissantes dans des classes d intervalles gaux figure 1 Cet histogramme rappelle la courbe en cloche Laplace Gauss Mais il y a des anomalies aux deux extr mit s comme si cette figure r sultait du m lange de trois populations in gales chacune distribu es selon une courbe en cloche Deux sont peu nombreuses et encadrent la principale La premi re est compos e de distances anormalement petites gauche la troisi me est constitu e des distances les plus grandes droite Figure 1 Histogramme des distances rang es par valeurs croissantes et intervalles de classe gaux corpus Oxquarry dl Il a M LI nn 0 26 0 29 0 32 0 35 6 0 47 100 count 90 D on t S h _ la ll On formule deux hypoth ses si les textes de m mes auteurs sont s par s par les distances les plus courtes elles constituent la population gauche du di
24. inscrivent comme un sous ensemble dans ceux de Corneille Le plus vocateur est le mot amour substantif le plus employ par Corneille comme par Moli re Par exemple haine est le vocable le plus fortement associ Pamour dans les deux uvres a haine d truit l amour l amour se transforme en haine l amour r siste la haine Les vocables les plus trangers Pamour sont Dieu p re fr re fils gendre pour une pr sentation d taill e des calculs et de l univers de Pamour chez Corneille Labb amp Labb 2006 L encore ces significations sont propres Corneille et ne se retrouvent pas chez ses contemporains Nous avons refait cette d monstration Louvain la 11 Neuve devant deux de nos contradicteurs et une centaine de sp cialistes de la statistique appliqu e au langage Labb 2004b La d monstration est en ligne et n a pas t contredite HI UN PEU D HISTOIRE Naturellement une exp rience d attribution d auteur n a de sens que si historiquement la collaboration tait possible et qu il n y a pas d obstacle celle ci Dans Particle de 2001 nous avons indiqu que c est bien le cas pour Corneille et Moli re et nous avons signal que d s le d but des succ s de Moli re Paris des rumeurs ont circul sur la paternit des uvres qu il pr sentait Mon essai Si deux et deux sont quatre examine en d tail ce volet historique sp cialement en ce qui concerne la
25. lle Corpus 2 p 95 118 Labb C amp Labb D 2005 How to Measure the Meanings of Words Amour in Corneille s Work Langage Resources Evaluation 39 p 335 351 Labb C amp Labb D 2006 A Tool for Literary Studies Intertextual Distance and Tree Classification Literary and Linguistic Computing 21 3 p 311 326 Labb C amp Labb D 2007a Baudelaire Rimbaud et Verlaine VIIe journ es de ERLA Aspects linguistiques du texte po tique Brest 16 17 novembre 2007 Labb C et Labb D 2007b Corneille a crit 16 pi ces repr sent es sous le nom de Moli re R ponses Viprey Jean Marie et Ledoux Claude Nicolas About Labb s Tnter textual Distance Grenoble PACTE IEP Labb C et Labb D 2009 Existe t il un genre pistolaire Hugo Flaubert et Maupassant Xe journ es de lErla Brest novembre 2009 Labb D 2004a Romain Gary et Emile Ajar Grenoble Cerat IEP mai 2004 Labb D 2004b Corneille et Moli re Table ronde 7e Journ es d Analyse des Donn es Textuelles Louvain la Neuve 11 mars 2004 Grenoble CERAT IEP Labb D 2007 Experiments on Authorship Attribution by Intertextual Distance in English Journal of Quantitative Linguistics April 2007 14 1 p 33 80 Lafon M amp Peeters B 2006 Nous est un autre Paris Flammarion Luong X 1988 M thodes d analyse arbor e Algorithmes applications Th se pour le doctorat s sciences Paris Universit de
26. ment la plupart des textes mais elle apporte deux surprises deux com dies en alexandrins de P Corneille Menteur 1642 et la suite du Menteur 1643 sont class es avec 14 com dies pr sent es par Moli re entre 1659 et 1673 douze com dies en alexandrins et deux com dies en prose Dom Juan et Avare deux com dies s rieuses pr sent es par Moli re galement en alexandrins Dow Garcie et Psych sont class es avec les trag dies et les com dies h ro ques contemporaines de P Corneille A ce stade on peut formuler trois remarques Premi rement la distance intertextuelle a t test e sur des dizaines de milliers de textes sans jamais rencontrer de tels croisements entre deux uvres d auteurs diff rents sauf quand les deux auteurs suppos s ne font qu un comme dans le cas de Gary et Ajar Labb 2004a et Lafon et Peters 2006 ou quand la m me plume de l ombre a travaill pour deux employeurs diff rents Moni re et Labb 2006 Deuxi mement en r p tant des exp riences comme celle organis e avec T Merriam et G Ledger sur un tr s grand nombre de textes vari s nous avons pu talonner empiriquement une chelle des distances pour le fran ais Si l on exprime les valeurs en pour 10 000 mots au dessous de 2 000 un mot sur 5 les deux textes sont crits dans un m me genre par un seul auteur la m me poque et sur des th mes proches entre 2 000 et 2 500 l
27. n superposant ces deux textes et en comptant le nombre de mots diff rents zones gris es dans le sch ma ci dessous A B Le calcul est op r de la mani re suivante Soit N et N longueurs de A et B en mots tokens V et V le nombre de mots diff rents ou vocables types c est l tendue du vocabulaire F et F le nombre d apparitions d un vocable i dans les textes A et B Si les deux textes ont la m me longueur leur distance absolue est DDam Fa F avec Na No ie A B Et leur distance relative gt Fia Fo 2 Drela n 2 N N a Pour tous les vocables appartenant A et ou B on calcule la diff rence absolue de leurs fr quences et on fait la somme de ces diff rences Cette somme poss de les propri t s d une distance euclidienne longueur du segment de droite unissant deux points Cet adjectif signifie conforme la g om trie d Euclide par un point il ne passe qu une parall le une droite situ e hors de ce point Les propri t s d une distance euclidienne sont l identit la distance d un point lui m me est nulle la sym trie le r sultat est le m me que l on mesure AB ou BA et lin galit triangulaire le chemin direct entre A et B est toujours plus court qu en passant par un point C non situ sur le segment AB Ces propri t s permettent d op rer des classifications fiables Comment proc der quand les deux
28. nsit s tr s diff rentes En revanche Corneille et Moli re en ont cinq en commun en gras dont les trois premi res dans le m me ordre et avec des densit s voisines en italiques Etant donn le nombre des combinaisons possibles la probabilit pour qu une telle co ncidence survienne au hasard est infinit simale notre connaissance il existe un seul cas comparable dans les 4 derniers si cles de litt rature fran aise tableau 3 Depuis huit ans personne n a pu en trouver un autre concernant deux auteurs diff rents Il faut donc admettre que le cas Moli re Corneille est unique dans l histoire litt raire Tableau 3 Les principaux groupes verbaux chez Ajar et Gary fr quence pour 10 000 mots Ajar F Gary F vouloir dire 7 20 vouloir dire 5 80 pouvoir tre 4 90 pouvoir tre 3 62 pouvoir faire 4 40 pouvoir faire 2 97 devoir tre 3 10 devoir tre 2 39 aller faire 2 90 aller faire 2 20 pouvoir vivre 2 70 devoir avoir 2 13 laisser tomber 2 30 pouvoir dire 2 13 devoir avoir 2 10 laisser tomber 1 87 aller voir 2 00 laisser aller 1 55 devoir faire 1 80 faire passer 1 49 Autre indice int ressant le sens sp cifique que chaque auteur donne aux principaux mots qu il emploie Gr ce l tude des r seaux s mantiques nous pouvons affirmer que chez Corneille et Moli re les principaux vocables ont le m me sens ou plut t que ceux de Moli re s
29. pour Richelieu en 1634 n 15 et 16 Corneille Le Menteur et la Suite du Menteur 1642 et 1643 n 34 passages de Psych crits par Corneille n 35 passages de Psych attribu s par P diteur Moli re n 36 prologue de Psych crit par Quinault n 43 Dom Garcie pr sent par Moli re Cet arbre isole clairement trois ensembles en bas les pi ces de Corneille au milieu les pi ces en vers pr sent es par Moli re et en haut avec une dispersion plus grande les pi ces en prose On retrouve les anomalies suivantes en bas les contributions respectives de Corneille et de Moli re une m me pi ce Psych se rejoignent avec Dom Garcie de Navarre pr sent par Moli re et avec le troisi me acte de la Com die des Tuileries crite par Corneille pour le Cardinal Richelieu en 1634 soit 37 ans avant Psych au milieu des pi ces en vers de Moli re figurent les deux Menteurs de Corneille La chose est d autant plus surprenante que les Menteurs ont t cr s 15 ans avant Etourdi premi re pi ce en vers de Moli re et 30 ans avant les Femmes savantes Ceci confirme donc les d ductions tir es de l examen direct de la matrice des distances Psych et Dom Garcie deux com dies h ro ques pr sent es par Moli re sont anormalement proches de celles de P Corneille toutes les autres com dies en vers pr sent es par Moli re auxquelles viennent s ajouter Dom Juan et l Avare
30. re quivoque qui pour me divertir ma que la salet Mme de S vign ouvrait sa porte de nombreux artistes mais elle n a jamais re u Moli re chez elle alors qu elle citait souvent ses pi ces Plusieurs contemporains dont Boileau et PAbb d Aubignac ont clairement d sign les fr res Corneille comme tant des plumes mercenaires A trois reprises P Corneille a t explicitement d sign comme tant l auteur de trois pi ces pr sent es par Moli re En 1662 l diteur Quinet qui tait l un des diteurs de Corneille indique que le D pit amoureux est de sa main En 1670 Robinet crit dans Gazefte rim e du 22 novembre On donne de Corneille sa B r nice sans pareille sur le th tre de Moli re et son charmant Bourgeois gentilhomme En 1671 l diteur de Psych indique que cette pi ce a t versifi e au trois quarts par P Corneille Enfin on peut signaler quelques faits tonnants En 1658 35 ans Moli re n avait encore son actif que trois m chantes farces Alors il s journe quelques mois Rouen ville o r sidaient les fr res Corneille qui l introduisent la cour de Louis XIV A partir de ce moment Moli re se met produire des chefs d uvre sp cialement partir de 1662 date de l installation Paris des fr res Corneille Quant ceux ci ils semblent avoir fait face ais ment au moins jusqu en 1673 aux charges normes n cessaires pour tablir
31. sont aussi anormalement proches des deux Menteurs de Corneille Dans Phistoire litt raire fran aise de ces quatre derniers si cles on ne trouve aucun autre exemple de double croisement entre deux uvres du moins quand les deux auteurs sont effectivement diff rents Cela est confirm par deux autres indices 10 Deux autres indices Les combinaisons de mots les plus fr quents employ es par Corneille et Moli re r v lent les m mes proximit s entre ces deux auteurs suppos s tableau 2 Tableau 2 Les combinaisons pseudo auxiliaire infinitif chez Corneille Moli re et Racine fr quence pour 100 000 mots P Corneille Moli re Racine Syntagmes F Syntagmes F Syntagmes F faire voir 33 8 faire voir 31 5 aller voir 12 0 pouvoir tre 18 8 pouvoir tre 25 5 pouvoir voir 9 6 pouvoir faire 18 4 pouvoir faire 25 5 faire entendre 9 0 faire na tre 13 9 vouloir dire 24 9 pouvoir faire 8 4 pouvoir voir 13 4 vouloir faire 19 5 aller chercher 7 8 devoir tre 12 7 pouvoir dire 14 5 faire parler 7 8 pouvoir souffrir 10 8 pouvoir avoir 13 7 pouvoir tre 7 8 vouloir faire 9 9 l aller faire 13 2 venir chercher T2 faire conna tre 9 6 avoir faire 13 2 faire clater 6 6 devoir faire 8 7 pouvoir voir 12 3 falloir partir 6 6 Racine ne partage avec Corneille et Moli re que trois combinaisons soulign es pouvoir voir pouvoir faire et pouvoir tre mais avec un classement et des de
32. t 1660 Prose 0 341 0 331 0 327 M decin volant avant 1660 Prose 0 310 0 293 0 302 L tourdi 1658 Vers 0 205 0 206 0 269 D pit amoureux 1658 Vers 0 215 0 212 0 270 41 Pr cieuses ridicules 1660 Prose 0 315 0 314 0 314 42 Sganarelle ou le cocu imagin 1660 Vers 0 259 0 253 0 293 45 Dom Garcie de Navarre 1661 Vers 0 280 0 273 0 359 44 L cole des maris 1661 Vers 0 223 0 217 0 279 45 Les f cheux 1661 Vers 0 248 0 248 0 306 46 L cole des femmes 1662 Vers 0 226 0 217 0 261 47 Critique de l cole des femmes 1663 Prose 0 323 0 319 0 340 48 L impromptu de Versailles 1663 Prose 0 321 0 316 0 323 49 Mariage forc 1664 Prose 0 322 0 302 0 320 50 Princesse d Elide 1664 Vers Prose 0 251 0 243 0 314 51 Le Tartuffe 1664 Vers 0 242 0 228 0 275 52 Dom Juan 1665 Prose 0 259 0 248 0 281 55 L amour m decin 1665 Prose 0 292 0 289 0 287 54 Le Misanthrope 1666 Vers 0 252 0 234 0 283 55 M decin malgr lui 1666 Prose 0 298 0 289 0 296 56 M licerte 1666 Vers 0 257 0 250 0 322 57 Le sicilien ou l amour peintre 1667 Prose 0 277 0 260 0 301 58 Amphytrion 1668 Vers libres 0 253 0 256 0 297 59 Georges Dandin 1668 Prose 0 292 0 279 0 292 60 L Avare 1668 Prose 0 256 0 244 0 270 61 M de Pourceaugnac 1669 Prose 0 292 0 283 0 285 62 Amants magnifiques 1670 Prose 0 282 0 279 0 329 63 Bourgeois gentilhomme 1670 Prose 0 294 0 280 0 286 64 Foutberies de Scapin 1671 Prose 0 269 0 263 0 281 65 Comtesse d Escarbagnas
33. tes celles constat es entre les pi ces en vers de Moli re et les deux Menteurs de Corneille ou entre Dom Gare et les com dies h ro ques de Corneille alors que toutes ces pi ces sont s par es par un laps de temps important que les th mes sont toujours diff rents et que le genre com die en vers est nettement moins contraignant que celui de la grande trag die en alexandrins Le XVIIe fournit d autres exemples La derni re colonne de l annexe 3 montre que toutes les distances entre les Plaideurs unique com die de Racine et toutes les com dies pr sent es par Moli re sont sup rieures 25 alors qu elles sont contemporaines Les Sophonishe de Mairet et de Corneille se distinguent tr s bien alors qu ils ont travaill dans le m me genre sur le m me th me les m mes v nements les m mes personnages en suivant la m me trame narrative Quand Quinault Corneille et Moli re travaillent ensemble sur Psych Quinault se distingue tr s 1 Afin de souligner que cette chelle est valable pour les textes dont les longueurs sont en moyenne de 10 000 mots et comprises entre 4 000 et 25 000 mots environ comme cela est indiqu dans notre article de 2001 bien des deux autres qui sont trop proches pour tre deux auteurs diff rents Les com dies de Quinault se distinguent tr s bien de celles de Corneille et de Moli re etc Conclusion de toutes ces exp riences les distances entre des textes appartenant un m me
34. textes ont des longueurs diff rentes tout en conservant ces propri t s Supposons que B soit plus long que A N lt N Nous proposons de r duire B la longueur de puis de superposer cette r duction B sur le texte A Consid rons un vocable i de fr quence F dans B Son esp rance math matique dans B est Na No Dans la formule 1 en rempla ant la fr quence de chacun des vocables de B par cette E au Fi U avec U esp rance math matique on obtient la distance intertextuelle absolue 3 Da B gt Fia E iaw ie A B La distance relative est gt Fia E iaw 4 Drel s P gt Fia gt E iaw icA ieB Cette derni re mesure varie uniform ment entre un minimum de z ro distance nulle m mes vocables et m mes fr quences relatives et un maximum de 1 tous les mots sont diff rents Elle peut aussi tre exprim e en o etc Cette mesure relative permet de comparer les r sultats obtenus sur un grand nombre de textes de longueurs diff rentes Remarques et limites du calcul A ce stade de l expos trois remarques s imposent ce calcul exige une stricte standardisation des graphies Sinon les textes seront class s selon les conventions graphiques diff rentes auxquelles ils ob issent par exemple les majuscules initiales de vers diff rencieront tous les po mes de tous les textes en prose Il faut galement lemmatiser les

Download Pdf Manuals

image

Related Search

Related Contents

Infocus PRJ-WALLKIT-11 project mount  Formation Debian GNU/Linux  Nombre de la asignatura - Instituto Tecnólogico de La Laguna  Pocket Projektor  Le Publiphobe n° 23  Samsung AVXC2H056EE Instrukcja obsługi  DNA増幅試薬 D    Cube LED Accu Outdoor V 3.2 (Mod. 09-01-02)  Manuale GENIUS 10  

Copyright © All rights reserved.
Failed to retrieve file