Home
Isaac-These-Finale
Contents
1. Bruno Bachimont d montre que cette hi rarchie a une structure d arbre l h ritage multiple est interdit dans la mesure o l on associe n cessairement aux notions d une fratrie et par cons quent aux notions qui les sp cialisent des s mes sp cifiques qui sont en opposition 88 3 2 Aider la compr hension de la substance des descriptions Par exemple si l on veut fixer ces principes pour les notions qui sp cialisent directement la notion Personne dans l ontologie du cyclisme on obtient le tableau 3 2 Personnel Epreuve SWP c est un individu humain sws une propri t pr cise la raison de la personne sur les lieux de l preuve DWS est accr dit par la direction de l preuve DWP joue un r le particulier par rapport l preuve la personne est accr dit e par la direction de celle ci Personnel quipe SWP c est un individu humain sws une propri t pr cise la raison de la personne sur les lieux de l preuve DWS est employ par une des quipes participantes DWP joue un r le particulier par rapport l preuve la personne est employ e par une quipe cycliste participante l preuve Spectateur SWP c est un individu humain sws une propri t pr cise la raison de la personne sur les lieux de l preuve DWS mest ni accr dit par la direction de l preuve ni employ par une des quipes participantes DWP joue un r le par
2. C est notamment cette tape que l on va pouvoir d finir les relations par la donn e de leur arit et de leur domaine ce qui les associera de fait des produits cart siens de r f rences de concepts La comparaison des extensions permet de d finir une relation d h ritage extensionnelle entre les concepts un concept sera subsum par un autre si et seulement si son extension est incluse dans celle de son parent Il faut noter que la hi rarchie de subsomption obtenue peut tre dif f rente de celle construite lors de la normalisation s mantique En effet les relations d h ritage d finies dans l ontologie diff rentielle tiennent toujours ici mais l ajout de nouveaux n uds 16Leurs extensions sont disjointes et leur union est gale l extension du concept qui les subsume La relation d identit entre deux notions est directement transposable du domaine linguistique au domaine 125 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique tout comme le passage d une relation de sp cialisation bas e sur des similarit s et des diff rences exclusives une relation interpr t e sur une base d inclusion ensembliste va modifier la structure arborescente Si dans l ontologie r f rentielle les notions n tant pas unies par la relation de sub somption s excluent mutuellement leurs transcriptions en concepts formels peuvent admettre des extensions qui ont
3. normalisation s mantique formalisation op rationnalisation Les deux derni res on va le voir sont rapprochables de celles propos es dans les autres m thodologies mais la premi re induit un engagement qui donne l ensemble du processus la l gitimit m tier qui lui manquait L expos qui suit est inspir de nos travaux pr sent s dans Isa01 TI02 le rappel m thodologique y tait en effet illustr d exemples et de r flexions com pl mentaires d gag s des efforts de mise en uvre et d application qui ont eu lieu tout au long de notre th se normalisation formalisation op rationnalisation Oo quipe oO oO O seis class def PersonnelEquipe subclass of Personne O C1 oo O class def PersonnelTour Termes du I subclass of Personne class def Spectateur d omaine o subclass of Personne sprinter coureur SWP covered Personne by cycliste SWS PersonnelTour y DWS PersonnelEquipe DWP SWP nm Spectateur SWS Yx Personne x PersonnelTour x QE DWS u PersonnelEquipe x en DWP U Spectateur x sp cification en langage op rationnel axiomes ontologie diff rentielle ontologie r f rentielle ontologie computationnelle Fic 4 1 Les tapes de la m thode de construction d ontologies de Bruno Bachimont extrait de notre rapport Isa01 Normalisation s mantique L objectif de ce
4. 209 Bibliographie DB00 DECHILLY T et BACHIMONT B Une ontologie pour diter des sch mas de description audiovisuels extension pour l inf rence sur les descriptions In Actes de la conf rence IC 2000 Journ es francophones d Ing nierie des Connaissances Toulouse 2000 DDH 04 DASMAHAPATRA S DUPPLAW D Hu B Lewis H LEWIS P et SHADBOLT N Facilitating multi disciplinary knowledge based support for breast cancer screening International Journal of Healthcare Technology and Management 2004 Den04 Denny M Ontology Tools Survey Revisited http www xml com pub a 2004 07 14 onto html July 2004 Des87 DESCL S J P R seaux s mantiques La nature logique et linguistique des relateurs Langages 87 1987 Des90 DESCL S J P Languages applicatifs langages naturels et cognition Herm s Paris 1990 Dev99 DEvVEDZIC V Ontologies Borrowing from Software Patterns ACM Intelligence Magazine 10 3 1999 DHHSO1 DEGEN W HELLER B HERRE H et SMITH B GOL Towards an Axiomatized Upper Level Ontology In Formal Ontology and Information Systems FOIS 2001 Ogunquit Maine USA 2001 Dji00 DyrouaA B Mod lisation Informatique d une base de connaissances lexicales DiSSC R seaux polys miques et Sch mes S mantico Cognitifs Th se de doctorat Universit de Paris IV Sorbonne 2000 Dom98 DOMINGUE J Tadzebao and WebOnto Discussing Browsing and E
5. 2Notre honn tet nous poussera tout de m me reconna tre qu au moment de la cr ation des ontologies dans OPALES l outil de Fr d ric F rst n tait pas encore disponible Et que la sp cification des r gles de raisonnement a donc d se faire l aide d une interface autrement plus frustre http www daml org 135 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique courants Les exp rimentations que nous d taillerons au chapitre 5 montrent qu il est tout fait possible de parvenir des compromis acceptables en la mati re Nous avons donc vu dans cette section comment il tait possible d utiliser une m thodologie proposant v ritablement une assistance la cr ation et l organisation du contenu conceptuel des notions ontologiques tel que ce contenu est con u et compris dans le domaine lui m me La m thodologie propos e par Bruno Bachimont offre en effet un cadre complet permettant de concilier la d finition de primitives de repr sentation de connaissances au niveau naturel et leur formalisation dans un cadre logique Nous nous sommes donc tourn vers cette proposition que nous avons essay de mettre en uvre Notre contribution a un double aspect m thodologique et technique Nous nous sommes ef forc travers son application des ontologies concr tes de d terminer quelles taient les formes d assistance que l on pouvait produire pour faciliter le trav
6. 5 impl mentation construction d un mod le op ratoire utilisable par un ordinateur 6 maintenance mise jour de l ontologie en cas de besoin Dans l id al la formalisation et l impl mentation doivent tre des tapes de traduction quasi automatique du mod le qui les pr c de le v ritable effort de construction a lieu pendant la conceptualisation Celle ci repose sur la cr ation de plusieurs structures appel es repr sentations interm diaires Tout d abord il faut cr er un glossaire de termes que l on divise en concepts et verbes Les concepts vont devoir tre regroup s en arbres de classification de concepts et les verbes servir cr er des diagrammes de relations binaires partir de ces deux structures on va construire un dictionnaire des concepts qui regroupe toutes les informations concernant lesdits concepts nom et synonymes instances attributs de la classe et de ses instances relations rattach es au concept D autres structures vont galement appara tre table des relations binaires table des attributs d instances table des attributs de classes table des axiomes logiques table des constantes table des formules pour calculer des valeurs d attributs arbres de classification des attributs et table des instances Toutes ces structures destin es contenir d abondantes descriptions informelles des objets repr senter dans le SBC sont suppos es cerner au plus pr s la c
7. Explique y z Explique x z Vz y z Objet AV x Objet AV y A Personne z A Contient x y A aPourParticipant y z aPourParticipant x z FIG 2 13 Quelques axiomes logiques pour une ontologie de l audiovisuel Ainsi si un objet audiovisuel a comme trait saillant un autre objet audiovisuel proc d de r alisation l ment de contenu visuel ou sonore etc qui explique un sujet donn on pourra en d duire que le premier objet contribue lui aussi l explication de ce sujet Il en va de m me si par exemple un programme contient une s quence expliquant un sujet donn ou si un objet a pour participant une personne qui explique un sujet Finalement on trouve dans ces exemples un axiome l mentaire de propagation de la relation de participation si une personne participe une s quence contenue dans un programme on peut en d duire qu elle fait galement partie des participants de ce programme elle pourra figurer dans son g n rique Avec l index de notre exemple on peut d s lors r pondre une requ te comme Re cherche d une mission qui explique le fonctionnement du coeur Le moteur d inf rence g n ralisera Interview en S quence et appliquera la r gle de composition entre les relations 1911 est noter qu explique est une relation qui peut aussi bien s appliquer une personne qu un objet audiovisuel On consid re de fait que les deux peuvent d liv
8. pr cise organisation des propri t s par un lien hi rarchique similaire rdfs subPropertyOf assignation de domaines et co domaines aux propri t s rdfs domain et rdfs range permettant de restreindre leur application des classes d objets particuli res De fait les fonctionnalit s de RDFS le placent un niveau d expressivit comparable celui des supports simples de graphes conceptuels que nous avons pr sent s en section 2 2 2 Des travaux comme Bag03 essaient d ailleurs de rendre compte des similarit s existantes tant du point de vue des descriptions autoris es que des inf rences effectu es Le code 5 2 donne un bref exemple d utilisation de RDFS pour notre exp rimentation exemple qui d finit une classe et une propri t que nous connaissons d j bien lt rdfs Class rdf about Interview gt lt rdfs label xml lang en gt Interview lt rdfs label gt lt rdfs subClassOf rdf resource DialogSequence gt lt rdfs Class gt lt rdf Property rdf about hasParticipant gt lt rdfs label xml lang en gt hasParticipant lt rdfs label gt lt rdfs subProperty0f rdf resource AVObjectXPerson_Conditions gt lt rdfs domain rdf resource AVObject gt lt rdfs range rdf resource Person gt lt rdf Property gt CODE 5 2 D finitions de la classe Interview et de la propri t hasParticipant en RDFS Pour stocker et interroger les ontologies et les assertions nous utilisons l arch
9. GB04 FILLMORE C J The Case for Case In BACH E et HARMS R diteurs Universals in Linguistic Theory Holt Rinehart amp Winston 1968 F RST F Contribution l ing nierie des ontologies une m thode et un outil d op rationalisation Th se de doctorat Universit de Nantes 2004 FREGE G crits logiques et philosophiques ditions du Seuil 1971 FENSEL D VAN HARMELEN F HORROCKS I McGuiness D L et PATEL SCHNEIDER P F OIL An Ontology Infrastructure for the Semantic Web IEEE Intelligent Systems 16 2 2001 GANGEMI A et BORGO S diteurs Workshop on Core Ontologies in Ontology En gineering 14th International Conference on Knowledge Engineering and Knowledge Management EKAW 2004 Whittlebury Hall Northamptonshire UK 2004 CEUR online Proceedings http ceur ws org Vol 118 GBvH03 GEURST J BOCCONI S VAN OSSENBRUGGEN J et HARDMAN L Towards GCB04 GCG94 Ontology driven Discourse from Semantic Graphs to Mulmedia Presentations In International Semantic Web Conference ISWC 2003 Sanibel Island Florida USA 2003 GANGEMI A CATENACCI C et BATTAGLIA M Inflammation Ontology Design Pattern an Exercise in Building a Core Biomedical Ontology with Descriptions and Situations In PISANELLI D M diteur Ontolgies in Medicine IOS Press Amster dam 2004 GUARINO N CARRARA M et GIARETTA P Formalizing Ontological Commit ments In National Conference
10. GUARINO N MASOLO C et VETERE G OntoSeek Content Based Access to the Web IEEE Intelligent Systems 14 3 1999 GANGEMI A PISANELLI D M et STEVE G An Overview of the ONIONS project Applying Ontologies to the Integration of Medical Terminologies Data and Knowledge Engineering 31 2 1999 GRUBER T A Translation Approach to Portable Ontology Specifications Knowledge Acquisition 5 2 1993 GRUBER T Towards Principles for the Design of Ontologies Used for Knowledge Sharing International Journal of human Computer Studies 43 5 6 1995 GAUCH S et SMITH J B An Expert System for Automatic Query Reformulation Journal of the American Society of Information Scientists 44 3 1993 GENEST D et SALVAT E A platform allowing typed nested graphs How Co GITo became CoGITaNT In ICCS 98 6th International Conference on Conceptual Structures Montpellier France 1998 GUARINO N Concepts Attributes and Arbitrary Relations Some linguistic and ontological criteria for structuring knowledge bases Data and Knowledge Engineering 8 3 1992 GUARINO N The Ontological Level In CASATI R SMITH B et WHITE G diteurs Philosophy and the Cognitive Sciences Philosophia Verlag Mtinich 1995 GUARINO N Formal Ontology and Information Systems In GUARINO N diteur Formal Ontology and Information Systems FOIS 98 Amsterdam 1998 IOS Press GUARINO N Some Ontological Principles for Des
11. Nous rappelons que nous nous sommes plac dans un tel cadre qui apporte les contraintes que nous nous sommes attach prendre en compte depuis le d but de ce travail de th se Nous soul verons de fait en conclusion de cette th se le probl me de la g n ricit des solutions retenues en particulier en ce qui concernent celles voqu es dans ce chapitre Il ne semble par exemple pas tout fait irrationnel qu une ontologie m me si elle n est pas suppos e tre employ e dans un contexte d indexation ne perdra rien tre con ue en accord avec des compr hensions m tier 112 4 2 Des propositions pour rationaliser la conception des ontologies coh rentes les sp cifications doivent respecter des crit res qui leur garantissent un ni veau satisfaisant de cr dibilit et donc de partageabilit tout en restant en accord avec les sp cifications applicatives d coulant notamment des contraintes de compr hension et d utilisation Comme cela a t voqu dans maints travaux relatifs au sujet GFC04 Bac04a il n est peut tre pas possible d envisager le guide m thodologique d finitif en ce qui concerne la conception des ontologies une activit qui s apparente plus un savoir faire d ing nierie qu une science Mais cela ne doit pas nous emp cher de proposer des r flexions solides quant des possibilit s concr tes d am lioration de ce processus Nous allons dans un premier temps o
12. de Guarino dans la mesure o l expression linguistique est cens e rendre compte d une dimension cognitive dont rel vent galement les mondes possibles utilis s par l analyse ontologique formelle Kri82 Nous retrouvons concr tement l analyse de Bruno Bachimont qui dans Bac01 expliquait que les deux m thodes si elles avaient des modalit s d action diff rentes l une effectuant un nettoyage a posteriori l autre construisant plut t que filtrant un existant r pondaient toutes les deux une objectif de contr le De fait dans le cas de notre coureur cycliste nous n avons pas renonc l analyse formelle nous l avons seulement situ e dans une application bien particuli re en limitant les mondes possibles prendre en compte In fine cette analyse permet toujours de confirmer par des moyens formels et formalis s un engagement ontologique m tier Cela est d autant plus int ressant au niveau de cet engagement ontologique contract si les choix de mod lisation qui d pendent n cessairement dans notre cas d une application pr cise se font l encontre de ceux qui ont t faits pour des ontologies de plus haut niveau 5 2 2 OPALES OPALES a t le premier et le plus important des v ritables cadres applicatifs pour notre th se Pour rappel le projet visait la description de documents audiovisuels relatifs deux points de vue particuliers la petite enfance e
13. des uvres con ues ind pendamment d une r f rence un courant et que ce descripteur ne doit tre employ que si l uvre est post rieure 1945 De m me dans la branche audiovisuelle la note d application de best of d signe un produit obtenu partir d extrait d une m me collection ce qui l oppose doublement b tisier l absence de note d application pour celui ci laisse entendre que la provenance de ses l ments est sans importance On peut finalement mentionner l exemple du descripteur remontage int ressant double titre 79 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques on affaire un terme sp cialis qui est interpr table correctement du fait de sa situation dans la port e de audiovisuel le m me terme sous une notion li e la m canique aurait une interpr tation tout fait diff rente le fait que cette notion soit plac e sous un type de produit conjugu la note d application l ve une ambiguit qui subsisterait m me dans le domaine de l audiovisuel puisque le terme peut dans ce domaine d signer la fois une action et le r sultat de cette action poque artistique art contemporain art brut NA Productions n es spontan ment sans r f rences aux coles courants NH A partir de 1945 audiovisuel produit audiovisuel best of NA Morceaux choisis d une collection UP floril ge b tisier remontage N
14. et donc g rable 104 8 8 Assister la formulation des descriptions par Vutilisateur d op ration de d composition des objets introduits et d ajouts de nouveaux extraits de patrons En l occurrence la s quence index e a t d compos e en deux sous objets chacun tant d crit son tour selon les indications apport es par le patron R alisationArchitecturale estRepr sent Par Sequence Image aPourTraitSaillantC ontenant DiscoursHistorique Fic 3 14 Un index obtenu a partir du patron eau et audiovisuel Grace aux patrons d indexation un indexeur dispose d une structure de connaissances acces sible explicite globalement pertinente pour le point de vue applicatif retenu Les patrons sont un moyen de prescrire une indexation standard ce qui augmente le rendement de l ensemble du syst me Et l on prend en compte correctement et de mani re flexible les besoins li s au contexte applicatif ce qui am liore la pertinence du syst me De fait dans une analyse de la conception et de l usage des ontologies dans les syst mes d information UG96 a introduit les questions de comp tence comme moyen de sp cifier et d valuer les connaissances qu elles sont amen es contenir En premi re analyse les ontologies doivent videmment fournir le vocabulaire et les connaissances de raisonnement n cessaires au bon fonctionnement du syst me d indexation Mais ce bon fo
15. m me de r soudre ce probl me dans le cadre d un SBC Comment garantir une interpr tation constante et correcte des index cr s avec les primi tives introduites Peut on contr ler l utilisation du langage par les utilisateurs Peut on garantir une exploitation des connaissances par le syst me qui soit coh rente avec ce que l on attend dans le cadre interpr tatif d fini par l application En ce qui concerne le contr le des traitements effectu s par le syst me par exemple on se doute qu on peut cr er des sp cifications formelles riches et adapt es des traitements qui r pondent des besoins pr cis Encore faut il que dans une approche base de connaissances ces traitements puissent tre sp cifi s de mani re d clarative au niveau des l ments concep tuels rencontr s dans le domaine plut t qu celui des structures informatiques concr tes manipul es par le syst me 2 3 Ontologies contr le et traitements pour des syst mes d in dexation et de recherche De fait l emploi de SBC et d ontologies apportent des r ponses toutes ces questions Plus que constituer un simple vocabulaire une ontologie a pour ambition de servir de sp cification pour un syst me de repr sentation et de manipulation de connaissances en accord avec une vue abstraite du domaine applicatif accord qui lui conf rerait une l gitimit au regard des usages 49 Chapitre 2 Ontologies et SBC pour la desc
16. premi re vue para tre semblables celles des patrons n ont pas le m me emploi Si on sait que l interview d un expert est une interview auquel participe au moins un expert cela ne donne pas d indication sur la mani re d employer pr cis ment ce concept On pourrait par exemple croire qu il est souhaitable d introduire la description d un expert pour chaque occurrence alors que l information r ellement pertinente pour l application envisag e sera la donn e de ce que l interview contribue clarifier pour reprendre un des points de vue applicatifs introduits dans OPALES Les d finitions des concepts et relations donnent les moyens l utilisateur et au syst me de comprendre et d exploiter les l ments des index et par l m me de faciliter leur emploi lors de la cr ation des index mais elles ne prescrivent pas r ellement de configuration pertinente pour l application D ailleurs rattach s de fait aux concepts et au relations qu ils contribuent d finir ces axiomes ne peuvent clarifier plus que la structure du contexte locall de ces notions Alors que le patron d indexation a lui vocation repr senter le contexte global d emploi des notions de l ontologie Il n y a donc pas de contradiction ni de redondance entre ces deux ressources Cela nous am ne 4 la discussion sur la quantit de patrons n cessaire pour un seul et m me point de vue applicatif De fait cela d pend de la pr cision de l appl
17. Le premier de ces moyens est celui du contr le du vocabulaire employ dans les descriptions 1 3 2 Contr ler le vocabulaire des index La d finition de l indexation on l a entr apergu prescrit l utilisation d un langage documen taire Ce langage peut videmment tre le langage naturel mais dans bien des cas on pr f re utiliser un langage norm qui permettra aux index de prescrire plus pr cis ment une interpr tation du contenu du document Les langages documentaires L usage cf Wal99 distingue les langages documentaires affect s la recherche par sujets des listes d autorit s qui concernent surtout les champs documentaires o apparaissent des noms propres ou des fonctions que peuvent tenir ces personnes Les listes d autorit s sont de simples catalogues de mots dont le but est souvent de fournir une r f rence l utilisateur qui cherche v rifier la possibilit de l emploi d un terme ou d une graphie donn e pour un nom propre ou une abr viation Les langages documentaires sont eux d finis comme des langages artificiels constitu s de repr sentations de notions et de relations entre ces notions destin s dans un syst me documentaire formaliser les donn es contenues dans les documents et dans les demandes des utilisateurs AFN amp 87 Parmi ces langages documentaires on trouve des langages classificatoires pr coordonn s les unit s documentaires sont les sujets que
18. Le thesaurus propose donc un moyen efficace et relativement simple il utilise des termes connus des utilisateurs et leur prescrit naturellement une interpr tation en restituant leur con texte d interpr tation de normer le vocabulaire des index de mani re assurer la continuit de leur interpr tation tout au long de la cha ne documentaire Dans les situations simples o l index associ au document ne contient pas toutes les notions qu on peut l gitimement associer ses l ments le syst me peut m me prendre en charge de mani re plus ou moins transparente une partie des reformulations qui assurent un bon acc s au contenu des documents index s N anmoins lorsque Tudhope et d autres montrent comment le thesaurus peut am liorer le fonctionnement du syst me documentaire ils pointent aussi sur une de ses lacunes les plus importantes Les relations entre termes apport es par le thesaurus ne sont en effet pas suffisantes pour obtenir une structuration transversale suffisamment fine du champ s mantique dont le vocabulaire est donn ainsi que des index que l on construit en utilisant ce vocabulaire Par exemple il peut tre souhaitable d exploiter des relations autres que les relations hi rarchiques comme les relations m r ologiques entre tout et partie les relations de localisation de causalit ou certaines autres plus sp cifiques un domaine applicatif Le premier probl me est que les thesaurus peuven
19. Universit Paris IV Sorbonne Ecole doctorale Concepts et Langages THESE pour l obtention du grade de DOCTEUR DE L UNIVERSITE PARIS IV SORBONNE Discipline Informatique pr sent e et soutenue publiquement le 8 d cembre 2005 par Antoine Isaac Conception et utilisation d ontologies pour l indexation de documents audiovisuels Devant le jury compos de Rapporteurs Mme Sylvie Lain Cruzel Mr Gilles Kassel Examinateur Mme Arlette Boulogne Encadrant INA Mr Bruno Bachimont Co directeur de th se LaLICC Mr Philippe Laublet Directeur de th se Mr Jean Pierre Descl s Laboratoire Langages Logiques Informatique Cognition Communication UMR CNRS 8139 Institut National de l Audiovisuel LaLICC Mis en page avec la classe thloria Remerciements Mes remerciements vont tout d abord aux deux personnes qui ont assur l encadrement quo tidien de cette th se Bruno Bachimont et Philippe Laublet En plus de remplir brillamment leur fonction de pourvoyeurs d id es de relecteurs rigoureux ils ont su encourager un doctorant parfois sceptique aller jusqu au bout de son effort de recherche ce qui n est pas rien Je remercie galement mon directeur de th se Jean Pierre Descl s pour son ouverture d es prit Il m a en effet permis de suivre des pistes qui s cartaient des th ories qu il s attache d fendre habituellement Merci ensuite Gilles
20. co occurrence poids statistique des mots recherch s dans la notice etc La forme textuelle associ e de tels outils permet finalement d envisager des modes d acc s non lin aires la description du contenu du document audiovisuel La notice n est pas un objet temporel ou iconique on peut la structurer en un certain nombre de champs voir tableau 1 1 dont les valeurs seront accessibles de mani re ind pendantes On peut ainsi concentrer la re cherche sur des aspects donn s en tant s r d acc der directement au r sultat sans souffrir des contraintes de lecture impos es par le support audiovisuel Notice analyse documentaire et indexation La notice est ce quoi acc de en premier lieu l utilisateur lors de la recherche documentaire A ce titre elle doit pouvoir fournir le maximum d informations qui puissent aider son lecteur juger de la pertinence du document repr sent A VINA on retrouve plusieurs niveaux de description suivant l importance accord e au do cument dans la politique d analyse du fonds documentaire Pour simplifier et se ramener un grille g n rique adaptable aux pratiques couramment rencontr es dans le monde documentaire on peut retenir trois niveaux l identification le catalogage et l indexation Pic96 L identifi cation concerne les informations permettant une gestion basique du document son titre son producteur les donn es de programmation etc Le catalogage d veloppe
21. effor ant de s abstraire des applications particuli res alors que nous consid rons que cet aspect applicatif est au contraire constitutif du besoin de mod lisation et doit donc conduire l obtention d ontologies sp cifiant des significations en vue d applications qui m me si on en consid re un large ventail pr existent 119 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique OntoClean Les propositions de Nicola Guarino GW02 issues d un tr s long effort de re cherche dont Gua92 GCG94 GW00b GW00a ou GWO01 rendent compte ont tent de rem dier au probl me de la pertinence du contenu des ontologies en essayant de construire un cadre rigoureux d analyse formelle qui priviligierait certaines formes d organisation des hi rar chies ontologiques et en disqualifierait d autres Ces travaux s int ressent en effet au nettoyage des taxonomies qui sont souvent construites de mani re anarchique et en particulier utilisent abusivement la relation de subsomption Il s agit plus ici d une tape de correction int grer dans le processus de d veloppement des ontologies que d une m thode de construction compl te N anmoins les b n fices de l application de cette op ration peuvent tre tr s grands pour la clarification de ce qui a t sp cifi L id e est de s appuyer sur des propri t s formelles c est dire des propri t s qui sont supp
22. hui que le document audiovisuel tient une place importante n a rien d ori ginal Et de fait le document audiovisuel est un objet que l on peut consid rer pr sent comme en cours de banalisation Il est en tout cas de plus en plus r pandu que ce soit dans les espaces de diffusion publics la mutiplication des cha nes de diffusion t l visuelles en est un signe via des r seaux d espaces priv s mis en relation par des logiciels d change de donn es voir lessor r cent des r seaux d change peer to peer ou au sein de communaut s scientifiques qui l utilisent comme outil de travail les laboratoires impliqu s dans le projet OPALES sont dans ce cas Et assez souvent on ne le consid re plus que comme un objet de consommation courante en ou bliant qu il est en fait ins r dans un cycle de vie plut t complexe articul autour des tapes clef de production de diffusion et d archivage Auf00 En amont de sa r ception il y a la production et la diffusion tapes au cours desquelles on con oit et r alise un programme avant de l ins rer dans un processus de publication Ces deux tapes d finissent un contexte applicatif qu on ne peut n gliger le document audiovisuel est con u non seulement en fonction des savoir faire et des techniques rencontr s dans le monde de l audiovisuel mais aussi en fonction de l environnement dans lequel il sera diffus Dans le cas de l mission t l visuelle par exe
23. on peut en effet distinguer trois niveaux le niveau le plus haut upper level introduit les types les plus g n riques permettant de cat goriser les entit s du monde on y trouvera ainsi des concepts comme ObjetSpatial les entit s tangibles du monde ObjetTemporel les v nements ou processus ou bien encore des ElementDeDescription les propri t s que l on attribue des individus le niveau le plus sp cifique Bac04a le qualifie comme paratazique est celui qui pr sente les notions sp cifiques l application consid r e Dans une application d indexation ce seront les concepts et les relations effectivement utilis s pour cat goriser le plus finement possible les entit s du monde introduites dans les descriptions Dans le domaine de la petite enfance on trouvera par exemple les concepts M reAdoptive M reNourrissi re M reC libataire enfin il existe un niveau interm diaire Celui ci est sp cifique 4 un domaine mais introduit des cat gories plus g n rales qui structurent ce domaine Bac04a utilise expression de niveau structurant Ces notions sont celles qui sont utilis es pour d finir 4 et regrouper les notions plus sp cifiques du niveau de l application L hypoth se raisonnablel que nous faisons est que les notions utilis es dans le patron d in dexation rel vent de ce dernier niveau Cette hypoth se repose sur nos exp rimentations notam ment pour OPALES mais a
24. on rencontre parfois des ontologies qui s efforcent de verbaliser sommairement les expressions formelles complexes qui d finissent leur notions ou leur adjoignent des gloses textuelles classiques Cette approche est rationnellement justifi e puisque c est g n ralement la langue qui est utilis e dans les domaines d application d s qu il s agit d expliquer des faits N anmoins coup s de leur contexte des l ments isol s comme les tiquettes des notions ontologiques n ont pas de signification suffisamment d termin e on est toujours la merci des ph nom nes de polys mie par exemple Ce n est que lorsque le terme 2De fait ces concepts sont en opposition puisque les crit res de d finition permettent de les regrouper mais 7 1 comme on va le voir dans ce qui suit ce n est que pour mieux les opposer entre eux 86 3 2 Aider la compr hension de la substance des descriptions est immerg dans son contexte d application qu il trouve une interpr tation pr cise Il manque donc un effort de rationalisation s mantique qui peut garantir que l ontologie pourra prescrire des interpr tations la fois naturelles et s res Pour r pondre ce besoin Bruno Bachimont propose dans une m thodologie introduite dans le cadre du projet MENELAS ZC94 de contraindre l utilisateur un engagement s mantique munissant les primitives apport es par les ontologies d une signification m tier qui ait fai
25. vers la m thodologie de Bruno Bachimont qui introduit une phase de normalisation s mantique tablissant des notions d finies l aide des principes diff rentiels voqu s en section 3 2 2 Nous avons instrument cette m thode en r alisant un outil d dition articulable avec les principaux environnements de la communaut DOE S agissant de l obtention d ontologies qui prennent convenablement en compte nos proposi tions en mati re d assistance la structuration des index savoir les patrons d indexation nous avons observ qu il tait possible de reprendre des solutions base de patrons de conception ontologiques Nous avons repris la d marche d Aldo Gangemi qui consiste utiliser des patrons de conception d finis au niveau des ontologies fondamentales en fonction d usages g n riques Toutefois nous avons remarqu que leur sp cialisation directe est parfois insuffisante si l on veut capturer dans toute leur finesse les besoins des applications Pour r soudre ce probl me nous avons propos d introduire une articulation explicite entre patrons de conception et patrons d utilisation applicatifs articulation qui serait exploitable par le SBC utilisant l ontologie ainsi congue Au terme de cet effort m thodologique nous parvenons donc faire b n ficier le processus de conception d ontologie d une double l gitimit Tout d abord la conception prend bien en compte les pratiques et les
26. 3611 faut justement ici rappeler la diff rence entre la structure de l expression des connaissances ontologiques et la structure du contenu conceptuelle des descriptions La forme des axiomes ontologiques n est videmment pas l agencement des concepts et des relations dans les assertions effectivement produites au moyen de l ontologie 139 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique vis vis de la relation d accessibilit A son tour cette th orie sera sp cialis e en une th orie des r seaux de distribution o les n uds sont pr sent vus comme producteurs consommateurs ou interm diaires et o des flux d l ments transportables peuvent tre fournis aux consommateurs si ceux ci sont accessibles Finalement on obtiendra ainsi une th orie celles des circuits lec triques qui va fournir les concepts et relations de haut niveau pour toute ontologie abordant ce domaine munis d une axiomatisation adapt e BLS 00 introduit des m canismes semblables dans le cadre d ontologies g ographiques multi couches Les ontologies susceptibles d tre utiles dans ce domaine n cessitent en effet des connaissances issues de domaines sp cialis s on parle de couches multiples r seaux couver ture spatiale Pour faciliter la conception de tels artefacts Benslimane et ses coll gues pro posent de distinguer l int rieur de chaque couche le niveau fonctionne
27. 97 Un patron d indexation pour la description de soins sur les enfants 99 Sp cialisation d un patron d indexation en un index 100 Un index ne sp cialisant pas logiquement le graphe patron 100 Le patron d indexation du point de vue applicatif eau et audiovisuel gt 104 Un index obtenu partir du patron eau et audiovisuel gt 105 R gles de raisonnement d duisant des connaissances conformes un patron d in dexation d une structure de connaissance diff rente 107 vil Table des figures vili 3 16 4 1 4 2 4 3 4 4 4 5 4 6 4 7 4 8 4 9 4 10 4 11 5 1 5 2 5 3 5 4 5 0 5 6 9 7 5 8 5 9 5 10 5 11 5 12 5 13 R gle de raisonnement d duisant de nouvelles connaissances partir de celles d un patron d indexation eea ce ue Bee lee ARR eh Ve te 108 Les tapes de la m thode de construction d ontologies de Bruno Bachimont extrait de notre rapport ISA ss ate Oe Weta NA SIN EUR 124 Les principes diff rentiels de la notion PersonnelEquipe dans DOE 131 Structure du patron Constructeur employ dans Dev99 137 Patron de conception Descriptions amp Situations extrait de GM03 141 Sp cialisation du patron D amp S pour le domaine de l inflammation extrait de GCB04 142 Introduction de concepts g n raux de l audiovisuel suivant le patron de conception
28. Cependant le processus d adaptation du patron que ce soit des documents particuliers au moment de l indexation ou des besoins informationnels pr cis au cours de la recherche cr e une distance ind niable Cette distance devra alors tre combl e gr ce aux m canismes d inf rence exploitant les connaissances de raisonnement formelles de l ontologie qui permettent de simuler certaines des reformulations op r es habituellement par les utilisateurs du syst me documentaire comme nous avons vu au chapitre 2 Ainsi les liens de subsomption formelle qui guident les processus de sp cialisation ou de g n ralisation des concepts et des relations introduits dans le patron peuvent tre vus comme des moyens de compenser les effets de ces processus Par exemple l index de la figure 3 11 obtenu partir de sp cialisation et d ajout successif d l ments du patron de la figure 3 10 implique toujours logiquement ce patron du fait des liens de subsomption qui permettent de projeter les concepts et relations de l un sur ceux de l autre L index pourra donc r pondre une question formul e directement l aide du patron ou alors obtenue par g n ralisation ou suppression des notions qu il pr sente par exemple si le chercheur demande des documents o une personne quelconque participe une action ayant pour objet un b b Les choses deviennent plus d licates lorsque l utilisateur modifie l agencement des concept
29. En mati re de patrons d indexation nous proposons d adapter les d marches d ing nierie ontologique base de patrons de conception Ces propositions souffrant 4 nos yeux d un d ficit trop grand en mati re de l gitimit applicative nous montrons qu il est souhaitable et possible de les relier expli citement aux patrons d indexation ces derniers tant consid r s comme les patrons d utilisation applicatifs de l ontologie concevoir Finalement nous reviondrons dans le chapitre 5 sur les diff rentes exp rimentations concr tes que nous avons r alis es au cours de cette th se Nous allons pr senter bri vement les ressources ontologiques concues mais aussi la mani re dont elles ont t utilis es et ce que cette exp rience de conception et d utilisation a pu apporter notre r flexion Ce chapitre sera notamment l occa sion d voquer des points qui constituent notre avis des pistes int ressantes pour des recherches venir ou bien tout simplement valent la peine d tre voqu es si l on veut rendre compte de la richesse du questionnement que les probl mes d ing nierie des connaissances peuvent apporter Introduction Premi re partie Introduire les ontologies dans le processus d indexation Chapitre 1 La description des documents audiovisuels dans les processus documentaires 1 1 Introduction 1 1 1 Le statut documentaire du document audiovisuel Affirmer aujourd
30. ISWC 2002 Sardinia Italia 2002 SEMO01 STAAB S ERDMANN M et MAEDCHE A Engineering Ontologies Using Semantic Patterns In IJCAI 2001 Workshop on E Business and Intelligent Web Seattle USA 2001 SJO2 SIMOV K et JORDANOV S BOR a Pragmatic DAML OIL Reasoner Rapport technique 40 On To Knowledge Project 2002 SLL 04 SOERGEL D LAUSER B LIANG A FISSEHA F KEIZER J et KATZ S Reen gineering Thesauri for New Applications the Agrovoc Example Journal of Digital Information 4 4 2004 SMO0 STAAB S et MAEDCHE A Ontology Engineering beyond the modeling of concepts and relations In Proceedings of the ECAI 2000 Workshop on Ontologies and Problem Solving Methods Berlin 2000 Sow84 Sowa J F Conceptual structures information processing in mind and machine Addisson Wesley Reading MA US 1984 Sow00 Sowa J F Knowledge Representation Logical Philosophical and Computational Foundations Brooks Cole Pacific Grove California 2000 Sto03a STOCKINGER P Le document audiovisuel Proc dures de description et exploitation Herm s Science Paris France 2003 Sto03b STOCKINGER P Opales Digital libraries for humanities In Workshop on Multimedia in Digital Libraries 2003 Svd 04 STUCKENSCHMIDT H VAN HARMELEN F DE WAARD A SCERRI T BHOGAL R VAN BUEL J CROWLESMITH I FLUIT C KAMPMAN A BROEKSTRA J et VAN MULLIGEN E Exploring Large Document repositorie
31. ObjetGeographiqueNaturel h Q ObjetGeographiqueAdministratif 4 FrontiereAdministrative A L objet est d fini par ou pour une activit ZoneAdministrative Difference administrative Commune j Departement Region A Pays h L origine de la d finition de cet objet est ObjetManufacture Difference pr cis e cette d finition repose sur un Collection A with Parent crit re administratif i i Fic 5 2 D finition diff rentielle du concept ObjetGeographiqueAdministratif 3Ou plus locale voir l importance prise tr s souvent par le r gional de l tape Des travaux du laboratoire LALICC dans la lign e des constatations faites dans Jou93 mentionnent l existence d op rateurs de changement du type s mantique d une unit linguistique Un objet individuel comme Paris introduit comme capitale administrative peut ainsi tre consid r e comme un lieu spatial s il est impliqu par exemple dans un sch me faisant intervenir un mouvement tel que pour Jean va Paris 161 Chapitre 5 Exp rimentations et discussions D s notre ontologie diff rentielle nous avions donc introduit la notion d 0bjetG ographique Administratif comme un objet tant d fini de mani re privil gi e par des crit res humains et administratifs en particulier mais existant essentiellement dans l espace voir figure 5 2 Et l attribution d
32. On a besoin d une information qui soit exploitable pour un usage donn ce qui suppose dans le cas de l indexation le recours un langage adapt et des proc d s de traitement pertinents s appliquant aux expressions de ce langages cf chapitre 1 Dans un syst me utilisant la langue celui qui indexe ou qui acc de un index est plac dans un contexte interpr tatif fort qui fournit aux termes employ s pour la description des significations accessibles sinon videntes Le partage de ces interpr tations au sein de la communaut est alors le gage d une certaine forme de continuit s mantique Dans le cadre des syst mes employant des thesauri la situation devient plus complexe Le vocabulaire est contr l les descriptions n apparaissent plus dans des textes crits ou oraux susceptibles de favoriser une interpr tation conforme ce qui a lieu dans la communaut d usage concern e Pour cela on l a vu dans le chapitre 1 le thesaurus essaie de se rapprocher au maxi mum de son contexte d usage Tout d abord il s efforce d associer aux descripteurs qu il introduit des signifiants tir s de la langue telle qu elle est pratiqu e dans le domaine d application Employer des mots permet en effet de b n ficier de la signification qu ils obtiennent en temps normal le terme best of pr sent dans l extrait du thesaurus de VINA de la table 3 1 appartient clairement au vocabulaire sp cialis de l
33. Op rationnalisation On dispose donc pr sent de tout un syst me de primitives formelles pr tes tre utilis es dans un SBC Cependant les comportements qu elles prescrivent ne sont compr hensibles que pour les utilisateurs humains puisque un ordinateur n a jamais directement acc s la r f rence des concepts Ils reste donc associer ces primitives des op rations informatiques capables de rendre compte de cette signification r f rentielle On appelle ontologie computationnelle le r sultat de cette sp cification op rationnelle Les concepts ce niveau sont d finis par les inf rences les calculs que pourra effectuer un syst me partir de la donn e des individus qui les instancient dans le monde Il s agit de la sp cification concr te du fonctionnement du SBC On utilise pour cela des langages op rationnels de repr sentation des connaissances qui font appel des capacit s d inf rences pr cises Pour un langage de repr sentation reposant sur les graphes conceptuels par exemple ce seront des op rations de manipulation des GC jointure calcul de projection etc Pour des langages s inscrivant dans le paradigme des logiques de description il s agira plut t de tests de subsomp tion entre concepts et de proc dures de classification des individus introduits dans la base de connaissances On a vu dans le chapitre 2 pages 48 58 59 et 61 des exemples de sp cifica tion dans ces langages op rat
34. Si une volution monotone de l ontologie diff rentielle ne pose pas de probl mes les relations de subsomption restent valides dans l ontologie r f rentielle le d placement ou la suppression d une de ses branches peut cr er des concepts r f rentiels orphelins n tant plus subsum s par un quelconque concept L diteur prend en charge cette v rification et informe l utilisateur le cas ch ant Enfin il est noter que l introduction des entit s r f rentielles ne permet pas de remettre en cause les donn es de Vontologie diff rentielle puisque ces derni res sont issues d une tape qui est logiquement ant rieure De l articulation entre ontologies diff rentielle et r f rentielle on passe logiquement l arti culation entre ontologies r ferentielle et computationnelle De fait celle ci requiert un niveau de d tail formel dont on a eu un aper u dans le chapitre 2 et qui n est pas pris en compte par notre diteur Nous comptons pour cela sur des fonctionnalit s d export qui si elle peuvent per mettre d obtenir des ontologies computationnelles l mentaires permettent surtout de poursuivre le travail de formalisation dans des environnements de conception plus complets sur ce point Op rationnalisation exports et re formalisation Comme on l a vu dans les paragraphes qui pr c dent les entit s r f rentielles introduites dans DOE restent en effet primitives La possibilit de d finir des co
35. Spectateur gt lt owl Class gt lt owl Class rdf about PersonnelEquipe gt lt owl disjointWith rdf resource Spectateur gt lt owl Class gt lt rdf RDF gt CODE 4 1 Encodage d une disjonction exclusive en OWL Il faut remarquer que certains auteurs recommandent d aller plus loin en ce qui concerne l op rationnalisation de l ontologie en sp cifiant le sc nario d usage de celle ci En l occurrence F r04 on l a d j voqu distingue quatre types de sc narios inf rentiel et implicite les axiomes sont appliqu s automatiquement pour produire de nouvelles connaissances inf rentiel et explicite les axiomes sont appliqu s la demande de l utilisateur pour produire de nouvelles connaissances validation implicite les axiomes sont appliqu s automatiquement pour v rifier la coh rence de la base de connaissances validation explicite les axiomes sont appliqu s la demande de l utilisateur pour v rifier la coh rence de la base de connaissances En pratique le sc nario d op rationnalisation requis pour les applications que nous visons devrait toujours tre le m me Pour que le syst me contribue la continuit s mantique nous cherchons en effet employer les connaissances de raisonnement la fois pour contr ler la validit des connaissances de la base et pour produire de nouvelles connaissances permettant de r pondre plus de demandes De
36. clairage que leur conception et leur utilisation peut apporter sur nos hypo th ses m thodologiques 5 2 1 Cyclisme Chronologiquement la premi re des exp rimentations de conception d ontologie auxquelles nous ayons particip est celle de l ontologie du cyclisme Initi e par Estelle Le Roux et Rapha l Troncy pour les besoins de leur th ses respectives cette ontologie a t con ue pour demontrer la faisabilit d une approche d indexation articulant langages de structuration documentaire description au niveau de la connaissance de la structure documentaire et description th matique Tro04 servir de r f rentiel conceptuel un outil d extraction de connaissances SEIGO qui analyse un ensemble de documents textuels relatif un corpus audiovisuel pour produire des descriptions conceptuelles structur es candidates au statut d index Le 03 Cette ontologie a pour objectif d autoriser la description de faits identifi s avec l aide de do cumentalistes sp cialistes du sujet VINA comme pertinents pour le Tour de France cycliste comme les arriv es d tape les classements les abandons etc Cr ation de l ontologie Apr s l extraction de libell s linguistiques des textes concern s et leur organisation en une premi re hi rarchie phases auxquelles nous n avons pas particip nous avons appliqu la premi re tape de la m thodologie de Bruno Bachimont la normal
37. de l assignation d une signification m tier naturelle aux primitives Cette assignation est en effet le fruit d une nor malisation s mantique qui d bouche sur la cr ation de hi rarchies de concepts et de relations directement utilisables pour la cr ation d une ontologie de primitives dont la signification est for malis e mais non encod e dans un langage op rationnel particulier On op rationnalise ensuite cette formalisation de la mani re la plus automatis e possible pour rendre l ontologie ex ploitable par un SBC Tout en r fl chissant sur des probl mes m thodologiques concrets soulev s par cette approche nous avons con u un outil d dition d ontologies qui en plus de la normali sation s mantique autorise une formalisation et une op rationnalisation limit es aux capacit s d un certain type de supports de graphes conceptuels En accord avec la m thodologie adapt e cet outil offre tout de m me la possibilit via des m canismes d export utilisant les langages de repr sentation standards de poursuivre ces deux derni res tapes dans des environnements qui comme on l a montr se concentrent exclusivement sur ces aspects et sont donc plus appropri s Ensuite les patrons d indexation peuvent s ins rer tout naturellement dans le processus de construction de l ontologie en tant que patrons d utilisation de ses concepts et relations Ils permettent de donner une justification pratique des
38. des reportages et des d monstrations assur es par des m decins journalistes dressent l tat des connaissances concernant la th rapie g nique les techniques de d bouchage d art res le pontage coronarien et la pr vention par une alimentation contr l e DOSSIER LA MORT DE L INFARCTUS Apr s une reconstitution d un homme faisant un infarctus Jean Charles FRUCHART explique l aide d image endoscopique comment l ath roscl rose maladie cardio vasculaire par exc s de cholest rol est la premi re cause de mortalit en France DEUXIEME PARTIE Etienne OLIVRY m decin journaliste MVS r pond Jean LANZI sur le r le de la th rapie g nique et de la m decine pr dictive En duplex le professeur Jean MARCO clinique Pasteur Toulouse explique l aide d animations en quoi consiste la dilatation des art res du coeur et quelles sont les autres techniques de d bouchage Jean LANZI et Etienne OLIVRY rappellent le principe du pontage coronarien traditionnel Le docteur Patrick NATAF h pital Piti Salp tri re expose le nou veau proc d du pontage sous vid oscopie et sur coeur battant Soci t de programmes Nature de production Producteurs Doc d accompagnement Type de traitement France 3 Coproduction Producteur Toulouse France 3 Toulouse 1996 Producteur Levallois Perret M dia Vid o Son 1996 Dossier de presse Catalogage analytique Num ro DL DL T
39. ensemble du syst me de recherche documen taire En effet cette continuit concerne galement au niveau du fonctionnement du syst me le rapprochement entre les descriptions produites et les requ tes effectu es Comment s assurer que deux l ments rapproch s lont t pour un motif correct c est dire qu ils correspondent deux interpr tations qui peuvent tre mises en correspondance 1 3 1 Index recherche et variabilit textuelle Dans cette optique le recours la solution textuelle constitue un premier progr s d un docu ment audiovisuel aux significations presque illimit es on passe une repr sentation qui s inscrit dans un syst me beaucoup plus norm o une premi re interpr tation pourra tre restitu e l utilisateur et servira de support sa recherche documentaire N anmoins l exp rience dans le monde documentaire a vite montr que l utilisation du texte seul sans contrainte ne suffit pas garantir une continuit interpr tative suffisante Wal99 Cela est d la nature m me du langage qui est propice une variabilit importante une information peut s exprimer de plusieurs fa ons diff rentes et une m me expression peut trouver plusieurs interpr tations La synonymie et la polys mie sont identifi es depuis longtemps comme des facteurs conduisant une perte d efficacit des syst mes de recherche simples base de mots clefs Il se peut qu une notice documentaire ne s
40. es d autres applications cela pourrait engendrer des probl mes majeurs Mais cette th se n avait pas traiter de ces questions Nous passons les d tails li s aux autres m ta propri t s en l occurrence nos choix en ce qui concernent celles ci ne contredisent pas ce que WGO01 a propos 162 5 2 Exp rimentations ontologiques propri t s aux concepts de l ontologie On trouve un autre exemple relativement clair dans la branche de l ontologie d di e la classification des personnes pr sentes sur le Tour En effet comme on peut le voir dans la figure 4 2 nous avons sp cialis le concept Personne en Coureur Cycliste DirecteurEpreuve MedecinEquipe etc Or pour Guarino Personne est un concept rigide qui r pond tous les crit res formels de d finition d un type GW00a Or toutes les sp cialisations que nous lui avons attach es sont anti rigides dans l absolu un coureur pourrait tr s bien tre autre chose qu un coureur ce concept serait donc un r le Le fait est que le temps d un Tour de France les individus qui instancient Coureur sont essentiellement des coureurs cyclistes quelle que soit la tournure que peuvent prendre les v nements Il est donc toujours pertinent de rattacher par un lien de subsomption les coureurs la notion de personne L analyse ontologique suivant les principes diff rentiels n est donc pas vraiment contradictoire avec la m thode de nettoyage
41. es recherche scientifique dans un domaine donn gestion du fonds documentaire d une entreprise Et que comme c tait le cas dans le projet OPALES un tel contexte est propice au figement d un certain nombre de comportements et de compr hen sions Des pratiques pertinentes sont donc identifiables tant en ce qui concerne la description que la recherche documentaires On conna t le vocabulaire de l application et on peut cerner les besoins d indexation qui y sont li s M me dans le cadre de VINA qui indexe des documents relevant d une tr s grande diversit de th mes on peut isoler des pratiques d indexation r cur rentes li es la sp cificit du document audiovisuel et des exploitations ult rieures que l on peut envisager On s attachera par exemple la description des proc d s audiovisuels des dispositifs employ s pour pr senter un th me M me si l licitation des usages applicatifs est d licate ce qui revient affirmer que l usage n est pas clairement identifiable on peut toujours se reposer sur l adoption de bonnes pratiques qui conf rent aux ressources ontologiques le statut de syst me prescrivant une interpr tation et des usages dans un cadre restreint par l outil documentaire En fait on peut affirmer que tout syst me base de connaissances doit obligatoirement r aliser une forme d auto prescription de son usage puisqu aucune application courante n exploite de mani
42. es directement aux documents consid r s et leurs propri t s les plus videntes ainsi qu aux implications de la t che particuli re que constitue l annotation ou d indexation de ces documents En effet comme on l a vu dans le chapitre 1 la description d un document suppose toujours la localisation d un segment documentaire particu lier la qualification de ce segment l aide du langage d indexation retenu et la structuration des unit s documentaires ainsi d crites en un ensemble rendant compte de leur agencement Quel que soit le contenu de la qualification orientation plus th matique les deux autres phases n cessitent l appareillage de syst mes documentaires complexes qui peuvent faire appel des connaissances et des vocabulaires d di s Ce fait d j reconnu depuis longtemps dans les approches documentaires classiques en particulier pour le cas audiovisuel Pic96 Mou99 peut justifier en soi le recours des ontologies et des proc dures de raisonnement sp cialis es dans une approche plus formelle DB00 Quelques unes des approches logiques de la recherche d informations que nous avons d j pr sent es proposent donc des vocabulaires de descriptions minimaux ainsi que des conte nus axiomatiques par d faut qui correspondent des fonctionnalit s strictement documentaires Des travaux comme ceux du laboratoire MRIM MBC95 CMF96 avancent ainsi des primitives formelles permettant de construire
43. et avec succ s pour des sc narios r alistes dans le contexte des docu ments audiovisuels Ceci montre qu au moins pour les personnes interagissant avec le syst me concepteurs indexeurs utilisateurs effectuant des recherches notre approche est pertinente et praticable Est il possible de g n raliser nos propositions Nous avons d j discut tout au long de ce manuscrit et surtout dans le chapitre 5 des probl mes et perspectives soulev s par quelques points bien pr cis de notre cadre m thodologique et technique Dans cette conclusion nous ne reviendrons pas sur ceux ci mais pr f rons nous concentrer sur la port e de ces hypoth ses En effet nous nous sommes depuis le d but de nos travaux principalement int ress au cadre bien particulier d un indexation riche et manuelle de documents audiovisuels Il est l gitime de se demander si nos r flexions et solutions peuvent sortir de ce cadre et tre transpos es dans d autres contextes applicatifs Nombre des outils techniques ou points m thodologiques abord s dans cette th se semblent en effet avoir une port e plus g n rale Ainsi la m thodologie de conception d ontologies utilisant la normalisation s mantique est utile parce qu elle permet de prendre en compte lors de la construction des hi rarchies de concepts et de relations la signification m tier des descripteurs employ s dans les index et aussi de res tituer convenablement c
44. et des actions personnelles parmi lesquelles on compte les diff rents types de soins prodigu s un nouveau n Les sp cialisations introduites imm diatement sous Action sont donc ActionPrescriteSocialement et ActionsPersonnelles Celles ci ont bien toutes les deux en commun avec leur notion parente le fait de d finir des actions particuli res et concr tes leur swe seront identiques Il en va de m me pour les valeurs de leur attribut SWS on ne va parvenir distinguer un type d action de l autre que parce qu on les consid re tous les deux du point de vue de l axe s mantique que constitue leur motivation Cette motivation ce niveau de la conceptualisation diff rentielle ne pourra tre que personnelle on d finit alors le DWS de ActionPersonnelle par rapport ActionPrescriteSocialement ou sociale culturelle on d finit alors le DWS de ActionPrescriteSocialement par rapport ActionPersonnelle L diteur remplit donc automatiquement les deux champs SWP et SWS pour toute une fratrie d s lors qu une des notions poss de l information Si l ontologiste veut d placer une notion dans la taxinomie les deux principes de similarit de celle ci sont adapt s sa nouvelle fratrie Une telle d cision d impl mentation peut para tre contraignante Mais elle d coule des principes m mes de la m thode de sp cification adopt e qu elle aide ainsi appliquer correctement Ensuite le pr
45. explicitement nous emploierons de mani re unifi e le terme concept pour d signer ces types de concepts et comme en logique de description ou en logique du premier ordre le terme individu pour d signer les anciens concepts c est dire les instances apparaissant dans les graphes conceptuels 48 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche un tel vocabulaire En l occurrence cet exemple utilise CGXML introduit par David Genest pour le syst me COGITANT utilis dans OPALES GS98 Les types de concepts et de relations y sont respectivement introduits par les balises XML ctype et rtype Des m canismes semblables d introduction de primitives de repr sentation non logiques sont utilis s dans les sp cifications terminologiques des logiques de description que nous avons abor d es en section 2 2 1 Le r le de la T box est pr cis ment de pr senter les concepts et les r les la terminologie au sens des LD qui seront utilis s pour construire les assertions de la A box charg es de repr senter les cas rencontr s dans l application en ce qui nous concerne les index Pour notre exemple une T box appropri e la cr ation de la A box de la figure 2 5 introduira des concepts comme Sequence Personne et des r les comme participe et contient Les proc d s de construction des bases de connaissances terminologiques assurent apr s que les primit
46. gre d office un raisonneur de logique de description FaCT capable de tester la satisfiabilit des ontologies construites ou d expliciter de nouvelles relations de subsomption entre concepts complexes en ont fait un outil de r f rence OntoEdit SEA 02 est un outil propri taire inspir par l approche des frames mais il g re de nombreux formats libres de la communaut li e au web s mantique FLogic DAML OIL RDFS et a le m rite de s appuyer sur une r flexion m thodologique significative Il s est en effet le premier int ress la mod lisation naturelle des axiomes pour faciliter la traduction d un langage de repr sentation un autre MSSS00 SEMO01 S effor ant de mettre en uvre les pro positions du projet On To Knowledge il propose galement une gestion originale des questions de comp tences telle qu on l a vue en section 4 2 1 Un petit outil d analyse lexicale compare les termes extraits des diff rentes questions pour en d duire automatiquement d ventuelles sub somptions 21 Auparavant appel Prot g 2000 cet diteur a repris le nom de l outil d acquisition des connaissances qui Va pr c d Prot g est disponible http protege stanford edu 2nttp co ode man ac uk http oiled man ac uk oIL Ontology Inference Layer est une proposition du projet On To Knowledge Pour plus d informations lire Ba00 L diteur OILed peut tre t l charg h
47. indexeur se retrouve donc livr seul face au vaste r pertoire des concepts de l ontologie ce qui ne favorisera pas son travail d interpr tation et de formulation En fait cette situation est analogue ce que nous avons observ dans un cadre documentaire classique pour le cas de PINA Nous avons bien des grilles d indexation qui privi l gient des choix de descripteurs mais celles ci sont en tr s grand nombre les sujets consid r s comme pertinents au point d tre ainsi formalis s se comptant par dizaines voire par centaines Une telle confusion refl te videmment une application dont les objectifs sont tr s g n raux et donc difficilement licitables En pratique plus on voudra prescrire finement une indexation plus r duite devra tre la quantit de patrons Un tel objectif s il peut sembler na f n est pas non plus contradictoire Si l ontologie est extr mement complexe comprendre et utiliser c est qu elle vient avec des sp cifications qui sont galement complexes Et qu on ne peut avoir atteint un tel niveau de complexit sans avoir pr cis exactement les interpr tations des descripteurs et logiquement les descriptions effectuer De fait comme on le verra dans la section suivante l emploi des patrons d indexation peut tre reli au fonctionnement inf rentiel d un syst me base de connaissances En tout cas il s agit d atteindre un compromis entre le nombre de patrons et leur s
48. lisation introduits dans les th ories g n riques est quelque chose consid rer de tr s pr s pour la conception des ontologies L approche descendante doit tre nuanc e par la consid ration explicite des patrons d utilisation r els de l application et des connaissances qui leur sont attach es 4 4 3 Vers une solution articulant patrons de conception et patrons d utili sation Nous ambitionnons donc d inclure les patrons d utilisation ontologiques dans le processus d adaptation des patrons de conception ontologiques que nous pourrons appeler par la suite patrons de conception De fait la sp cialisation de ces patrons de conception produit des motifs qui sont utilisables dans le domaine mais qui peuvent rester trop abstraits pour une application donn e qui emploie videmment ses propres concepts sp cialis s mais qui peut aussi recourir un agencement relationnel diff rent de celui ci Il faut donc faire la distinction entre le patron issu de la sp cialisation directe du patron de conception sp cialisation que nous appellerons patron d utilisation ontologique noyau ou patron noyau et celui qui sera utilis pour l application d sign par la suite par le vocable de patron d utilisation ontologique applicatif ou patron applicatif Concevoir un cadre d application des patrons de conception qui soit pertinent pour une application revient alors articuler convenablement le patron noyau avec le patron applicat
49. mes d une unit seront activ s alors que d autres seront d sactiv s Toute la difficult vient alors du fait que pour obtenir une primitive r ellement exploitable il faut supprimer cette d pendance au contexte on doit op rer une normalisation s mantique Cela se fait en ramenant la dimension du contexte au domaine consid r action qui autorise une assignation plus stable de s mes aux unit s langagi res L interpr tation est de fait encadr e ce qui permet de d finir la signification recherch e D une simple description linguistique on passe un sens v ritablement prescriptif qui permet d envisager le rapport d une primitive l unit de sens que nous recherchons pour une description ce qu elle est suppos e repr senter dans le domaine L ontologie diff rentielle Pour normaliser le sens variable des unit s tudi es il faut donc noncer des consignes pour l attribution des s mes g n riques et sp cifiques consignes qui sont n cessairement li es la pratique vis e par l ontologie Il faut que ceux qui acc dent l ontologie assignent un sens aux termes qui soit bien celui auquel aboutirait le processus d interpr tation Cela se fait en fixant et en structurant le r seau d identit s et de diff rences que l on avait voqu dans le paragraphe pr c dent Tout d abord on note qu une notion se d finit d abord par un lien de subsomption avec une autre notion celle dont
50. n rale qui est celle du programme qui les contient 121 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique En toute g n ralit on ne peut disqualifier une m thode qui a d montr son efficacit sur des exemples de conceptualisation ad hoc proches de ce quoi l on est habituellement confront dans le domaine D autant plus que le niveau de r flexion auquel elle se place est comme on le verra compl mentaire de notre propre cadre m thodologique 4 2 3 Initier le processus de conception des ontologies Des m thodes de v rification formelles peuvent donc fonder l ontologie d un point de vue th orique mais il faut tout d abord d marrer la conceptualisation avec une organisation des connaissances ontologiques qui soit r ellement pertinente pour le domaine Pour cela de nombreuses m thodes se tournent vers l exploitation des ressources linguistiques que l on trouve dans le contexte de l application En effet ces ressources si elles peuvent aider la compr hension des concepts de l ontologie on l a vu dans le chapitre 3 la page 3 2 1 sont avant tout utilis es pour d terminer et organiser les concepts et les relations dont on a besoin dans le domaine Des algorithmes utilisent des connaissances lexicales et syntaxiques pour extraire les termes les plus pertinents des textes relatifs au domaine tudi termes qui serviront de candidats concepts pour le d veloppement
51. pendantes du domaine Des SBC utilisant des ontologies autorisant la mise en ceuvre de m canismes d inf rences respectueux de la continuit s mantique peuvent donc apporter une assistance efficace aux processus d exploitation documentaires 2 4 Utilisations concr tes d ontologies par des syst mes de re cherche d information Vers des SBC r pondant nos crit res fonctionnels De fait de nombreux syst mes d annotation et de descriptions documentaires utilisant des ontologies plus ou moins formalis es ont d j t con us Les premiers ne se sont concentr s que sur l annotation simple de documents textuels mais au fur et mesure des progr s techniques et 20Ce qui d pend videmment des capacit s expressives du langage choisi Les logiques de description dans leurs formes les plus utilis es ne peuvent par exemple pas rendre compte de toutes les r gles de la figure 2 13 m me si des propositions r centes ont t faites dans ce sens GHVD03 HP04 Les graphes conceptuels eux s ils manquent par ailleurs de certaines des possibilit s d finitoires des LD proposent des m canismes d encodage de r gles relationnelles satisfaisants Sal97 66 2 4 Utilisations concr tes d ontologies par des syst mes de recherche d information de l int r t croissant pour les technologies du web s mantique de nouveaux projets se sont attel s une description et une exploitation plus fine en di
52. peut tre d licat d essayer d en extraire une structure diff rentielle Le probl me le plus important est celui de l h ritage multiple d un point de vue formel aucun des parents d un concept n est privil gi on ne raisonne qu en termes d inclusion d ensembles Dans ce cas il faut donc choisir au hasard un des parents pour en faire le p re de la notion diff rentielle correspondant Ventit r f rentielle repr sent e en RDFS ce qui est videmment une solution non satisfaisante On pourra se consoler en faisant observer que la phase d export est beaucoup plus importante pour le positionnement de notre outil en amont des autres diteurs mais il demeure qu on se retrouve l face une limitation importante de notre outil et au del de la m thode enti re dont il s efforce d tre la r alisation la plus fid le Pour que les significations diff rentielles soient compl tement partageables par plusieurs diteurs il n y a pas d autre solution que de les int grer dans le langage pivot ou d attendre qu un langage de repr sentation soit suffisamment adaptable pour pouvoir tre configur en fonction des informations repr senter OWL comme langage d change Nos exp rimentations avec OWL n ont pas non plus t extr mement concluantes mais cela est d en forte partie au fait que la moiti des diteurs vers lesquels nous nous tions tourn s ne le g raient pas encore En effet seul Prot
53. s mantique qui soient en accord avec la signification des descripteurs dans le contexte applicatif de l indexation Ici encore se pose la question de la complexit des d finitions formelles donn es dans les onto logies Plus on donnera de contraintes sur l interpr tation du vocabulaire plus on s approchera des interpr tations naturelles rencontr es dans l application et plus un syst me de raisonnement aura de moyens d exploiter les index Des tudes comme SMO00 ou plus directement l obser vation des besoins inf rentiels des syst mes base de connaissances GHB96 Pa03 justifient l introduction de sp cifications riches dans les ontologies si l application le requiert En particulier il est int ressant d encoder des r gles de production logiques permettant de rendre compte des propri t s g n rales des relations employ es dans nos index cf figure 2 4 comme participe contient ou explique aPourTraitSaillant Ainsi on peut vouloir rendre compte de lois comme celles de la figure 2 13 ci dessous extraites comme beaucoup des exemples de ce chapitre de l exp rimentation que nous pr senterons en section 5 2 3 Vz y z Objet AV x Objet AV y Anything z aPourTraitSaillant x y A Explique y z Explique x z Vz y z Objet AV x Sequence y Anything z A Contient x y A Explique y z Explique x z Vz y z Objet AV x Personne y Anything z aPourParticipant x y
54. s suivant les propositions m thodologiques que nous ver rons en chapitre 3 feront b n ficier les r sultats du syst me d une certaine forme de continuit s mantique Le projet CONCERTO ZBB 99 que nous reverrons lui aussi plus tard s efforce galement de concevoir une ontologie labor e suivant des crit res d analyse s mantique de textes pour am liorer description et recherche Cependant les processus de recherche de ces syst mes n exploitent pas encore des connaissances de raisonnement aussi riches que celles que nous recherchons Ainsi le syst me SYDOM RCP02 utilise des graphes conceptuels adapt s la repr sentation et la recherche multilingue insiste bien sur l importance de la d finition des concepts mais les m canismes de recherche bas s sur la similarit entre graphes sont relati vement g n riques dans la mesure o ils n exploitent pas les propri t s de relations particuli res A l inverse des travaux comme KC95 se concentrent principalement sur la mise en place de capacit s logiques pour des raisonnements complexes r pondant aux besoins observ s David Genest lui aussi Gen00 propose de suivre des strat gies de raisonnement prenant r ellement en compte les besoins d un domaine applicatif et exploitant les relations entre concepts Le probl me est que ces travaux se concentrent plut t sur la cr ation de solutions techniques mais ne se placent pas dans un c
55. t abord que tr s peu dans les efforts m thodologiques en rapport avec la conception des ontologies Celles ci sont en effet destin es tre repr sent es le plus souvent via des langages standard dont les capacit s sont plus tourn es vers la sp cifications de calculs d inf rence que vers la repr sentation de connaissances relatives la signification g n rale des notions de l ontologie Ces langages sont certes suppos s mettre en uvre des m canismes de d finition relativement naturels comme le recours la relation de subsomption Mais nous avons vu qu il tait pr f rable d ajouter des informations qui par exemple parce qu elles ne sont pas formalis es ne seront pas directement utilisables par un SBC Dans l absolu un processus d acquisition des connaissances ontologiques aboutirait donc la cr ation de deux sortes de connaissances des connaissances formelles et op rationnelles directement en rapport avec l exploitation de l ontologie par les m canismes de traitement automatiques d un SBC des sp cifications auxiliaires tablies lors de l acquisition des connaissances pour guider la t che des agents humains interagissant avec l ontologie pendant la conception ou l utilisa tion de celle ci La deuxi me classe de connaissances est plut t vari e On y retrouve les principes diff rentiels de la m thodologie avanc e par Bruno Bachimont mais aussi les r sultats de l analyse
56. t s Par exemple on saura que pour une configuration donn e l extension d un concept S quence va contenir trois individus a b et c et que a et b seront reli s par la relation contient qui est d finie par la donn e d un ensemble auquel appartient le couple a b L une des cons quences de cette d finition est que si le monde mod lis change alors la conceptualisation change elle aussi une conceptualisation dans ce contexte revient un mod le de connaissance valable pour un cas particulier et non pour un domaine applicatif dans toute sa g n ralit Guarino jugeant cette approche non satisfaisante pour rendre compte de la signification r elle des concepts utilis s comme vocabulaire du langage de RC propose une autre d finition Celle ci s int resse davantage aux propri t s des concepts pr sent s et la mani re dont ils r f rent aux individus du monde et ce pour toute configuration envisageable Il s agit plus de d gager des propri t s invariantes de ces concepts des r gles qui permettent pour une configuration du monde donn e de d signer les individus que l on peut relier aux concepts Ainsi si l on suppose donn es les concepts Interview et Expert et de la relation participe on pourra pr ciser qu InterviewExpert est le concept qui regroupe les instances d nterview qui ont pour participant au moins un individu d sign comme Expert S il ne s agit pas vraiment de d finition en inte
57. une application peut suffir d finir un environnement palliant un tel manque le contexte applicatif o ce sont les usages et pratiques mobilis es pour une application donn e qui munissent les entit s manipul es d une signification locale et informelle Le plan est d fini comme tant le r sultat d une prise de vue continue entre la mise en marche et l arr t de la cam ra 14 1 2 Le probl me de l acc s Vinformation pour les documents audiovisuels De plus l interpr tation du document audiovisuel est rendue particuli rement d licate par le caract re intrins quement temporel de celui ci Le document audiovisuel impose en effet son lecteur son propre rythme temporel en dehors duquel il n est pas compl tement compr hensible Bac98 Pour localiser les unit s significatives autant que pour d terminer leur contenu il faut donc effectuer une lecture lin aire compl te et en temps r el du document La forme audiovisuelle ne pr sente pas de possibilit de survol de sommaire en bref de mode d acc s non lin aire ce qu il pr sente ce qui la rend encore plus difficile traiter C est pourquoi dans un syst me documentaire classique pour que l usager puisse acc der au contenu du document audiovisuel sans avoir lire ledit document un op rateur humain proc de une interpr tation dont l objectif est d isoler les unit s signifiantes du document et de leur attribuer une signi
58. 2000 MALAISE V ZWEIGENBAUM P et BACHIMONT B Rep rage et exploitation d non c s d finitoires en corpus pour l aide la construction d ontologies In 11e dition de la Conf rence sur le Traitement Automatique du Langage Naturel TALN 2004 F s Maroc 2004 Nig J Y et BRISEBOIS M An Inferential Approach to Information Retrieval and its Implementation using a Manual Thesaurus Artificial Intelligence Review 10 5 6 1996 NEWELL A The knowledge level Artificial Intelligence 18 1 1982 Noy N F FERGERSON R W et MUSEN M A The knowledge model of Protege 2000 Combining interoperability and flexibility In 12th International Conference on Knowledge Engineering and Knowledge Management EKAW 2000 Juan les Pins France 2000 Noy N F et MCGUINNES D L Ontology Development 101 A Guide to Creating Your First Ontology Rapport technique SMI 2001 0880 SMI 2001 Noy N F et MUSEN M A The PROMPT suite interactive tools for ontology merging and mapping International Journal of Human Computer Studies 59 6 2003 NANARD M NANARD J et KING P IUHM a Hypermedia based Model for In tegrating Open Services Data and Metadata In International ACM Conference on Hypertext HT 2003 Nottingham UK 2003 OGGM02 OLTRAMARI A GANGEMI A GUARINO N et MASOLO C Restructuring Word OP 98 Oun98 OWLO4 Pa03 PC05 P d03 Pic96 Net s Top Level The Onto
59. 53Encore que la justification des r sultats d un syst me sujet relativement pr sent dans le cadre de l intelligence artificielle et du raisonnement automatique en particulier puisse au fil des recherches se r v ler tre d un int r t crucial pour les types de SBC actuellement en vogue Tim Berners Lee dans son d sormais c l bre layer cake qui pr sente les diff rentes couches de services offerts par un web s mantique place en effet les preuves et la confiance au sommet de l chelle BHLO1 Mais les recherches dans le domaine n ont pas encore montr la mesure dans laquelle ces fonctionnalit s impliquaient la pr sentation des entit s de l ontologie l utilisateur final de syst mes 203 Conclusion des relations qu il introduit En premi re instance on peut donc affirmer que la m thodologie de normalisation diff rentielle et par extension notre diteur qui la met en uvre est utile d s qu un agent humain a besoin d acc der au contenu d une ontologie s inscrivant dans un cadre applicatif pr cis Ce qui concerne videmment une quantit non nulle d applications base de connaissances Ensuite le spectre des situations o on peut avoir recours aux patrons d indexation peut galement tre largi d s le moment o l on cesse de les consid rer comme des structures uni quement employables par des indexeurs humains mais comme des ressources pouvant guider
60. A new theoretical framework for information retrieval In ACM Conference on Research and development in Information Retrieval Pisa Italy 1986 VALENTE A et BREUKER J Towards Principled Core Ontologies In Proceedings of the Knowledge Acquisition Workshop KAW 96 Banff Canada 1996 Ven02 VENEAU E Macro segmentation multi crit re et classification des s quences par le contenu dynamique pour l indexation vid o Th se de doctorat Universit de Rennes I 2002 vMSt04 van AssEM M MENKEN M R SCHREIBER G WIELEMAKER J et WIELINGA B A method for converting thesauri to RDF OWL In 3rd International Semantic Web Conference ISWC 2004 2004 VPS03 VAKKARI P PENNAMEN M et SEROLA S Changes of search terms and tactics while writing a research proposal A longitudinal cas study Information Processing and Management 39 3 2003 Wag03 WAGNER G Seven Golden Rules for a Web Rule Language IEEE Intelligent Systems 5 18 2003 Wal99 WALLER S L analyse documentaire Une approche m thodologique ADBS Paris 1999 WG01 WELTY C et GUARINO N Supporting Ontological Analysis of Taxonomic Relation ships Data and Knowledge Engineering 1 39 2001 WSWS01 WIELINGA B SCHREIBER A TH WIELEMAKER J et SANDBERG J A C From Thesaurus to Ontology In Proceedings of the 1st International Conference on Knowledge Capture K Cap 01 Victoria British Columbia Canada 2001 XML04 XM
61. ARCHONTE nous avons cr un format de re pr sentation qui encode explicitement les volets diff rentiel et formel des ontologies Il faudrait voir comment on peut prolonger une telle approche sans alourdir plus qu il n est n cessaire les standard existants L opportunit offerte par une note de travail concernant le langage OWL de cr er des annotations structur es r pondant des sch mas pr d finis semble en particulier tre int ressante Celle ci permettrait en effet ceux qui le d sirent de cr er des outils capables d interpr ter des informations qui demeurent optionnelles le c ur des sp cifications formelles restant la port e de tous les outils qui se conforment au standard Types J x J y Relations P1 avoir la capacit d tre modifi P roue propri t motrice de la roue sit P roue y CONTR FAIRE Fic 5 12 Un sch me s mantico cognitif du verbe rouler extrait de Dji00 d finition des connaissances ontologiques de normalisation s mantique Finalement pour mentionner un aspect qui sortait clairement des objectifs initiaux de cette th se on pour rait s attarder sur la nature m me des informations qui permettent d obtenir la normalisation 431 s agit d une proposition de syntaxe de pr sentation reposant sur XML et diff rente de la syntaxe RDF qui s est impos e depuis Cf http www w3 org TR owl xmlsyntax 193 Chapitre 5 Exp rimentations et discu
62. Conclusion 206 A br95 Bibliographie ABRAHAM M Analyse S mantico Cognitive des verbes de mouvement et d acti vit Contribution m thodologique la construction d un dictionnaire informatique des verbes Th se de doctorat EHESS 1995 ACFGO1 ARPIREZ J C CORCHO O FERNANDEZ LOPEZ M et GOMEZ PEREZ A We AFN87 AFN93 AFS00 bODE a Workbench for Ontological Engineering In First International Conference on Knowledge Capture K CAP 01 Victoria Canada 2001 AFNOR Vocabulaire de la documentation Rapport technique AFNOR 1987 AFNOR Information et documentation Principes g n raux pour l indexation des documents NF Z47 102 Rapport technique AFNOR 1993 AMANN B FUNDULAKI I et SCHOLL M Integrating Ontologies and Thesauri for RDF Schema Creation and Metadata Querying International Journal of Digital Libraries 3 3 2000 AHASO3 ALEMAN MEZA B HALASCHEK C ARPINAR I B et SHETH A Context Aware ALR96 Semantic Association Ranking In First International Workshop on Semantic Web and Databases SWDB 03 Berlin Germany 2003 AUSSENAC GILLES N LAUBLET P et REYNAUD C L acquisition des connais sances une composante part enti re de l informatique du futur In AUSSENAC GILLES N LAUBLET P et REYNAUD C diteurs Tendances actuelles en acquisition et mod lisation des connaissances C padues 1996 AMO 03 ANGELE J MOENCH E OPPERMANN H
63. D MCGUINNESS D NARDI D et PATEL SCHNEIDER P F The Description Logic Handbook Theory Implementation and Applications Cambridge University Press 2003 BFGG98 BL ZQUEZ M FERNANDEZ M GARCIA PINAR J M et GOMEZ PEREZ A Buil ding Ontologies at the Knowledge Level using the Ontology Design Environment In 11th Banff Knowledge Acquisition Workshop KAW 98 Banff Canada 1998 BHGSO1 BECHHOFER S HORROCKS I GOBLE C et STEVENS R OilEd a Reason able On tology Editor for the Semantic Web In Proceedings of KI2001 Joint German Austrian conference on Artificial Intelligence Vienna 2001 BHLO1 BERNERS LEE T HENDLER J et LASSILA O The Semantic Web Scientific American 284 5 2001 BITO2 Bruno BACHIMONT Antoine ISAAC et Rapha l TRONCY Semantic Commitment for Designing Ontologies A Proposal In A GOMEZ PEREZ et V R BENJAMINS diteurs 13th International Conference on Knowledge Engineering and Knowledge Management EKAW 02 volume Lecture Notes in Artificial Intelligence vol 2473 Sig enza Spain 2002 Springer Verlag BKMO3 BRUAUX S KASSEL G et MOREL G Etude critique de la m thode CommonKADS application au calage de codes de calcul In Actes de la Conf rence en Ing nierie des Connaissances IC 2008 Laval 2003 208 BKv02 BROEKSTRA J KAMPMAN A et VAN HARMELEN F Sesame a Generic Architec ture for Storing and Querying RDF and RDF Schema In International Semantic W
64. J Classification des s quences audiovisuelles Th se de doctorat Universit Paris VI 2000 Cha03 CHARLET J L ing nierie des connaissances D veloppements r sultats et perspectives pour la gestion des connaissances m dicales Habilitation a diriger des recherches Universit Pierre et Marie Curie 2003 CMO1 CEUSTERS W et MARTENS P LinkFactory an Advanced Formal Ontology Mana gement System In Interactive Tools for Knowledge Capture Workshop KCAP 2001 Victoria Canada 2001 CMF96 CHIARAMELLA Y MULHEIM P et FOUREL F FERMI Formalization and Experi mentation in the Retrieval of Multimedia Information Report A model for multimedia information retrieval Rapport technique CLIPS IMAG 1996 CTHDO0 CLARK P THOMPSON J HOLMBACK H et DUNCAN L Exploiting a Thesaurus Based Semantic Net for Knowledge Based Search In Proceedings of the 12th Innovative Applications of AI Conference I AAI 00 Austin Texas USA 2000 CTP00 CLARK P THOMPSON J et PORTER B Knowledge Patterns In Proceedings of the 7th Conference on Principles of Knowledge Representation and Reasoning KR2000 Breckenridge Colorado USA 2000 CZKB00 CHARLET J ZACKLAD M KASSEL G et BOURIGAULT D Ing nierie des Connais sances Evolutions r centes et nouveaux d fis Eyrolles 2000 Dau94 DaAUzATS M Le thesaurus de l image tude des langages documentaires pour l au diovisuel ADBS Editions Paris 1994
65. Kassel qui a accept de pr sider le jury de cette th se Je tiens signaler que l int r t qu il a bien voulu accorder mes travaux avant m me l tape du rapport a t pour moi une grande source de motivation Je remercie aussi Sylvie Lain Cruzel et Arlette Boulogne Leur participation mon jury a t l occasion pour moi de confronter mes positions celles d expertes avis es en sciences de l information et de la documentation confrontation que j estime tout fait enrichissante Mes pens es vont galement l ensemble des participants du projet OPALES avec qui j ai d couvert ce que faire de la recherche appliqu e voulait dire Avec une mention toute particuli re pour l quipe locale de VINA V ronique Fabrice et Patrick Des remerciements honn tes ne peuvent ignorer le r le fondamental jou dans le d roulement de cette th se par la Direction de la Recherche de PINA dont je tiens remercier l ensemble des membres et en particulier ceux des quipes M tadonn es et DCA dont l activit a rythm mon passage l Institut Pour les amateurs voici venu le temps de remerciements moins institutionnels avec leurs brochettes de pr noms Au LALICC je pense tout particuli rement l quipe de la Cuisine et en particulier Marie Aude Carine Motasem et Jorge Les th s et petits g teaux ont contribu rendre mes visites l bas extr mement plaisantes A l INA mes pen
66. L gal Des probl mes similaires se posent et peut tre avec plus d acuit pour des communaut s de production et d usage plus restreintes et a priori moins contraintes La num risation en facilitant la mise en r seau et l exploitation des documents offre en effet la possibilit de faire voluer des pratiques documentaires qui sont parfois au c ur de leur m tier Ainsi si les utilisateurs rencontr s dans le projet Opales venaient avec des besoins moindres par rapport ceux de PINA en termes quantitatifs leurs exigences taient beaucoup plus grandes quant la finesse du traitement documentaire Lorsque les documents audiovisuels sont amen s jouer un r le tr s pr cis dans une pratique essentielle pour une communaut donn e celle ci a bien videmment int r t ne pas prendre la l g re le probl me des traitements effectuer autour d eux Sto03b En fait le document audiovisuel n chappe pas son statut de document Comme les autres documents on peut le consid rer comme une inscription qui est motiv e par les changes sociaux qu elle rend possible P d03 Et une analyse ainsi qu une utilisation s rieuses ne peuvent faire totalement abstraction de son contexte de production de publication de r ception que sa forme soit textuelle audiovisuelle ou multim dia N anmoins nous pouvons tenter de d gager des sp cificit s qui s appliquent au document audiovisuel dans le cas de l obtention de des
67. M1 mettait en avant l imp ratif de faciliter la compr hension des termes de la descrip tion Nous avons vu que pour cela il est naturel de se tourner vers la langue On peut en particulier structurer les significations non formelles des intitul s langagiers attach s aux concepts et aux relations par une normalisation s mantique s appuyant sur des principes de similarit et de dif f rence au sein d un r seau de significations Reprenant ces propositions de Bruno Bachimont que nous avons mises en uvre au cours de cette th se nous avons d taill en quoi consistait une ontologie diff rentielle et comment on pouvait pr senter l utilisateur des concepts et des relations dont l interpr tation serait imm diate Ensuite le point M3 insistait sur la difficult de cr er des index base de connaissances complexes qui puisse faire b n ficier le syst me d indexation et de recherche des traitements riches rendus possibles par la formalisation sous jacente aux syst mes ontologiques Nous d mar quant des techniques d j existantes que ce soit dans les syst mes classiques ou ontologiques nous avons d taill comment une solution avanc e pour OPALES les patrons d indexation peut offrir un cadre propice un contr le ditorial qui mette en lumi re des configurations pertinentes pour l application vis e tout en gardant un niveau de souplesse suffisant pour ne pas rebuter 108 8 4 Conclusion Vindexeur En fa
68. NEEN Saa AR ER RE SR ig Ay I Rate es DE SN ca MN RL SE SS OS od Les Gti So nd de Encodage d une disjonction exclusive en OWL Repr sentation en SWRL de la r gle de la figure 4 10 Index d crivant une mission contenant une interview en RDF D finitions de la classe Interview et de la propri t hasParticipant en RDFS D finitions OWL des classes ExpertInterview et ExpertRole D claration de la transitivit de la propri t hasSubSequence D claration de la composition des propri t s hasSubsequence et represents dans SESAME ae an he Re ae Ry Tee att Oe ARS Pa Bh eee Meret Wag a nse Re die a D claration de la composition de la propri t hasSubsequence et d une propri t sp cialisant represents dans Sesame Xi Liste des codes sources xii Introduction 1 DINA endroit r v pour effectuer une th se CIFRE L Institut National de l Audiovisuel INA ce sont d abord pour le grand public des images au charme d suet voquant les temps glorieux o la radio diffusion nationale tait une Des images que l on voit ressurgir avec bienveillance et m me int r t comme de vieilles photos de famille que l on pensait avoir d finitivement perdues De fait et comme l atteste l int r t de nombreux chercheurs pour les fonds de l Institut ces documents constituent bien une partie de notre histoire Ils fourniss
69. Nous reprenons les th ses de Bruno Bachimont en ce qui concerne l acc s la substance des index savoir les concepts et relations qu apportent une ontologie il est indispensable de pr senter une signification langagi re rationnelle de ces l ments probl me que nous pouvons r soudre en utilisant des d finitions diff rentielles Nous avancons ensuite une mani re de guider le travail d un indexeur en ce qui concerne la forme des index proprement dite savoir la mani re dont le vocabulaire se manifeste en une description structur e Des patrons de conception structures relationnelles adaptables qui peuvent servir de descriptions pivots vis vis des proc dures de raisonnement employ es lors de la recherche apportent en la mati re des recommandations appropri es Comme nous recherchons un cadre m thodologique global nous nous devons de nous int res ser aussi la conception des ressources ontologiques employ es par les syst mes d indexation base de connaissances Nous avons propos lors de notre th se et en collaboration avec Rapha l Troncy un diteur d ontologies DOE qui met en uvre les points m thodologiques propos s par Bruno Bachimont en tenant compte de l exp rience que nous avons acquise en appliquant ces points des ontologies d importance significative Cet diteur a t cr pour tre compl men taire autant que faire se peut avec les autres outils rencontr s dans le domaine
70. ObjetBiologique Personne Q PersonnelEpreuve CommissaireDeCourse DirecteurEpreuve Journaliste MedecinEpreuve Spectateur PersonnelEquipe MedecinEquipe CoureurCycliste Grimpeur Rouleur Sprinter DirecteurSportif ObjetGeographique ObjetManufacture Collection Une propri t pr cise la raison de la Similarity SUCRE de la personne lors d une edit SWS with Siblings preuve cycliste Est employ par une des quipes Difference participant l preuve with Siblings oue un r le particulier par rapport Difference l preuve tla personne est employee par build DWP with Parent lune quipe participant l preuve Fic 4 2 Les principes diff rentiels de la notion PersonnelEquipe dans DOE Il faut mentionner qu outre les possibilit s de cr ation et de modification de notions diff rentielles notre diteur permet une gestion terminologique minimale chaque notion et pour plusieurs langues on peut associer un terme pr f r et l on peut sp cifier des synonymes de ce terme Il est galement possible de pr ciser une d finition encyclop dique On compl te ainsi Cette gestion de plusieurs langues pour certaines des informations attach es aux notions n a pas pour ambition de rendre l diteur r ellement multilingue Ce probl me est en effet bien plus complexe des notions
71. STAAB S et WENKE D Ontology ANNO3 Arp00 AS92 Auf00 Ba00 Based Query and Answering in Chemistry OntoNova Project Halo In International Semantic Web Conference ISWC 2003 Sanibel Island Florida USA 2003 ALHULOU R NAPOLI A et NAUER E Une mesure de similarit s mantique pour raisonner sur des documents In 3 mes Journ es Nationales sur les Mod les de Rai sonnement JNMR 03 Paris 2003 ARPIREZ J C WebODE 1 0 User s Manual http delicias dia fi upm es webODE 2000 AMANN B et SCHOLL M Gram A Graph Data Model and Query Language In Proceedings International Workshop on Semantic Web Foundations and Application Technologies Milano Italy 1992 AUFFRET G Structuration de documents audiovisuels et publication lectronique Th se de doctorat Universit de Technologie de Compi gne 2000 BECHHOFER S et ALII OIL whitepaper http www ontoknowledge org oil index shtml 2000 207 Bibliographie Bac96 BACHIMONT B Herm neutique mat rielle et Art facture des machines qui pensent aux machines qui donnent penser Th se de doctorat Ecole Polytechnique 1996 Bac98 BACHIMONT B Biblioth ques num riques audiovisuelles des enjeux scientifiques et techniques Document num rique 2 3 1998 Bac00 BACHIMONT B Engagement s mantique et engagement ontologique conception et r alisation d ontologies en ing nierie des connaissances In CHARL
72. abstraite concept ou classe si on se place par exemple dans un paradigme de repr sentation objet qui permet de le typer Pour une discussion sur cette relation fondamentale ainsi que d autres dans un contexte plus linguistique et cognitif on peut se r f rer Des87 42 2 2 IC et expressivit descriptive Pour rem dier ces probl mes il faut se tourner nouveau vers des formalismes mais des formalismes qui proposent des primitives adapt es la mod lisation de connaissances ainsi que des algorithmes d di s a l exploitation sp cifique des expressions compos es l aide de ces primitives On trouve dans cette cat gorie les graphes conceptuels propos s par John Sowa Sow84 formalisme retenu dans le cadre du projet OPALES Ce langage de repr sentation propose une approche de la repr sentation logique qui est compatible avec l utilisation d interfaces graphiques de type r seaux s mantiques et exploite des algorithmes de raisonnement dont la finalit n est pas la d monstration g n rale des formules du premier ordre cf section 2 3 2 Concr tement un graphe conceptuel est un graphe biparti les entit s y sont de deux sortes distinctes concept ou relation Les sommets de nature conceptuelle sont tiquet s la fois par un type de concept correspondant un pr dicat unaire en logique et par un marqueur individuel possiblement g n rique de sorte d noter un objet connu ou incon
73. action a comme valeur de plan la valeur gros plan plut t que de dire qu elle a jou le r le de produit d une activit de tournage faisant partie d une s quence de production activit dont le param tre valeur de plan tait gros plan Surtout si de tels concepts ne seront jamais utilis s par l application concern e Mais l encore nous avons montr qu il est possible au c t du vocabulaire ontologique et des patrons qui le mobilisent de sp cifier des connaissances de raisonnement qui tablissent des r gles de passages d une repr sentation une autre Cette approche permet de respecter la conceptualisation que l on rencontre dans l application vis e tout en la rendant compatible avec une vue plus coh rente sur le domaine plus g n ral dont elle rel ve In fine cela contribue une explicitation rationalis e de l engagement ontologique En quelque sorte on sait pr sent comment l on parle des entit s du domaine mais on a en plus un aper u des raisons pour lesquelles on en parle ainsi Et grace ce travail de conception ontologique l utilisateur d une application peut continuer voluer dans un contexte avec lequel il est familier patrons et interop rabilit s mantique entre SBC Nous avons d fendu l id e d une ar ticulation rationnelle entre les conceptualisations des applications et d autres plus abstraites et plus coh rentes Cela est en grande partie li au
74. application une partie des raisonne ments 6 qui sont effectu s par les recherchistes dans les syst mes documentaires actuels Nous consid rons cependant que sur une exp rimentation assez r duite nous avons l en compl ment de l index compl t de la figure 5 8 un indice assez r v lateur de l int r t des m canismes de raisonnement standardis s par l initiative du web s mantique pour notre approche Il faut remarquer que Sesame offre la possibilit d exprimer des r gles utilisant la pleine puis sance de RDFS qui consid re que l on peut typer en plus des individus d une base de connaissance les types que l on assigne ces objets Toute entit quel que soit le niveau d abstraction dont elle rel ve peut toujours tre consid r e comme un sujet et tre son tour typ e ce qui place de fait RDFS et Sesame en dehors du cadre de la logique du premier ordre On peut donc entre autres cr er des r gles qui sont capables de s appliquer des propri t s dont on sait seulement qu elles sp cialisent une propri t donn e La r gle du code 5 5 peut ainsi tre formul e comme dans la figure 5 6 si un objet audiovisuel a comme sous s quence un autre objet qui repr sente un sujet quelconque d une fa on bien d termin e alors le premier objet repr sente lui aussi ce sujet et ce de la m me fa on Ceci est important car on peut alors ne pas r crire la r gle pour toutes les sp cialisations
75. apportent une premi re r ponse Mais subsiste un probl me d interop rabilit s mantique les ressources publi es sur le web peuvent correspondre des applications et des conceptualisations diff rentes il n est pas r aliste d imposer un seul sch ma conceptuel l chelle du web Il importe donc d expliciter les conceptualisations dont rel vent les ressources de sp cifer la mani re dont des conceptualisations diff rentes peuvent tre articul es Pour tout cela les ontologies peuvent apporter une aide pr cieuse Comme on vient de le voir dans ce chapitre elles constituent des r f rentiels de sens pouvant am liorer les communications entre agents tout en garantissant un degr de pertinence suffisant pour les traitements qui seront effectu s de mani re automatique partir des l ments de sp cification qu elles fournissent Dans la vision du web s mantique les ontologies permettent le contr le et l exploitation de m ta donn es s ins rant dans un r seau de ressources structur es Ces donn es constituent alors des composants de connaissance partageables et exploitables intelligemment par des SBC pour la recherche d information l aide la navigation etc Et comme les domaines potentiellement mod lisables sont infinis les efforts de recherche doivent se concentrer sur la cr ation d outils g n riques acceptant autant de conceptualisations que d applications et domaines con
76. associ diff rentes ontologies de domaines pour les besoins des applications pr cises que l on aura identifi es 5 3 2 Faciliter la conception des ontologies En mati re de m thodologie de conception d ontologies beaucoup de points restent gale ment encore en suspens qui pourraient perfectionner nos propositions Nos efforts de reprise et d instrumentation de la m thodologie de conception de Bruno Bachimont n ont en effet pas r solu tous les probl mes que pourraient se poser un lecteur exigeant De m me l articulation que nous proposons entre patrons de conception et patrons d utilisation ontologiques peut soulever de nouvelles questions Impl mentation de la m thodologie ARCHONTE La m thodologie propos e par Bruno Bachimont constitue un cadre particuli rement riche On a vu en particulier comment le recours la normalisation s mantique pouvait guider tant la mani re de concevoir les ontologies que celle de les utiliser N anmoins lorsqu on essaie de la mettre en pratique de nombreuses questions apparaissent Nous avons apport des r ponses plusieurs d entre elles dans nos travaux mais certaines n ont pas t trait es par manque de temps ou bien tout simplement parce qu elles sortaient des objectifs de d part de notre travail de th se l articulation du niveau du domaine applicatif avec des notions de haut niveau Ona vu au cours des diff rentes parties de ce manuscrit consacr es aux
77. attributs ou r les la d marche de la repr sentation des connaissances permet une articulation riche des descripteurs introduits dans les index La situation on va le voir reste cependant plus d licate en ce qui concerne la substance des descriptions Les langages de RC offrent en effet des constructeurs permettant de repr senter des situations complexes repr sentations qui peuvent le cas ch ant servir d index Mais ces primitives logiques sont plus orient es vers la satisfaction de crit res ind pendants des domaines d application les expressions form es seront valides d un point de vue syntaxique et s inscriront dans un cadre pist mologique bien d fini Il reste rattacher ce langage un vocabulaire de primitives non logiques adapt es la repr sentation de connaissances dans un domaine sp cifique En principe quel que soit le formalisme retenu il est permis d introduire autant d tiquettes de pr dicats concepts relations classes r les ou autres que l on a besoin On peut donc agir sur les primitives non logiques la substance des expressions construites avec le langage de RC 45 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV et faire en sorte que celles ci cr ent bien un cadre de repr sentation adapt au domaine vis Un concept S quence pourra tout naturellement tre introduit pour cat goriser les diff rents individus d notant les s quences du monde
78. avec la finesse de l interpr tation humaine surtout si celle ci est fortement influenc e par une finalit applicative particuli re Dans le projet OPALES par exemple il s agis sait de produire des index dont le niveau de d tail est hors d atteinte pour un outil automatique comment distinguer la m re d un enfant de toutes les femmes s affairant autour de lui D aucuns peuvent affirmer que la pr sence c t d un document audiovisuel de documents plus facilement manipulables comme des documents textuels on parle de p ritertes LHBOO peut rem dier ce probl me et permet d envisager l abandon de l interpr tation humaine Les02 Le 03 ont montr que de telles sources associ es aux bons outils d extraction d informations peuvent constituer une assistance capitale indexation Mais il n est pas certain que ces do cuments existent ou soient accessibles pour n importe quelle application De plus le lien entre les informations extraites des textes et les l ments de l image s quences temporelles zones spatiales objets personnages reste d licat tablir Finalement la primaut du document au diovisuel demeure et ce pour une raison dont la simplicit confine la tautologie s il tait quivalent un ensemble de documents textuels qui existent ind pendamment de lui il n y aurait pas d int r t le produire Et de fait les p ritextes en tant que textes doivent obliga t
79. c dent servent de cadre de compr hension pour un second processus orient vers la cr ation d une ontologie crite en langage formel et dont les tapes sont 1 la pr cision des sc narios dans lesquels va s inscrire l utilisation de l ontologie 2 la construction d une liste de questions de comp tence informelles auxquelles l ontologie devra permettre de r pondre lors de son utilisation par un syst me 3 la construction d un ensemble de termes d abord informels puis formalis s dans un langage formel utilis s pour formuler des r ponses aux questions informelles 4 la construction de questions de comp tence formelles on formalise les questions informelles en utilisant les termes introduits pr c demment 5 la sp cification des axiomes les lois logiques qui permettent de r pondre aux questions formelles 6 l tablissement de th or mes de compl tude qui d finissent un ensemble de conditions n cessaires l obtention des solutions compl tes aux probl mes pos s par les questions de comp tence La m thode propos e produit donc des ensembles de termes munis d une structure l che mais dont les d finitions informelles sont suppos es guider la compr hension de l ontologie et peuvent servir pour la construction d une ontologie formalis e r sultat le plus labor du processus de construction Les auteurs de l article pr cisent que le degr de formalisation atteind
80. coll gues Le patron D amp S con u pour un usage g n rique de description semblait en effet convenir nos besoins Pour adapter ces notions au domaine audiovisuel il a fallu appliquer le patron aux deux activit s structurant le cycle de vie du document audiovisuel de t l vision avant son archivage la production et la diffusion Ainsi du point de vue de la diffusion la description d un document audiovisuel suppose un encha ne ment d v nements de diffusion tels que l mission d un programme sur un canal de diffusion Des r les de diffusion comme diffuseur ou r cepteur sont jou s par des entit s qui peuvent tre des organisations ou des personnes Et dans la description de ces v nements nous trouvons des param tres comme la date de diffusion ou le taux d audience valu s respectivement par des dates et des taux La figure 4 6 que nous avons adapt e de notre article m thodologique IBLO5 illustre la mani re dont ces concepts sp cialisent ceux du patron de conception pour obtenir un patron au niveau de l ontologie noyau Broadcaster Channel BroadcastedProgram Pah one Receiver V Y AVParameter AVRole AVCourse of Events V has fi V dalit 5 Parameter 280r L Role m0 L Course of Events S D requisite for S amp has for 2 valuedBy requisite plavedBy sequences a 2 location Z 2 y Po x 20 Region loc
81. concepts les plus g n raux que la relation pourra mettre en rapport On parle de signature et par analogie avec les relations et fonctions math matiques de domaines ou de domaine et de co domaine dans le cas des relations binaires Ces informations seront interpr t es par les moteurs d inf rence GC en conjonction avec les hi rarchies de sp cia lisation pour valider les graphes produits Ainsi un outil de cr ation de descriptions utilisant un service de validation conforme la s mantique des GC refusera en s appuyant sur la d finition de la relation aPourParticipant toute assertion de cette propri t entre des instances de types de concepts n tant pas ou ne sp cialisant pas les types Sequence et Personne La cr ation d un support hi rarchique cr e donc des contraintes interpr tables la fois par le concepteur ou l utilisateur du SBC contraintes qui ont galement une signification pour le syst me d inf rence acc dant une version encod e de ce support Toute sp cification conceptuelle du vocabulaire devra donc tenir compte de cette interpr tation respect e par les m canismes de rai sonnement exploitant les graphes conceptuels en accord avec le support Les moteurs d inf rence de graphes conceptuels reposent en effet sur la projection op ration qui vise faire correspondre un graphe donn un graphe qui le sp cialise en fonction des op rations de construction de graphes Par exemple o
82. consid r comme un tout dont on peut reconna tre les parties gr ce un crit re Pour Guarino les propri t s d signent tout ce qui pourra tre repr sent l aide d un pr dicat unaire en logique du premier ordre ce qui inclut ce que nous avons d sign jusqu pr sent par le vocable de concept Les propri t s formelles sont donc des m ta propri t s nonc es gr ce aux logiques temporelle ou modale qui s appliquent ces pr dicats unaires 120 4 2 Des propositions pour rationaliser la conception des ontologies bien particulier 10 Ainsi une propri t d pendante ne peut subsumer une propri t qui ne l est pas C est cependant la rigidit qui joue le r le le plus important puisqu elle permet de reconna tre les propri t s fondamentales qui permettent de classer les individus les types En r sum la m thode nonc e dans GW00a prend en entr e une taxonomie existante et comporte les tapes suivantes 1 clarifier les relations d instanciation de m ta propri t s par les propri t s pr sentes dans l ontologie 2 v rifier la consistance des ensembles de m ta propri t s rattach s ainsi chaque propri t la combinaison obtenue ne doit pas tre incoh rente 3 enlever toutes les propri t s non rigides on se concentre ainsi sur les types fondamentaux du domaine 4 v rifier la validit de chaque relation de subsomption 5 ajouter les autres prop
83. continuit s mantique RC formelle et graphes conceptuels Les GC que nous avons voqu s en section 2 2 1 ont par exemple t introduits comme des constructions associables une signification formelle Cette signification exprimable en logique du premier ordre est un premier pas vers une op rationnalisation par des algorithmes de raisonnement des connaissances construites l aide des graphes Dans cette optique les primitives concepts et relations introduites dans le support sont organis es par la relation de subsomption et sont munies d une interpr tation ensembliste contrainte par cette relation Les concepts d notent des ensembles d objets individuels et les relations des produits cart siens d ensembles Et d un point de vue formel la relation de sp cialisation entre concepts est interpr t e comme affirmant l inclusion des ensembles d not s par 56 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche lesdits concepts Il est noter que l interpr tation ensembliste des concepts des GC n interdit pas qu un concept puisse sp cialiser plusieurs concepts distincts dans le support on peut ainsi imaginer que le cas ch ant un concept Interview puisse sp cialiser 4 la fois les concepts Temoignage et Dialogue On parle alors d h ritage ou de hi rarchie multiple On a d j vu que le support est aussi charg de l introduction des relations conce
84. d assertions respectant le patron D amp S La double fl che indique la connaissance relationnelle d duite du chemin complexe initial Il est important de noter que si ces connaissances visent aligner la structure du patron applicatif sur celle du patron de conception le niveau auquel elles peuvent tre donn es peut tre plus g n ral dans la limite d finie par le patron noyau Par exemple une relation pratiqu Par dans l ontologie de la petite enfance pourrait tre d duite de la connaissance selon laquelle une personne joue un r le actif dans une pratique incluant l action laquelle on veut la relier cf figure 4 9 Il est vident que pour tenir compte des ventuelles variations l gitimes autour du patron mais aussi parce que le domaine est ainsi fait on doit sp cifier un tel axiome au niveau des concepts g n raux de Personne et Action et non M re et SoinHygi ne Ces connaissances de traduction seront ensuite op rationnalis es l aide de langages de repr sentation pour qu elles puissent tre exploit es par le SBC Le code 4 2 donne la traduction de la r gle de la figure 4 10 dans un des langages propos s pour repr senter les r gles dans le cadre du web s mantique SWRL HPB 04 Il faut d ailleurs remarquer qu ce stade on redevient tributaire de l expressivit du langage retenu Par exemple dans SWRL il ne sera pas possible 440n doit remarquer qu une quivalence parf
85. d un ancrage fonctionnel pour expliciter leur r le dans l application comme ils ont besoin d un ancrage ontologique stricto sensu pour d finir leur essence Mais il ne faut pas oublier comme on l a montr dans le chapitre 4 qu il faut utiliser une structure fonctionnelle qui ne s carte pas des pratiques de l application In fine c est la conjugaison des graphes patrons du contexte d interpr tation global d fini par l ontologie r f rentielle ainsi pr sent e et des contextes locaux d finis dans l ontologie diff rentielle qui a t valid e d un point de vue qualitatif ainsi guid s les utilisateurs dans notre projet ont prouv beaucoup moins de difficult s s approprier la d marche d indexation conceptuelle qui leur tait propos e On notera finalement que la souplesse offerte par la combinaison de graphes patrons flexibles et de r gles d inf rence a permis de se limiter un patron par point de vue applicatif tout en favorisant la cr ation de descriptions tr s vari es Ceci a facilit de mani re importante l appro priation de l ensemble de la d marche par nos utilisateurs non experts 5 2 3 Exp rimentation chirurgie cardiaque Au cours de notre th se nous avons pu observer des volutions techniques majeures notam ment dans le domaine du web s mantique nouveaux outils nouveaux langages Pour tre vraiment compl te la recherche qui a t pr sent e dans ce manuscrit
86. de ceux ci et non donn s sous 35Par exemple pour le point de vue d analyse audiovisuelle d OPALES la relation aPourTraitSaillant a pour co domaines des objets audiovisuels ind pendants S quence Image ou bien des propri t s d pendantes caract ristique visuelles ou sonores r sultat d une action de montage ou de filmage Son inverse local pourra tre la relation estContenuDans dans le premiers cas et la relation estUneCaract ristiqueDe dans le second 138 4 4 Ing nierie ontologique et patrons d indexation la forme de contraintes sur le contenu des BC Au cours d une tude d un corpus d ontologies formalis es les auteurs de cet article ont recueilli les formes les plus couramment utilis es pour ces axiomes On a ainsi des patrons comme Toutes les instances de la classe C ne contiennent pas la valeur V dans le slot S Ces patrons inspirent ensuite la cr ation de formulaires destin s faciliter leur saisie dans l outil Prot g et la traduction de cette saisie dans un langage de repr sentation Ces m thodes constituent des assistances utiles la capture de connaissances de raisonnement Cependant leur position au niveau pist mologique en fait des structures assez loign es de la probl matique de l usage concret d une ontologie I n y a pas vraiment de prescription d un contenu axiomatique particulier juste des indications quant aux formes que celui ci pe
87. de formalisation comme on le verra apr s Prot g avec son m canisme de m ta classes et de formulaires associ s permettrait bien de faire en sorte que la sp cification for melle d une classe soit accompagn e de la sp cification des quatres principes diff rentiels Mais il n est pas s r que la distinction entre les deux tapes soit suffisamment claire tout comme il semble tre difficile de contr ler la fa on dont ces informations sont saisies et r percut es d une notion l autre Nous avons donc pris la d cision de cr er notre propre outil qui prendrait en charge ce que les autres outils et les m thodes sur lesquelles ils s appuient ne font pas 4 3 3 DOE DOE pour Differential Ontology Editor est un outil qui se veut compl mentaire des autres diteurs orient prioritairement sur l tape de normalisation s mantique et de construc tion d une ontologie diff rentielle Il a tout d abord t r alis pour les besoins d OPALES qui demandait comme on l a d j dit un outil pour cr er des ontologies qui soient tout la fois compr hensibles par des utilisateurs non experts en RC et servir de supports pour la cr ation de graphes conceptuels le formalisme de RC retenu Nous avons d velopp DOE en collaboration avec Rapha l Troncy au tout d but de notre th se et nombre des r flexions qui suivent sont tir es de nos premi res publications TI02 BIT02 http delicias dia fi u
88. de l application vis e La mod lisation doit donc recourir une repr sentation graphiquement compr hensible ou offrir une explicitation langagi re de sa signification par le biais de d finitions ou d annotations textuelles des ressources introduites De fait les deux volets formel et informel sont indissociables dans la conception d une ontologie en tout cas si l on s en tient l acception d sormais la plus couramment r pandue de cette notion Il faut n anmoins noter que si le recours au niveau formel est imp ratif en principe on ne doit pas sp cifier de ce c t plus de choses qu on ne le fait en direction des utilisateurs humains On peut avoir envie d exprimer des informations dont l ordinateur n aura pas forc ment besoin mais dans une approche base de connaissances l ordinateur n a pas effectuer des traitements sur la base de renseignements que l on n aura pas explicitement d clar s au niveau des connaissances On peut essayer de collectionner tous ces l ments d finitoires pour rappeler qu une ontologie fournit un vocabulaire de repr sentation utilisable au sein d un SBC par le biais d une sp cifica tion explicite la fois formelle et accessible d une conceptualisation vocation consensuelle Et nous renvoyons nouveau la figure 2 1 pour une vision d ensemble de la place des ontologies dans les SBC Sp cification et continuit s mantique L ontolog
89. de la syntaxe pour les mots de la langue et les phrases 28 1 3 Le contr le du support de indexation description th matique mais aussi informations pour la gestion des supports physiques ainsi que de la notice elle m me en tant qu l ment du syst me documentaire En ce qui concerne le cas du texte l organisation de la notice en un certain nombre de champs voir section 1 1 permet d obtenir une structuration plus efficace pour la recherche Mais ce probl me de structuration de l information se repose l int rieur de la notice pour les champs qui concernent la description Le document audiovisuel est en lui m me un objet riche mais de plus il peut tre amen rendre compte de situations ou de concepts complexes Si une application requiert un niveau de description tr s fin les informations saisir dans l index peuvent prendre une forme labor e Par la suite nous allons nous attacher un exemple tir d une de nos exp rimentations que nous pr senterons plus compl tement en section 5 2 Il s agissait de d crire des vid os relatives au domaine de la m decine plus pr cis ment de la chirurgie cardiaque d un point de vue attach l analyse de la mise en forme audiovisuelle de concepts scientifiques point de vue jouet mais tr s proche dans ses pr occupations de l un des cas d utilisation du projet OPALES En l occurrence une des vid os peut tre d crite comme une miss
90. de represents en l tat actuel des choses en effet la r gle ne peut que d duire une information utilisant cette propri t m me si on tait face une propri t plus pr cise possiblement inconnue au moment de la d finition des r gles une propri t fai sant r f rence une repr sentation symbolique par exemple Mais pour cette exp rimentation nous n avons pas franchi ce pas pour rester dans les limites habituellement respect es dans les 6Ces raisonnements consistent essentiellement on le rappelle en des reformulations de requ tes pour largir ou pr ciser leurs r sultats 271 faut remarquer que les langages les plus simples de la famille OWL dont OWL DL op rent une restriction des capacit s expressives de RDFS justement pour rester dans le cadre d cidable des logiques de description qui rel vent de sous ensembles de la logique du premier ordre 28Cf la figure 2 8 de la page 56 29Pas plus que nous n avons sp cifi les r gles pour toutes les sp cialisations de relations ce que nous avions fait dans OPALES Ce probl me se pose en effet galement dans le cadre des graphes conceptuels qui respectent 178 5 2 Exp rimentations ontologiques lt composition_hasSubSequence_represents gt lt rule name composition_hasSubSequence_represents gt lt premise gt lt subject var xxx gt lt predicate uri amp av hasSubSequence gt lt object var yyy gt lt pr
91. de solution g n rale au probl me du choix m me si en ce qui concerne l indexation nous avons pu voir que certaines pistes sont privil gier De fait il existe des tudes qui essaient d analyser l expressivit des langages de repr senta tion de connaissances et des r gles d inf rence qui doivent permettre une manipulation optimale de ces connaissances Dans le cadre du web s mantique qui essaie de standardiser des langages et des outils adaptables un maximum d applications tout en conservant des propri t s per mettant leur emploi dans les conditions d chelle et de performance requises pour le web ces tudes prennent un int r t tout particulier De fait celles ci d montrent souvent que les pos sibilit s offertes par ces standards sont insuffisantes et poussent l adoption de standard plus volu s Ainsi GDGB03 pr sente une analyse des besoins en mati re de conception et d utilisa tion d ontologies biom dicales Et en d duit que si les fonctionnalit s offertes par les langages de sp cification du web s mantique et les outils qui les mettent en uvre sont utiles il peut tre n cessaire de se tourner vers d autres langages pour repr senter des connaissances de raisonne ment pertinentes pour les domaines applicatifs concern s notamment pour d finir des r gles de composition de relations Des solutions adapt es m langeant techniques standard du web s mantiques et outils issus
92. des connaissances de raisonnement ind pendamment de langages particuliers On peut ainsi faciliter le partage et la r utilisation d axiomes dont les cons quences sont semblables alors que leur encodage diff re De fait ces patrons sont d finis par les contraintes qu ils imposent aux connaissances assertionnelles de la BC que ce soit en entr e pour qu ils puissent s appliquer ou en sortie puisque leur application produit de nouvelles assertions ou bien des contraintes sur les assertions existantes SEMO1 fournit l exemple du patron range local inverse ou une relation est d finie comme l inverse d une seconde mais uniquement lorsque celle ci prend ses valeurs dans un co domaine particulier Mais d autres patrons sont voqu s comme celui du raisonnement partie tout de l h ritage avec exception On a donc affaire des sch mas d axiomes exprim s au niveau de la connaissance mais traduits en termes de besoins concrets vis vis de la gestion d une BC Des traductions op rationnelles de ces axiomes sont ensuite fournir suivant le m ta langage de repr sentation retenu et bien s r en fonction des concepts et relations de l ontologie qui ils s appliquent HNMO2 propose une approche plus proche des langages formels classiques Les patrons que ces auteurs pr sentent sont en fait des nonc s au niveau de la connaissance de sch mas d axiomes qui sont de fait assez semblable la forme logique
93. des d finitions informelles De plus il faut rappeler qu un certain nombre d informations centrales les principes diff rentiels notamment ne peuvent tre explicit es que dans une seule langue qui prendra alors le statut de langue de r f rence pour l ontologie Toutes les langues ne sont donc pas trait es de la m me mani re 0Par opposition des Pratiques qui ont une vocation plus globale 132 4 3 Prescrire une mani re de construire les notions ontologiques valeur possible DWS qui l oppose aux autres fr res et donc qui diff rencie ses instances de toutes les autres instances du p re L interface de l diteur refl te ce cheminement comme le montre la figure 4 2 qui illustre l exemple d roul jusqu a pr sent notamment aux pages 89 et 125 pour le concept PersonnelEquipe On a vu que la mod lisation diff rentielle d une notion permettait de d finir celle ci par Vinterpr tation de sa position dans la structure hi rarchique globale de l ontologie A titre infor matif l diteur g n re donc dans l onglet Definition une d finition diff rentielle des notions en affichant le chemin menant de la racine de l arbre la notion consid r e et en r capitulant les valeurs des diff rences avec les p res rencontr es sur ce chemin Cr ation d une ontologie r f rentielle dans DOE Gestion des informations r f rentielles L objectif de la formalisation est d attacher aux noti
94. des descriptions Par exemple on a vu que les domaines formels des relations permettent de contr ler les individus qu elles relient En conjugaison avec d autres connaissances formelles comme la hi rarchie de subsomption ou des axiomes comme l exclusion entre concepts on peut donc contr ler les assertions relationnelles Le probl me est que ce contr le reste local En principe certains langages de RC proposent des primitives permettant d interdire certaines configurations plus complexes C est le cas des logiques de descriptions qui autorisent l laboration de descriptions comportant des n gations de formules complexes gr ce au constructeur not de compl mentation de concept On pourrait ainsi d finir la relation aPourTraitSaillant comme ayant pour domaine l ensemble des objets audiovisuels l exception des ceux qui font l objet d une d composition dans la BC on obligerait ainsi l indexeur sp cifier quels sont les l ments de cette d compostion auxquels s applique cette propri t aPourTraitSaillant E domain and AVObjet not some contient AVObject Mais ces possibilit s restent peu utilis es En grande partie cela tient 4 la complexit induite par de tels m canismes que ce soit pour les syst mes de raisonnement ou bien pour les humains qui doivent concevoir les sp cifications formelles Mais on peut aussi consid rer que l on n a toujours pas l de r ponse la question de la complexit
95. des ontologies plus 1On utilise pour qualifier de telles ontologies le qualificatif de lourdes heavyweight On a une opposition entre ces ontologies lourdes et les ontologies l g res lightweight qui en g n ral se limitent l introduction de simples hi rarchies de concepts http wuw daml org ontologies 111 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique labor es mais celui ci n a pas vraiment co ncid avec un accroissement de la circulation de tels artefacts contrairement ce que l on pourrait esp rer Cr er une ontologie complexe requiert des efforts importants et seules les initiatives de recherches publiques DOLCE GALEN sont propices la mise disposition relativement libre d une telle valeur ajout e La t che ne peut donc tre que plus ardue si comme nous on veut prendre en compte correctement des usages pr cis et apporter des solutions adapt es aux imp ratifs d accessibilit et de pertinence qui d coulent d un tel choix Nos propositions en mati re d utilisation des ontologies ont n cessairement un impact sur leur construction Il faut que les ontologies en tout cas dans le cadre de l indexation soient con ues de mani re prescrire des sp cifications en accord avec les interpr tations naturelles du domaine et leur vocabulaire doit s ins rer dans des usages descriptifs pr cis formalis s par les patrons d indexation Ce
96. des types introduits dans les ontologies de haut niveau ou de domaine Par exemple en s int ressant au comportement dans le temps et dans l espace des possibles d un lien unissant une instance son type Nous reverrons ces consid rations dans la section 4 2 2 On peut retrouver ces notions dans les d finitions formelles des ontologies mais de fait nous visons surtout ici les d finitions langagi res plus proches des m canismes cognitifs suppos s tre en jeu chez les experts du domaine Il serait ainsi tout fait envisageable et naturel dans le domaine de la petite enfance de paraphraser m re nourrissi re par m re reconnue comme telle car ayant contribu l alimentation de ses enfants expression qui met bien en valeur la notion structurante de m re dans ce cas Cette hypoth se ne peut cependant tre v rifi e que si l on dispose effectivement de strates ais ment identifiables dans l ontologie tudi e ce qui suppose qu elle a t con ue suivant des principes pr cis Dans la pratique une telle situation n est absolument pas garantie Cela est particuli rement vrai en ce qui concerne les relations qui sont souvent introduites dans des hi rarchies de profondeur moindre que celles des concepts parfois m me sous la forme de listes non hi rarchis es 103 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques Il ne faut pas non plus aller vers le trop sp cifiq
97. description textuelle il faut donc adresser une r ponse satisfaisante ce probl me de variabilit 8Dans le domaine de la recherche d information le silence d signe les r sultats r pondant une requ te mais non renvoy s par le syst me de recherche Le bruit d signe lui les r sultats faux renvoy s par le syst me 22 1 3 Le contr le du support de l indexation A VINA comme dans d autres organismes la continuit est en partie assur e par l utilisation d un certain nombre de savoirs relatifs la production des descriptions Un ensemble de connais sances explicites ou tacites est en effet partag par les documentalistes tout au long de la cha ne documentaire Un thesaurus cf section 1 3 2 fournit un vocabulaire commun de description des guides de r f rence et des r gles d indexation renseignent sur les aspects des documents d crire et sur la mani re de les d crire On peut aussi essayer de tenir compte des variations historiques des indexations produites Mais tr s souvent on se repose encore sur les savoirs implicites qui constituent l environnement des documentalistes sur leur connaissance du fonds documentaire de l Institut sur leur savoir faire ou leur intuition pour r pondre des questions en compensant les effets de la variabilit Et d s que les moyens et la nature de la mission assur e par l organisme le permettent on pr f re laisser la t che de la recherche entre le
98. difficult de l acc s l information renferm e dans un document bien que commune tous les types de documents est particuli rement importante dans le domaine de l audiovisuel Et que ce probl me m me dans une approche num rique du traitement de l information impose toujours une tape de description du contenu du document on retrouve le processus de l indexation tel qu il appara t dans les syst mes documentaires clas siques L index utilisant traditionnellement une forme langagi re textuelle synth tise les ren Comme nous verrons par la suite nous allons nous focaliser sur le probl me de la recherche d index Cela nous permet pour l instant de faire abstraction de la finalit effective du syst me d information qu il s agisse de retrouver des mat riaux documentaires ou bien de l information sans chercher acc der un support 12 1 2 Le probl me de l acc s l information pour les documents audiovisuels seignements pertinents pour l application envisag e et tient lieu de substitut du document dans le processus de recherche documentaire Nous allons cependant observer que le recours une description textuelle ne r sout pas toutes les difficult s De gros probl mes de variabilit demeurent que ce soit au niveau de la production des index ou de leur compr hension et imposent le recours des processus de contr le surtout en ce qui concerne le langage employ pour la c
99. documents audiovisuels dans les processus documentaires d un point de vue particulier celui de l application envisag e pour le syst me documentaire C est donc celle ci qui va nous int resser en premier lieu Selon l AFNOR AFN93 l indexation est l op ration qui consiste d crire et caract riser un document l aide de repr sentations des concepts contenus dans ce document c est dire transcrire en langage documentaire les concepts apr s les avoir extraits du document par une analyse La finalit de l indexation est de permettre une recherche efficace des informations pr sentes dans un fonds de documents et d indiquer sous une forme concise la teneur d un document Pour Bruno Bachimont Bac98 une indexation est la paraphrase d un contenu en une forme s miotique permettant de rendre exploitable le contenu index pour une pratique donn e Ces deux d finitions rendent bien compte de ce qu est l indexation une repr sentation l index doit repr senter correctement le contenu du document analys Il doit prendre une forme inspir e par les usages et besoins documentaires propice le rendre ais ment interpr table par celui qui y acc de une repr sentation centr e sur un usage plut t que sur la description en elle m me le premier crit re de pertinence d un index est qu il doit servir retrouver l information utile pour l exploitation vis e Plus qu u
100. du champ traditionnel de l intelligence artificielle peuvent tre d velopp es pour r pondre 36Ce pourquoi les travaux existants visent dans un premier temps l laboration d assistant la publication plut t qu une cr ation documentaire enti rement automatis e 3TEn l occurrence OWL Prot g et des raisonneurs pour les logiques de description tels que FaCT Hor98 et Racer HM03 188 5 3 Discussions m thodologiques de fa on ponctuelle de tels probl mes GI04 en attendant ventuellement l mergence de nouveaux standards Mais ces approches peuvent parfois souffrir du manque de maturit des sys t mes employ s ou tout simplement de la trop grande complexit des algorithmes requis Dans un contexte proche du n tre celui de la caract risation automatique de r gions de documents visuels LH04 montre bien les probl mes de performances rencontr s en utilisant des outils qui font encore partie de l tat de l art en mati re de recherche On retrouve donc le dilemme traditionnel de la repr sentation formelle de connaissances et de leur manipulation automatique par des m canismes de raisonnement Recourir des connaissances et des traitements riches est videmment int ressant au regard de la qualit des r sultats obtenus mais les efforts requis sont plus importants que ce soit pour les concepteurs des ressources ontologiques qui seront utili s es par le syst mes pour ceux qui cr
101. e Il s agit tant de connaissances d finitoires que de r gles de coh rence contr lant l emploi du vocabulaire C2 Descriptions L ensemble des descriptions doit tre consid r comme un ensemble de connaissances interpr tables tant par le syst me que l utilisateur final La cr ation des descriptions r sulte d un engagement de la part de l indexeur par rapport au r f rentiel de signification d fini par le langage il importe de saisir et d exploiter ces donn es en fonction de cet engagement C3 Syst me L exploitation de descriptions et de langages de descriptions labor s n cessite videmment le recours un syst me autorisant la cr ation et la manipulation des unes en fonction des autres Id alement un tel syst me doit tre g n rique capable d adapter son comportement en fonction des connaissances dont il dispose les descriptions bien s r mais aussi les langages qui varient en fonction des pratiques consid r es Nous allons voir pr sent qu il est naturel dans un tel cadre de se tourner vers des syst mes base de connaissances Issus des recherches en intelligence artificielle certains travaux du do maine de la repr sentation des connaissances Kay97 fournissent en effet des outils permettant la cr ation de ressources riches et mobilisables au sein de processus d inf rence L interpr tation du langage documentaire et des descriptions construites va tre augment e d une interp
102. elle h rite des s mes g n riques Par exemple on pourra affirmer que coureur cycliste subsume grimpeur et rouleur En pratique chaque notion doit tre carac t ris e par ses similarit s et ses diff rences avec les notions qui sont plac es dans son voisinage proche la notion parente et les notions sceurs Pour expliciter ces information Bac00 propose quatre principes inspir s de la m thode aristot licienne de d finition des essences par genre proche genus et diff rence sp cifique dif ferentia le principe de communaut avec le p re dans nos travaux on retrouvera les d nominations similarity with parent ou SWP on explique pourquoi le fils h rite des propri t s de la notion qui le subsume le principe de communaut avec les fr res similarity with siblings ou SWS on donne un axe s mantique une propri t admettant plusieurs valeurs exclusives qui permet de comparer les notions d une m me fratrie le principe de diff rence avec les fr res difference with siblings ou DWS on indique ici la caract ristique qui permet de distinguer la notion consid r e de ses notions sceurs le principe de diff rence avec le p re difference with parent ou DWP on explicite finalement la diff rence qui permet de distinguer le fils du p re diff rence r sultant g n ralement des traits ayant permis de caract riser distinctement la notion du reste de sa fratrie
103. en propose plusieurs disponibles http protege stanford edu 47I faudrait alors appliquer le m me traitement de visualisation ces deux patrons Le patron de conception en particulier peut tre consid r comme tant lui aussi au niveau structurant mais en comparaison des autres notions de l ontologie fondamentale dont il est issu ce qui le place par rapport cette derni re dans la m me position que le patron applicatif par rapport l ontologie de domaine 152 4 5 Conclusion Une telle instrumentation ne doit pas exiger un travail insurmontable Malheureusement il n a pas pu faute de temps tre r alis dans le cadre de notre th se 4 5 Conclusion Ce chapitre s est donc attach mieux prendre en compte les besoins li s la cr ation et Vutilisation des connaissances assertionnelles pour nous les index lors du d veloppement des ontologies Poursuivant sur la lanc e du chapitre 3 nous avons voulu voir comment on pouvait assister la cr ation de substances ontologiques et de formes relationnelles adapt es nos applications Apr s avoir constat que les m thodologies et outils existant ne traitaient pas compl tement ces probl mes nous avons propos nos propres solutions la fois m thodologiques et techniques En ce qui concerne la cr ation d ontologies dont le vocabulaire serait sp cifi de mani re pertinente au regard de l application vis e nous nous sommes tourn
104. enceintes mangent Co usPE ent davantage 4 agrumes 2 davantage de fruits agrumes et des l gumes fur z i 1220 de fruits ie class s comme froids afin que leur lait est hyperonyme de Z per u comme chaud soit suffisamment bon et ui TOK abondant pour I enfant qui va naitre En l occurence les femmes enceintes mangent rex DR fet des l gumes 2 sois 2 davantage de fruits agrumes et des l gumes JUL X Fic 3 1 Extraction de termes et d nonc s d finitoires extrait de MZB04 Une ligne correspond une d tection r ussie d un patron lexico syntaxique elle pr sente les deux unit s lexicales li es et le type du lien s mantique d tect Certaines approches proposent de rattacher automatiquement les notions ontologiques des 81 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques textes du domaine qui leur fourniraient un contexte d interpr tation satisfaisant De fait cette vision est li e tout un courant pr conisant la construction d ontologies partir de ces textes m mes voir BACO4b pour un aper u r cent Non seulement des outils d analyse textuelle extraient des termes mais ils s efforcent de les rattacher en permanence pendant le processus de construction puis dans l ontologie construite aux passages textuels desquels ils ont t extraits Certains vont plus loin en exploitant les nonc s particuliers qui ont une valeur d finitoire
105. ent les assertions factuelles qui repr sentent les contenus documentaires mais aussi pour le syst me qui effectue les traitements automatiques Or il semble qu un haut degr de complexit ne puisse faire l objet d conomies pour les applications qui nous int ressent En ce qui concerne les besoins sp cifiques la description de contenus documentaires et en particulier de contenus audiovisuels nous ne sommes en effet pas les seuls avoir d gag la n cessit des connaissances de raisonnement illustr es au fil de ce manuscrit M me s ils ne s inscrivent pas dans une approche m thodologique comparable la n tre et s attachent moins au cas du document audiovisuel des travaux comme ceux expos s dans GHB96 et Oun98 ont d gag l importance des connaissances relatives aux relations et en particulier a l agencement de celles ci Une telle approche semble tout fait envisageable dans le cas de volumes d information relativement r duits apr s tout le comportement du moteur d inf rences d OPALES n a pas montr de signe de faiblesse pas plus que les syst mes que nous avons employ s dans notre exp rimentation de la section 5 2 3 Cependant des tudes quantitatives impliquant un plus grand nombre de donn es seraient int ressantes si l on veut par exemple largir le champ de nos propositions des collections documentaires plus importantes Ce probl me de la complexit des m canismes d inf renc
106. et patient dans un autre Finalement ces r les tant int gr s en dur aux mots clefs il est difficile de les faire b n ficier d un traitement particulier conforme aux besoins de l application envisag e moins d adapter le syst me documentaire lui m me au thesaurus employ ce qui lui ferait incontestablement perdre en souplesse et g n ricit 5 M 2 A En pratique dans un syst me documentaire informatis les notices structur es en champs pourront tre en effet stock es dans des bases de donn es ce qui permettra une interrogation et un acc s imm diats aux donn es de chaque champ des croisements entre valeurs de diff rents champs etc 30 1 3 Le contr le du support de l indexation th tre infrastructure th tre th tre de plein air UP th tre de verdure th tre b timent mat riel th atre masque de th tre rideau de th atre organisme th atre troupe th trale peinture art mat riel peinture art palette de peintre UP palette pinceau personne peinture art artiste peintre mod le technique peinture art peinture murale fresque peinture rupestre peinture sur tissu TAB 1 6 Les facettes dans le thesaurus de PINA Un indique une notion qui ne peut tre employ e comme descripteur 31 Chapitre 1 La description des documents audiovisuels dans les processus documentaires Pour ces raisons et d autres voir Blo04 les syst mes util
107. existantes La phase de capture est la plus importante pour essayer de pr ciser le sens des concepts manipul s on tudie d abord la port e de l ontologie ce qui permet de d gager les termes pertinents du domaine d effectuer ensuite des regroupements des termes qui apparaissent souvent ensemble et de commencer rep rer les termes qui peuvent tre rapproch s par similarit ou synonymie On essaie ensuite de produire des d finitions des termes utilis s en utilisant une d marche middle out il est plus important de d finir en premier les termes qui apparaissent comme cognitivement basiques 5Classiquement on distingue trois modes de construction des hi rarchies de concepts et de relations top down descendante on commence par introduire les notions dont le niveau de g n ralit est le plus grand bottom up montante on commence par les notions les plus sp cifiques et on effectue des regroupements de ces notions pour cr er des notions plus g n rales middle out on commence par les notions pertinentes du domaine que l on sp cialise ou g n ralise pour obtenir une hi rarchie compl te 115 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique dans le domainef Il faut faire attention produire des d finitions consensuelles les plus compl tes possibles et donc viter les termes ambigus les d finitions circulaires Les consid rations qui pr
108. exp rimentations de concep tion ontologique qu il faut s efforcer de rattacher les primitives congues pour une application donn e a des notions plus abstraites b n ficiant d un effort de l gitimation th orique cons quent Ce besoin que nous avons affirm clairement dans le cadre de la r utilisation de patrons de conception a t quelque peu nuanc d s lors qu il s agissait de s engager par rapport 4 une structure lourde sans rapport imm diat avec l usage vis De fait les contraintes impos es par la normalisation s mantique et notamment l interdiction de l h ritage multiple forcent le concepteur de l ontologie un engagement extr mement fort dans l tape de normalisation Or il peut adapter par la suite certains des choix qui ont t faits lors de cette tape la formali sation des connaissances autorisant une flexibilit plus grande qui permet de se rapprocher des conceptualisations pragmatiques que l on rencontre dans les domaines d applications concrets 41Ce contenu peut lui m me tre repr sent de mani re complexe comme nous l avons recommand mais cela devra se faire avec l aide d une ontologie th matique appropri e et non de celle de l ontologie de l audiovisuel elle m me 191 Chapitre 5 Exp rimentations et discussions Il faut donc trouver un moyen de rationaliser les concepts diff rentiels de plus haut niveau de mani re produire l engagement
109. exploitable automatiquement de ces connais sances de raisonnement autorise un syst me g rer simultan ment un point de vue ad quat cognitivement et op rationnellement avec les usages du domaine et un autre se r f rant plus des principes de mod lisation de haut niveau Cette situation a deux avantages D abord la connaissance est utilisable de mani re satisfaisante pour l application vis e on peut sp cifier de fa on naturelle des connaissances de raisonnement pertinentes et on prescrit bien une des cription adapt e aux pr occupations applicatives Ensuite cette connaissance acquiert un statut plus consensuel chaque fois que c tait possible on a tent de se rapprocher de la structure du patron Les informations de l application peuvent tre reprises dans d autres applications construites autour du m me noyau ontologique ce qui ne peut qu am liorer l interop rabilit de ces syst mes 4 4 4 Discussion Apr s avoir constat la pertinence de l emploi des patrons d indexation pour l utilisation des ontologies nous avons explor le moyen d en tenir compte d s le d veloppement de celle ci De fait nous ne sommes pas les seuls avoir pris acte de l existence de motifs r guliers dans les connaissances applicatives se r f rant aux design patterns du g nie logiciel des travaux proposent d j des solutions d ing nierie ontologique qui exploitent des th ories ou des entit s abstrai
110. fait que nous sommes convaincus comme beau coup que l am lioration de la qualit intrins que des ressources ontologiques est n cessaire pour faciliter leur conception aussi paradoxale cette affirmation puisse para tre au premier abord 4611 faut conc der que ces patrons de conception et en particulier celui que nous avons pr sent peuvent tre d inspiration cognitive et ce titre prendre quelques libert s avec la rigueur m taphysique si celles ci correspondent une r alit cognitive observable Il reste que par rapport des conceptualisations ancr es dans un domaine les patrons de conceptions restent par s d une certaine aura d objectivit 196 5 3 Discussions m thodologiques et leur utilisation Mais nous ne perdons pas de vue un autre objectif fondamental des approches ontologiques de la repr sentation de connaissances et en particulier du web s mantique celui d une meilleure r utilisation des ressources et des syst mes qui les utilisent En effet si l on relie le contenu et le fonctionnement d un SBC d di une seule application des mod lisations relativement consensuelles on augmente les chances que celui ci aura d tre utilis par des agents qui ne sont pas immerg s dans le contexte applicatif consid r Et ceci que ces agents soient des utilisateurs humains ou d autres syst mes qui utilisent les services du SBC consid r Car si les conceptualisations d
111. forme de la description nous cherchons adopter un paradigme relationnel de repr sentation des interpr tations qui puisse rendre compte d un contenu compos de notions associ es les unes aux autres Une description doit contenir les concepts issus de l interpr tation des contenus mais aussi les relations qui les articulent en une signification qui est n cessairement plus complexe qu une simple liste de notions substance de la description il s agit pour chaque application d un syst me d indexation de pouvoir d finir un vocabulaire de description la fois pour les concepts pr sent s et les liens les unissant Les pratiques vis es par les indexations emploient des notions dont le sens sp cifique doit pouvoir tre d fini explicitement l emploi de ces notions lors de la cr ation des descriptions est une condition n cessaire de pertinence pour le syst me F2 Contr le La continuit s mantique exige on l a vu le recours des m canismes de contr le des interpr tations que ce soit lors de leur formulation ou lors de leur acc s et de leur compr hension lorsqu un utilisateur ou le syst me lui m me doit op rer une forme de r interpr tation n cessaire leur exploitation L encore on peut d composer la t che suivant les aspects pr c demment voqu s humains et syst mes qui complexifient d autant le probl me de la continuit s mantique 18Cette vision nous distingue qu
112. g 2000 importait OWL Puisque celui ci avait d j d montr sa capacit importer nos ontologies traduites en RDFS et que sur le plan de la syntaxe il n y a que peu de diff rences entre la mani re d exprimer nos informations formelles limit es en RDFS ou en OWL nous n avons pas jug utile de nous relancer dans de fastidieux tests Cet unique r sultat positif n a en effet t obtenu qu apr s 3 A part le fait fondamental d un point de vue s mantique mais minime d un point de vue syntaxique qu une classe soit introduite en OWL par la primitive owl Class et en RDFS par rdfs Class Ce qui ne diminue pas la valeur de ce r sultat Nous avons r ussi exporter nos ontologies peu pr s correctement vers le seul diteur capable l poque de les importer 184 5 2 Exp rimentations ontologiques Vapplication de solutions quelque peu empiriques que le lecteur int ress pourra voir plus en d tail dans notre article I TM03 Comme les exp riences conduites pour essayer d importer dans DOE des ontologies OWL produites avec les autres outils l ont confirm l absence de maturit en tout cas ce moment de la norme avait pour cons quence des interpr tations assez libres nuisibles l interop rabilit des outils qui reposaient sur ces interpr tations Nul doute qu pr sent la m me exp rience aurait des r sultats largement plus positifs 5 2 5 R capitulatif Au cours d
113. gt lt subject var propriete representation inconnue gt lt predicate uri amp rdfs subProperty0f gt lt object uri amp av represents gt lt premise gt lt consequent gt lt subject var xxx gt lt predicate var propriete representation inconnue gt lt object var zzz gt lt consequent gt sp cialisant represents dans Sesame 180 5 2 Exp rimentations ontologiques Conception d une ontologie test Pour tester les possibilit s de chacun des diteurs engag s dans l valuation les organisateurs ont propos de reprendre un th me introduit pour l dition pr c dente de l atelier le voyage touristique Pour cette valuation destin e comparer les possibilit s de mod lisation des diff rents outils les organisateurs n avaient pas propos d ontologie toute faite une telle ontologie aurait n cessairement refl t un point de vue de repr sentation particulier introduisant certains types d informations et pas d autres mais un court texte pr sentant le domaine d une applica tion Les ontologistes avaient ainsi une description naturelle des besoins li s l application cf figure 5 9 qu ils pouvaient utiliser pour guider leur conceptualisation We know that when a client makes a trip he chooses transport and accommodation Hence we start by determining the means of transport that are currently available for a travel agency We will have in our ontology the fol
114. la plus proche La g n ralisation de ces liens permettant de relier toutes les notions entre elles fait de cet ensemble un v ritable syst me d interpr tation qui peut d s lors constituer un r f rentiel s mantique ad quat C est la position dans le syst me qui donne un sens l unit consid r e 3Les exemples proviennent d une exp rimentation conduite PINA en collaboration avec Rapha l Troncy et Estelle Le Roux dans le cadre de leur th ses CIFRE respectives Le 03 Tro04 le lecteur peut se r f rer la section 5 2 1 de ce manuscrit pour plus de d tails Nous avons pr f r les conserver en continuit avec les publications relatives ce sujet que constituent TI02 BITO02 87 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques Il faut cependant signaler que ce sens diff rentiel est toujours d pendant d un contexte qui encadre l interpr tation qui dans le cas de la s mantique diff rentielle est le processus d attri bution des s mes aux unit s linguistiques La liste des s mes associ s une unit est en effet variable chaque occurrence de l unit dans un contexte va enclencher un processus d interpr tation Au cours de celui ci en fonction des s mes inh rents de l unit vis e ceux qui lui sont associ s par d faut et de ceux des unit s qui se situent dans son contexte on op re une r attribution des traits s mantiques certains s
115. la relation correspondante entre les deux Certaines d finitions de concepts parmi les plus simples ont donc t rajout es une formalisa tion l mentaire ainsi qu on peut le constater en consultant les exemples de la section 4 3 1 ou l annexe C de la th se de Rapha l Troncy o une version OWL de cette ontologie est livr e dans son int gralit Tro04 En tout et pour tout l ontologie du cyclisme compte 97 concepts et 61 relations pour une profondeur maximale de 10 Il est int ressant de mentionner ici que cette ontologie n tait pas destin e directement l indexation humaine et ne comporte donc pas de patron d indexation pr sent explicitement comme r pondant la pr occupation globale d une application Pourtant le besoin de d terminer des structures descriptives r currentes a t pr sent m me si ces structures multiples se pr sentent sous l aspect l mentaire de d finitions par condition n cessaire introduisant les entit s toujours li es un concept structurant pour l application De fait comme dans l exemple de MENELAS que nous avons discut en page 102 on a affaire ici des patrons implicites et locaux destin s un usage d extraction semi automatique d information Analyse ontologique formelle et cyclisme Pour cette exp rimentation il faut galement ajouter que dans la perspective de nos inves tigations m thodologiques nous avons cherch appliquer
116. les tapes propos es nous nous sommes syst matiquement int ress celles qui sp cifient le contenu ontologique proprement dit cr ation des concepts et relations d finition de leur signification naturelle et formelle encodage des connaissances de raisonnement C est en effet de cette phase que d pend tout le reste L valuation par exemple est seconde puisqu elle prend pour objet le r sultat d un processus de conceptualisation avant d en re d clencher un nouveau si besoin est Et l tape de documentation si elle peut s effectuer au m me moment que la conceptualisation reste enti rement subordonn e celle ci Les propositions d Uschold et Griininger Cette m thodologie pr sent e dans UG96 regroupe des recommandations introduites dans UK95 et GF95 issues de la construction de deux ontologies particuli res De fait ce travail int gre deux aspects successifs de la construction d ontologie un d veloppement informel suivi d une conception formelle Les tapes principales du processus de d veloppement informel des ontologies sont 1 la d termination claire du but de la construction de l ontologie et du domaine concern 2 la construction de l ontologie 3 l valuation du r sultat 4 la production d une documentation La proc dure de construction elle m me comporte une phase de capture des connaissances une phase de codage et une phase d int gration d ontologies
117. les informations fac tuelles de l identification en y ajoutant selon le niveau de d tail retenu les auteurs et participants principaux du documents les informations de g n rique la th matique g n rale du document ou encore un r sum objectif de l enchainement des s quences qu il comporte Seul le troi si me niveau de description fait intervenir une phase d interpr tation L indexation vise en effet cat goriser le document d apr s son contenu suivant le point de vue applicatif retenu Catalogage et indexation sont les produits de l analyse documentaire ce que Waller dans Wal99 d crit comme l tape de la description qui consiste pr senter sous une forme organis e concise et pr cise les donn es contenues dans un document ou un ensemble de documents L analyse documentaire distingue les informations d identification et de catalogage de bas niveau de celles se rapportant un examen plus approfondi du document la description du contenu Cette derni re s articule le plus souvent autour de deux produits le r sum et l indexation Le premier est cens donner une repr sentation de ce que pr sente le document fid le l organisation cr e par son auteur c est en cela qu on a pu le qualifier d objectif dans le paragraphe pr c dent La seconde quant elle a aussi vocation repr senter le contenu du document mais elle le fait 17 Chapitre 1 La description des
118. location 1 Region location 1 Region part 0 Object part 0 Event setting 0 Situation setting 0 Situation part 0 Situstion setting for 1 Fic 4 4 Patron de conception Descriptions amp Situations extrait de GM03 Il faut galement remarquer que si les patrons viennent bien avec des axiomes logiques ceux qui sont rattach s ses concepts et relations dans DOLCE ils demeurent ind pendants de langages de RC particuliers Les auteurs mentionnent galement parmi les crit res que doivent valider un patron sa capacit tre repr sentable de fa on intuitive et compacte On augmente ainsi la capacit du patron tre ais ment compris et repris Une telle structure est de fait ais ment adaptable la conceptualisation d un domaine par ticulier pourvu que l usage vis par cette nouvelle conceptualisation soit similaire celui qui a dict l laboration du patron Il suffit alors de rattacher aux notions qu elle introduit celles plus sp cifiques du domaine d application envisag Cela se fait en sp cialisant par subsomption classique les concepts pr sents dans le patron de conception La figure 4 5 montre comment les concepts de D amp S ont t ainsi sp cialis s pour s adapter au domaine de la description de processus d inflammation et de leur r sultats GCB04 on transpose tout d abord les concepts g n riques du patron en des concepts qui ont tou
119. ments audiovisuels Appliation un corpus de journaux t l vis s In 14 me Congr s Francophone de Reconnaissance des Formes et Intelligence Artificielle RFIA 2004 Toulouse 2004 MAH03 MELAND P H AUSTVIK J et HEGGLAND J Using Ontologies and Semantic Networks with Temporal Media In Semantic Web Workshop at the 26th Annual International ACM SIGIR Conference Toronto Canada 2003 Mal05 MALAISE V M thodologie linguistique et terminologique pour l aide la construction d ontologies diff rentielles partir de corpus textuels Th se de doctorat Universit Paris VII 2005 Map95 MAPLE A Faceted Access A Review of the Literature Music Library Association Annual Meeting 1995 MBC95 MECHKOUR M BERRUT C et CHIARAMELLA Y Using Conceptual Graph Fra mework for Image Retrieval In International Conference on Multi Media Modeling MMM 95 Singapore 1995 MBG 02 MasoLo C BORGO S GANGEMI A GUARINO N OLTRAMARI A et SCHNEIDER L Wonder Web Deliverable D17 The WonderWeb Library of Foundational Ontologies and the DOLCE Ontology Rapport technique ISTC CNR 2002 MCMO03 MARTINET J CHIARAMELLA Y MULHEM P et OUNIS I Photograph indexing and retrieval using star graphs In Third International Workshop on Content Based Multimedia Indexing CBMI 03 Rennes France 2003 Men03 MENZEL C Reference Ontologies Application Ontologies Either Or or Both And In Workshop on Refer
120. n rales ObjetSpatial et Activit L utilisateur n a pas en effet tre confront ces connaissances qui sont justement con ues pour faciliter sa t che de mani re transparente en assouplissant les contraintes impos es par le contr le ditorial que constitue la donn e des patrons Les r gles ne doivent donc pas cibler exclusivement les concepts et relations structurants du domaine mais au contraire tenter de compenser des variations par rapport ces notions qui soient d une amplitude maximale 3 4 Conclusion On a constat qu il tait n cessaire de compenser l aide de propositions techniques ou m thodologiques la complexit apport e dans les processus documentaires par l utilisation d outils de repr sentation et d exploitation des connaissances formalis es Pour cela il faut essayer de se rattacher syst matiquement aux usages rencontr s dans l application vis e par le syst me do cumentaire Ceci concerne tout aussi bien la compr hension des notions employ es que la fa on dont celles ci sont utilis es pour cr er des descriptions des contenus documentaires m me de satisfaire les besoins auxquels le syst me est suppos r pondre en l occurrence ceux de la recherche documentaire Lors de l ouverture de cette seconde partie nous avons donn une liste de points m thodolo giques la lumi re desquels il est possible de r capituler les contributions de ce chapitre Tout d abord
121. nous avons d gag s De fait comme les nombreux exemples concrets dont nous avons illustr s nos propositions le laissent envisager ce cadre n a pas t labor in vitro uniquement partir de l tat de l art certes important et d un effort th orique de rationalisation m thodologique Il est en effet galement le fruit d exp rimentations diff rentes chelles et sur diff rents sujets tous cependant li s l indexation de documents audiovisuels Ces exp rimentations ont permis d observer des probl mes concrets mais aussi de tester de faire m rir les hypoth ses ou les outils que nous avions avanc s Nous allons pr sent d tailler les plus significatives d entre elles Nous ajouterons cette pr sentation l expos d un certain nombre de points de discussion qui pour les syst mes documentaires audiovisuels base d ontologies consti tuent autant de probl mes toujours r gler ou bien des pistes qui nous semblent int ressantes voquer pour de futures recherches 5 2 Exp rimentations ontologiques Pour chacune des exp riences de conception d ontologie dans lesquelles nous avons t impli qu nous allons pr senter d un point de vue qualitatif et quantitatif les concepts les relations les r gles et graphes patrons qui constituent le contenu de l ontologie voquer la mani re dont l ontologie est exploit e par un SBC son usage discuter de l
122. ont t d velopp s par d autres que nous dans le projet dans lequel nous tions impliqu au d but de cette th se Nous avons cependant cr un diteur d ontologie appropri au moment o il le fallait et discut des conditions de r utilisation des outils et techniques propos s dans notre champ via l vocation des fonctionnalit s qui sont indipensables la mise en uvre de nos propositions Ainsi en mati re de conception formelle d ontologie et d utilisation de m canismes de raisonnement il faut videmment que l expressivit autoris e par le moteur d inf rences soit importante notamment en ce qui concerne l utilisation des relations entre entit s Et si nous n avons pas d taill les modalit s de prise en compte des patrons d indexation lors de la cr ation des descriptions c est parce que les fonctions requises telles que la possibilit de stocker un graphe et le copier dans une annotation comme cela a t fait dans OPALES ne semblaient pas complexes Par contre un cadre technique permettant la cr ation des patrons d indexation la gestion des liens entre ces patrons mais aussi celle des liens entre patrons de conception et patrons d utilisation aurait t bienvenu Surtout s il avait permis ces activit s en liaison avec la sp cification des autres types de ressources ontologiques auxquelles ces patrons sont li s comme les connaissances de raisonnement Plus g nant est le constat
123. ont grandement particip au succ s de Prot g En quelques ann es cet diteur a su s imposer comme la r f rence avec une communaut d utilisateurs extr mement importante et active Ses nombreuses extensions lui permettent en particulier de g rer les langages standards comme RDFS et surtout OWL KFNM04 de cr er des axiomes formels de mani re intuitive HNM02 d acc der aux ontologies par des interfaces graphiques volu es etc Cette pr dominance ne pourra qu tre renforc e par le lancement de l initiative CO ODE qui a pour objectif la cr ation d outils d assistance la construction d ontologies OWL riches et coh rentes et qui se concentre sur cet diteur OILed BHGS01 a t d velopp par l universit de Manchester pour diter des ontologies dans les langages de repr sentation OIL puis DAML OIL les pr curseurs de OWL Il est donc explicitement orient vers la repr sentation en logique de description expressive et ce titre fournit tous les l ments d interface permettant la sp cification des hi rarchies de concepts et de r les ainsi que la construction des expressions complexes d finissant ces entit s Con u l origine comme un outil simple il n a pas d autre ambition que de donner les moyens de construire des exemples montrant les vertus du langage pour lequel il a t cr Mais cette simplicit et la robustesse qui en d coule ainsi que le fait qu il int
124. ontologie DOLCE emprunte un travail de conceptualisation et de formalisation qui s appuie lui m me sur nombre d analyses philosophiques linguistiques et cognitives comme d taill dans MBG 02 Une telle approche facilite de fait la r utilisation d l ments de conceptualisation particuliers vocabulaire agen cement de concepts et de relations y compris celle de connaissances de raisonnement pour assister le d veloppement d ontologies Les structures propos es sont en effet galement suppo s es avoir t con ues en fonction d usages attest s et donc tre facilement adaptables des cas particuliers Cependant on ne peut se prononcer sur la mani re dont les usages concrets dans les SBC sont pris en compte dans de telles approches l engagement par rapport aux ressources fondamentales des ontologies de haut niveau est effectivement tr s important puisque la m thode privil gie un processus de sp cialisation brute des patrons pendant la conception Les usages sont bien pris en compte mais lors de la conception du patron lui m me Et au moins dans le cas de D amp S on retrouve une structure tr s proche de ce qui est pr sent dans l ontologie de haut niveau DOLCE On se place donc dans ce qui ressemble 4 une approche descendante top down classique Que se passe t il si des besoins applicatifs particuliers s cartent de ceux qui ont t anticip s pour le patron 4 4 2 Patrons de conception de ha
125. ontologique formelle propos e par Nicola Guarino De fait les informations que ces connaissances contiennent peuvent tre informelles comme formelles les m ta propri t s de la m thodologie ONTOCLEAN sont effectivement formalisables l aide de la logique modale logique qu a galement utilis e Bruno Bachimont dans Bac01 pour proposer une formalisation des informations diff rentielles Mais ces informations formelles peuvent tre hors de propos pour les applications utilisant l on tologie Elle risquent m me parfois de faire intervenir des entit s qui ne pourront jamais tre repr sent es l aide du vocabulaire de l ontologie faut de motivation applicative pour introduire les concepts et relations correspondants Par exemple dans l ontologie du cyclismes nos lieux g ographiques administratifs sont d pendants d une activit administrative du point de vue de l analyse ontologique formelle Pourtant une telle activit a fort peu de chances d apparaitre un jour dans une base de connaissances repr sentant des v nements cyclistes 42 Standard Upper Ontology Working Group http suo ieee org 192 5 3 Discussions m thodologiques Le probl me est que ces connaissances de niveau m ta ne vont donc que pouvoir tre diff cilement repr sent es dans les langages formels classiques de repr sentation d ontologies Dans un cadre d acquisition des connaissances traditionnel une ressour
126. ontologiques des textes du domaine on ne peut tre s r d avoir les ressources ad quates disposition De plus et cela est particuli rement dangereux le thesaurus est un artefact qui ne b n ficie absolument pas d une pr cision quivalente une ontologie C est d ailleurs cela qui nous a d j pouss nous en d fier Les relations s mantiques entre les notions d un thesaurus sont floues la relation hi rarchique d un thesaurus en particulier ne peut tre interpr t e comme d notant l inclusion entre des ensembles d individus puisqu elle peut renvoyer aussi la relation entre le tout et ses parties entre un th me global et des sous th mes Adapter directement une hi rarchie th saurale risque donc tr s fortement d aboutir une utilisation abusive de la relation Pour des exemples concrets dans le domaine de structuration de terminologies on peut se tourner vers Le 00 et MZB04 82 3 2 Aider la compr hension de la substance des descriptions El t as li BE cef class SETAS LIST Cok True of a list vhich does ae contain duplicates satt det or 72 end List thet nesbec first 71 rest 71 me via EM ontology Engineering Workbench OntoEdit V2 0 S http wwve aifb uni kartsruhe de C home ontologies aitb aifb oxrnl 8 Root Cr orschung 5 CREER BetrieblicheinformatikSysteme Businessintelligence JEfinzienteAligorithmen EvolutionaereAl
127. par les patrons mobilis s lors de la conception de l ontologie que ce soient les patrons d utilisation noyaux ou les patrons d utilisation applicatifs il faut introduire dans ce processus des strat gies de passage d une structure l autre Nous proposons pour faire coexister patrons g n riques patron de conception et patron noyau et patron applicatif au sein d un cadre m thodologique coh rent d articuler les deux formes d expression par des connaissances de raisonnement formelles L objectif est d autoriser un syst me d inf rence passer de l une l autre chaque fois que cela est faisable En particulier il faudra pr senter les liens simples gt demand s par le patron d utilisation comme autant de raccourcis relationnels de chemins pr sents dans le patron de haut niveau Par exemple pour notre ontologie de l audiovisuel on peut consid rer qu une relation was BroadcastedAt entre un programme et une date est utile si l on ne veut pas dire que le programme joue le r le de message dans une s quence d v nements qui admet pour param tre une date de diffusion valu e par ladite date Il nous faut alors introduire un axiome cf figure 4 10 qui permettra de g rer simultan ment les concepts et les relations des deux points de vue BroadcastTime has Tor BroadcastCourseOfEvents modality BroadcastedProgram requisite for valuedBy plays Fic 4 10 D duction d une relation partir
128. peu cette signification Gilles Kassel s inspirant d une proposition que l on retrouvera dans la section suivante de ce chapitre propose d introduire des axes permettant de regrouper parmi 84 3 2 Aider la compr hension de la substance des descriptions Figure 2b Detail of content from Figure 2a RUBRIC botplastiek van ulna met bottransplantatie niet gespecificeerd inclusie met aanbrengen van fixatiemateriaal PARAPHRASE plastic constructing of ulna by technique transplanting bone with immobilising using fixation device ENGLISH_RUBRIC boneplasty of ulna with transplant of unspecified bone inclusion with immobilising by means of fixation material SOURCE CVV CODE 5 786 93b INTERMEDIATE MAIN plastic constructing REPRESENTATION ACTS_ON ulna BY_ TECHNIQUE transplanting ACTS _ON bone WITH immobilising BY_MEANS OF fixation device SurgicalDeed which lt isMainlyCharacterisedBy performance whichG isEnactmentOf SurgicalReshapingProcess whichG lt LocativeAttribute Ulna hasSpecificSubprocess SurgicalTransplantation which actsSpecificallyOn Bone gt isCharacterisedBy performance whichG isEnactmentOf Surgicallmmobilizing which hasSpecificPhysicalMeans FixationDevice gt hasProjection CVV schemeVersion default code 5 786 93b code GENERATED ENGLISH Reshaping with transplanting of bone on ulna with immobilization using fixation device Fic 3 3 D un langage de repr sentation formel un
129. peuvent traiter ces documents sujets qui sont pr sent s sous forme de codes et ou de vedettes mati res rassembl s dans une arborescence fixe du plus g n ral au plus particulier Le probl me est que l utilisation de cette simple arborescence si elle permet une classification des documents en ensembles li s par la relation d inclusion est trop rigide d s que l on voudrait consid rer des liens transversaux entre sujets et introduire une certaine souplesse dans l indexation Par exemple si le sujet op ration cardiaque appara tra naturellement sous le sujet op ration chirurgicale le lien avec le sujet coeur apparaissant sous organe sera plus difficile introduire Il faudra syst matiquement rattacher les documents concern s aux deux vedettes ce qui peut poser probl me dans une strat gie d indexation par sujet il y a en effet une diff rence fondamentale entre affirmer qu un document traite d un sujet m me complexe et dire qu il aborde deux sujets Ou alors si l on est pr t faire voluer le langage chaque fois que l on rencontre une relation jug e int ressante il faudra introduire un nouveau sujet et le lier ceux qui en sont proches Cette option si elle a l avantage d encoder de mani re relativement claire la fa on dont des notions sont articul es au sein d un m me sujet peut rapidement faire exploser la taille du vocabulaire Une grande quantit de cha nes documentaires utilis
130. pour le terme extrait En rep rant des marqueurs lexicaux employ s dans des structures syntaxiques typiques on peut trouver de tels passages en extraire des information sur l organisation des termes entre eux et les lier aux concepts sous la forme de d finitions encyclop diques ou tout au moins de gloses comme illustr en figure 3 1 On esp re ainsi donner une intelligibilit l ontologie que cette intelligibilit autorise le contr le des outils automatiques de conception des ontologies ou facilite la compr hension du r sultat final Mais on ne peut en toute g n ralit pr supposer l existence ou l accessibilit de textes adapt s dans le domaine Et tr s souvent les ontologies sont con ues ad hoc et le lien au domaine textuel ne peut tre obtenu qu la suite de la construction manuelle de d finitions encyclop diques Mais dans ce cas c est la rationalit de l approche qui est mise en cause comment tre s r que les d finitions ainsi construites forment un tout coh rent Une ontologie comme un thesaurus doit former un syst me interpr tatif quasi autonome Il doit donc r pondre des normes strictes permettant ses l ments de prescrire une interpr tation qui en plus d tre accessible soit coup s r non ambigu et non contradictoire Pour cela comme dans les thesauri qui recourent prioritairement l organisation hi rar chique pour constituer des contextes locaux d inter
131. pour l audiovisuel extrait de IT04 lisation est tr s pr cise Les primitives de repr sentation sont en effet g n ralement interpr t es de mani re ensembliste les concepts correspondant des ensembles d individus du domaine ap plicatif Dans un tel cadre la relation de subsomption entre concepts est interpr t e de mani re stricte comme correspondant la relation d inclusion ensembliste Si le concept Interview est introduit comme sp cialisant le concept S quence cela implique que tous les l ments d not s par le premier sont d not s par le second On a donc bien une hi rarchie qui rend compte d une seule sorte de d composition des types d entit s du domaine Il en r sulte une plus grande homog n it dans l enchainement des concepts g n ralisants et sp cialisants on ne peut plus m langer par exemple la sp cialisation taxono mique de l esp ce la sous esp ce et la sp cialisation m r onomique du tout la partie comme c tait souvent le cas dans les thesaurus En respectant de telles contraintes on am liore ainsi le processus de mod lisation conceptuelle ainsi que son r sultat On prescrit des significa tions qui plus pr cises la fois sur le plan de l intelligibilit et sur celui de la formalisation seront plus facilement r interpr tables de mani re convenable par un utilisateur humain ou par un syst me de calcul formel Ceci ne peut que faciliter le respect de la
132. pour un domaine quelconque de la simple donn e d un vocabulaire de ce domaine celle de th ories axiomatiques voulant pr ciser toutes les lois relatives aux pr dicats logiques utilis s pour la repr sentation des connaissances relatives ce domaine UG96 propose une cat gorisation lt simple des ontologies selon le degr de formalisation de tr s informelle rigoureusement HT s agit ici de mod les au sens de la logique formelle c est dire d interpr tations logiques qui v rifient les contraintes induites par un ensemble de formules On pourra ainsi donner une caract risation du lien entre Sequence et Interview par la formule Va Interview x Sequence x qui indique que dans tous les mondes possibles du domaine applicatif une interview peut tre consid r e comme une s quence 52 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche formalis e en passant par semi formelles suivant que l on ait affaire des listes de termes de la langue des hi rarchies structur es ou bien des axiomatisations logiques extr mement d taill es In fine une ontologie fournit donc toujours un vocabulaire et une interpr tation de ce vocabu laire susceptible d aider ou de contraindre son emploi dans un SBC La d finition de Gruber peut toujours s appliquer 4 condition de prendre en compte la dimension centrale pour un SBC de l
133. que les liens qui les unissent h ritage ou utilisation sont utilis es de fa on directe dans une ontologie d di e la communication homme machine qui comportera un Client un G n rateur et un G n rateur concret Dans ces approches les 137 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique patrons sont au m me niveau que les ontologies qui s en inspirent Si Dev99 r utilise le patron Constructeur c est qu il veut r aliser une ontologie sur la g n ration logicielle Dans ce cas les patrons existants sont consid r s comme des proto ontologies ils contiennent des connaissances qui initient le processus de sp cification de conceptualisations mais ils n en sont qu une amorce qui doit faire l objet d un travail de pr cision et de formalisation appropri D autres travaux ont essay de d velopper leurs propres patrons de conception ontologiques cherchant reproduire l approche des patrons de conception logiciels sans n cessairement utiliser des design patterns existants comme point de d part Un premier courant s est attach la description d architectures repr sentationnelles pour les ontologies Ce niveau est donc plus abstrait que celui que l on vient de voir puisqu on se pr occupe de l organisation des connaissances ontologiques et non de leur contenu proprement dit Reprenant la terminologie de Gua95 se r f rant lui m me Bra79 nous
134. que tous les obstacles techniques en rapport avec ces fonction nalit s ne sont pas lev s La mise en uvre de nos solutions reste videmment d pendante des capacit s des langages de repr sentation propos s et des performances des syst mes qui r alisent les raisonnements demand s Comme on a pu le voir dans le chapitre 5 le cadre que nous propo sons exige des connaissances relativement riches ce qui augmente la complexit que des moteurs d inf rence adapt s auront g rer Et s il n a jamais t dans nos objectifs de r aliser des outils permettant de r soudre ce probl me force est de reconna tre que davantage de tests quantitatifs 520n peut remarquer que cette remarque reste valable m me dans le cas o l on n utiliserait pas la structure pivot que constitue ce graphe patron 202 auraient t n cessaires ontologies encore plus volumineuses en termes de connaissances de rai sonnement complexes bases d index correspondant l activit d une communaut pr cise mais sur une dur e bien plus longue que celle qui a pu tre simul e dans nos exp rimentations Et comme toute m thode fondamentalement diff rente de celles qui la pr c dent l indexation onto logique devra toujours faire l objet d un apprentissage et impliquera n cessairement un certain niveau d expertise aussi bien guid l utilisateur soit il Il reste que les hypoth ses que nous avons avanc es ont t test es
135. qui exige que ceux ci aient un aspect consensuel PINA les documentalistes font appel une solu tion th saurale et leur exp rience connaissance du fonds et strat gie de recherche adapt es Cependant ces solutions sont comme on le verra encore approximatives et des observations montrent que des raisonnements mobilisant des connaissances implicites des domaines dont re Le D partement Recherche et Exp rimentation de l Institut comporte plusieurs entit s que nous ne pr sen terons pas ici Celle dans laquelle nous avons effectu cette th se est le Groupe de Recherche Audiovisuelles et Multi M dias dont les travaux sont en particuliers orient s vers l impact des techniques num rique sur le traite ment des contenus audiovisuels en ce qui concerne la restauration par exemple et leur description indexation gestion des m ta donn es 3Ce manuscrit de th se est le fruit d un travail de recherche qui a d marr il y a de cela quatre ans avec la r alisation d un stage de recherche de DEA 4Langages Logiques Informatique Cognition Communication http wuw lalic paris4 sorbonne fr 2 Probl matique l vent les documents seraient utiles au processus de recherche Il serait donc bon de fournir une aide la cr ation et l acc s des index qui tiennent compte de la n cessit de pr cision et de raisonnement mieux que ne le permettent les syst mes de recherche par mot cl s ou th
136. radio scolaire est li e la notion tr s g n rale d ducation qui g n ralise des notions qui n ont souvent que peu voir avec la diffusion de programmes audios comme cour de r cr ation L application na ve de strat gies de reformulation hi rarchiques et transversales ne peut donc se faire sans risque important de perte de pr cision Ces faiblesses sont li es deux facteurs que nous avons d j voqu s le manque de pr cision en ce qui concerne les interpr tations possibles des relations de sp cialisation et d association introduites par les thesauri l impossibilit d introduire des relations propres au domaines que ce soit au niveau du r f rentiel d finissant les notions le thesaurus ou celui de leur actualisation dans des descriptions de faits particuliers les index On emp che ainsi la cr ation d informations pr cises exploitables de fa on pertinente et s re par le syst me documentaire Dans le cas d un syst me documentaire base de connaissances formalis es les sp cifications contenues dans les ontologies permettent une exploitation beaucoup plus pr cise des index Il est en effet possible de conduire des raisonnements qui assistent le travail du chercheur en rem plissant un r le similaire celui des reformulations de requ tes Mais pour cela le syst me peut s appuyer sur les significations formelles des index obtenues partir de celles des descripteurs qui les c
137. rarchie de relations conceptuelles issues d une ontologie pour l audiovisuel ex trait de ETOA apna gt wee ehh oh Sec Bots Ek ee de ee doi eu dei 56 Le graphe canonique associ la relation aPourParticipant 57 Ertraitide Tok ease ge tes Bick oh A BR AEE ee hie Be d 59 Caract risation du concept SequenceDialogueen LD 60 D finition des concepts InterviewExpert Professeur et Expert en LD 61 Quelques axiomes logiques pour une ontologie de l audiovisuel 65 Index compl t avec des connaissances inf r es 66 Un Gc index dans OPALES 71 Extraction de termes et d nonc s d finitoires extrait de MZB04 81 Diff rentes visualisations hi rarchiques d ontologies 83 D un langage de repr sentation formel une repr sentation langagi re Genera ted English dans le programme GALEN extrait de RZST99 85 Visualisation d une classe d finie dans Prot g 85 D finition de concepts et de relations selon la m thode OntoSpec 86 Utilisation de l diteur d ontologies pour la cr ation d un GC index dans OPALES 90 Le template Be present et une de ses sp cialisations extrait de Zar00 95 La saisie de m ta donn es dans le projet MIA extrait de SBC 02 96 La description du contenu de l image dans le projet MIA extrait de HSWW03
138. re naturelle de connaissances formalis es Et qu en fait la vision d un SBC isol du monde ne devant compter que sur ses propres ressources pour guider son utilisation n est pas si absurde que cela Mais nous pr f rons laisser l cette discussion et consid rer qu il est toujours envisageable d avoir acc s des usages applicatifs ext rieurs au syst me et donc de r fl chir une assistance conforme ce qui est attendu dans ces applications L encore il s agit de respecter une certaine forme de continuit s mantique le passage par les ressources ontologiques ne doit pas cr er de rupture par rapport aux usages Si les informations contenues dans les index et les traitements que le syst me op re sur ceux ci font consensus alors le syst me aura la cr dibilit qui est n cessaire son adoption Finalement on demande aux ontologies de respecter ce pourquoi elles apparaissent si centrales aux syst mes au del du fait de servir de simple catalogue d l ments d indexation Partage et consensus sont en effet des notions qui reviennent souvent dans les d finitions propos es Mais la n cessit de l articulation entre le niveau des connaissances du domaine souvent exprim es l aide de la langue naturelle et le niveau formel d bouchant sur les sp cifications op rationnelles des calculs autoris s dans le syst me est loin d tre syst matiquement prise en compte Nous allons exposer dans ce chapitr
139. s agit ici et dans le cadre de la continuit s mantique c est apr s avoir prescrit une interpr tation des index en donnant leur vocabulaire muni d une signification claire de leur prescrire un contenu prescription qui concerne aussi bien leur substance que leur forme Il faut d terminer une structure informationnelle pertinente pour l application et voir comment on peut Vexploiter pour faciliter le travail des diff rents utilisateurs Il faut noter que dans cette th se qui vise plus la repr sentation et la gestion des connaissances dans un cadre ontologique nous n allons pas nous int resser la mani re d obtenir de telles donn es elles m mes ce qui rel ve d un travail d acquisition de connaissances pure Nous allons plut t exhiber la forme que ces donn es peuvent prendre et surtout quel est l usage qu on en fait dans un SBC L assistance la cr ation des index dans les solutions documentaires classiques Le probl me du contr le ditorial des indexations a videmment fait l objet de consid rations avant l introduction des syst mes base de connaissances Le probl me de la variation des index ne s appliquant pas qu au vocabulaire employ mais aussi l organisation des informations il s agissait de faire quelque chose pour que les syst mes documentaires limitent aussi les risques d incoh rence ce niveau Cela est particuli rement important dans les syst mes documentaires autour
140. s lectionn la moiti li e aux th mes sp cifiques du c ur ou de la chirurgie cardiaque Il s agit donc d une collection plut t homog ne ce qui facilite la recherche d une ontologie th matique adapt e De fait comme le sujet de la m decine a attir l attention d un grand nombre de chercheurs ces der ni res ann es une grande quantit de ressources ontologiques sont disponibles dans ce domaine Pour une version francis e de ITO05b on peut se reporter ITO5al 168 5 2 Exp rimentations ontologiques De plus comme ces programmes devaient tre diffus s sur des chaines g n ralistes ce sont aussi de bons exemples sur la fagon dont les proc d s audiovisuels sont utilis s pour vulgariser des sujets scientifiques complexes Ressources ontologiques La premi re des ontologies que nous avons employ es ici est celle de l audiovisuel Initi e par Rapha l Troncy cette ontologie est le fruit d un certain nombre de mois d efforts communs pour formaliser les pratiques en cours dans notre domaine tr s large Elle a t con ue selon les points m thodologiques que nous avons voqu s dans cette th se sa normalisation sa formalisation et son op rationnalisation ont t effectu es suivant les principes de Bruno Bachimont tels que repris dans notre diteur DOE et elle reprend en les adaptant les patrons de conception de Gangemi et ses coll gues tels que nous les avons pr sent s dans le
141. s mantique le plus clair possible de sorte ce que le concepteur puisse le respecter tout en identifiant clairement les marges de manceuvre dont il peut disposer Cela implique un travail d tude et de conceptualisation important qui peut se concr tiser en particulier par une r utilisation plus critique des ressources existantes en particulier de l ontologie Menelas dans l optique d valuer leur adaptabilit des applications concr tes et diverses une tentative de normalisation des diff rentes ontologies de haut niveau propos es un niveau formalis comme les propositions de John Sowa Sow00 celles du groupe de travail suo l initiative GOL DHHSO01 ou bien videmment l ontologie DOLCE dualit des connaissances ontologiques et repr sentation dans un langage standard Lors de l exp rimentation EON nous avons vu qu il tait important de pouvoir transf rer les informations sp cifi es lors de la normalisation s mantique dans les formats de repr sentation les plus utilis s Cela est indispensable si l on veut continuer la formalisation et l op rationnalisation au del des fonctionnalit s l mentaires que DOE autorise Et nous avons montr que cela est possible Pour autant en l absence de standard m me de r pondre nos pr occupations l export de ces informations ne peut se faire que de fa on d tourn e En fait notre souci rejoint un probl me plus vaste qui n a
142. sente des descriptions de s quences d v nements qui ordonnent des entit s temporelles perdurants des r les que des entit s physiques endurants peuvent jouer dans ces v nements ainsi que des 3TEt nos patrons d indexation apr s tout sont bien eux aussi accompagn s de connaissances de raisonnement m me si a priori leur l gitimation vient de l application qui les exploite 140 4 4 Ing nierie ontologique et patrons d indexation param tres qui sont utilis s pour d crire r les et v nements et prennent leurs valeurs dans des r gions plus ou moins abstraites Cette structure g n rique cherche a s abstraire d un domaine particulier tout en r solvant un probl me de description ontologique donn En effet ces patrons de conception ont bien vocation rendre compte de bonnes pratiques de mod lisation cens es tre adapt es des usages existants Anestedge object 1 gt requisite 0 Parameter requisite 0 Parameter mod target 0 Course of events mod target of 0 Functional role t_component of 1 Contest t_component of 1 Contest requisite for 0 Functional role Context requisite for 0 Course of events t_component 1 t_component of 1 Contest 1 played by sequences valued by satisfied by location of 0 part 0 Region setting 0 Situation participant in 1 Event participant 1 Object
143. servira de substitut du document dans ce syst me Plut t que de faire des recherches sur les documents on va faire des recherches sur l ensemble de leurs repr sentations 1 2 2 La description linguistique comme substitut documentaire Fournir et utiliser un support textuel pour la description Dans la tradition bibliographique qu il s agisse de livres ou d images on a recours des no tices documentaires documents charg s de synth tiser les informations utiles pour la recherche documentaire le syst me documentaire peut alors parcourir l ensemble des notices afin de re trouver les documents demand s Le tableau 1 1 donne un exemple de notice produite PINA On y voit des informations de catalogage comme le titre de l mission et de la collection laquelle elle appartient le moment de sa diffusion celui de sa cr ation la soci t qui l a produite les personnes qui ont particip sa production On peut galement y observer dans les rubriques descripteurs et r sum des informations relatives au contenu du document lui m me Ces notices sont de nature textuelle elles utilisent la langue naturelle pour d crire le document Et m me si le texte obtenu n est pas obligatoirement conforme aux r gles usuelles la notice est d coup e en champs qui ne constituent pas forc ment un ensemble de phrases correct il reste lisible et interpr table pour celui qui y acc de contrairement au documen
144. son contenu et la mani re dont celui ci est exprim Les besoins concernant les informations de catalogage classiques date de production producteur ont certes leur importance mais ils seront toujours exprim s en conjonction avec une demande relative au contenu des documents recherch s Ainsi le D partement des Archives dans le cadre de son exploitation commerciale du fonds documentaire doit r pondre des requ tes comme celles de la figure 1 1 qui mentionnent tout la fois des l ments de catalogage et des l ments de contenu m lant mise en forme audiovisuelle et contenu th matique images d actualit s illustrant des temp tes violentes o l on peut voir la submersion des rivages plans de sc nes de rue Alger post rieurs 1975 Malraux en support film couleur extrait du match Toulon Marseille du 15 04 89 et r action de l arbitre M Wurtz Fic 1 1 Exemples de requ tes adress es au D partement des Archives de VINA De fait la recherche documentaire dans le cas des documents textuels se fait aussi princi palement selon des crit res de contenu Wal99 Ce besoin pose un probl me qui n est pas lui aussi sp cifique l audiovisuel celui de l interpr tation En effet le jugement de la pertinence d un document d pend d une interpr tation de son contenu qui va d terminer sa signification sa valeur informationnelle pour le syst me documentaire auquel il appartie
145. t souvent con us avec des pr occupations qui si elles se recoupent restent distinctes Nous pr senterons en section 5 2 4 les r sultats concernant les performances de DOE concernant l interop rabilit pour nous concentrer maintenant sur l exp rience de mod lisation qui a t conduite pour les besoins de cette exp rimentation la logique du premier ordre et o une relation ne peut tre consid r e comme une variable 0Les ateliers EON ont t organis s chaque ann e depuis 2002 lors de conf rences internationales d di es au web s mantique Les th mes privil gi s sont ceux de l interop rabilit entre diteurs d ontologies les possibilit s d alignement entre ontologies similaires etc Les actes de l atelier 2003 qui se tenait dans le cadre de la conf rence ISWC sont disponibles l adresse http CEUR WS org Vol 87 179 Chapitre 5 Exp rimentations et discussions CoDE 5 6 D claration de la composition de la propri t hasSubsequence et d une propri t lt rule gt lt composition_hasSubSequence_represents gt lt rule name composition_hasSubSequence_represents gt lt premise gt lt subject var xxx gt lt predicate uri amp av hasSubSequence gt lt object var yyy gt lt premise gt lt premise gt lt subject var yyy gt lt predicate var propriete representation inconnue gt lt object var zzz gt lt premise gt lt premise
146. transport Paris Lyon Dans ce cas le terme valeur relationnelle est bien issu du thesaurus et peut tre interpr t de mani re conforme ce qui est attendu Il semble ainsi faisable d exprimer les liens que l on voulait faire figurer dans notre index par exemple t moignage professeur et explication animation st nose semblent faire partie des rap ports autoris s par les pr cisions d indexation Cependant l utilisation de telles pr cisions se fait de mani re ad hoc en l absence de consigne claire ce sujet tous les termes peuvent prendre une connotation relationnelle Et les cr ateurs des index n ont pas de moyen de pr ciser le statut des l ments li s dans la relation ce qui peut tre g nant si on veut expliciter une relation orient e Apr s tout on peut interpr ter v rification contr le technique autant comme la v rification d un v hicule que constitue le contr le technique que comme la validation des proc dures et des moyens employ s lors d un contr le technique De fait l utilisation de ces relations n est pas vraiment contr l e m me si le vocabulaire et notamment les termes relationnels b n ficient de la normalisation apport e par un thesaurus il n y a pas de contrainte sur leur utilisation dans une pr cision d index Si on veut rester coh rent avec l interpr tation de d part des pr cisions apport es t moignage la pr cision donne la personne qui t m
147. tre qu unaires ou binaires puisque telle est la nature des concepts et r les qui jouent un r le pr dicatif en logique de description Une A box quelle que soit la syntaxe retenue contiendra ainsi des expressions de la forme C a ou r a b o C et r d signent respectivement un concept et un r le et a et b font r f rence des individus Dans une logique de description autorisant un langage d assertion minimal on pourra par exemple repr senter notre index par les assertions de la figure 2 5 un objet particulier de type Emission contient un objet particulier de type Interview auquel participe un individu particulier de type Professeur Emission emission decrite Interview interview 1 Professeur prof_ 1 contient emission decrite interview 1 participe prof 1 interview 1 Fic 2 5 Extrait d A box de logique de description simple repr sentant un extrait d index Ces formalismes s ils n ont pas t retenus dans nos exp rimentations initiales guid es par OPALES sont cependant consid rer autant du fait de leurs qualit s intrins ques que de l engouement qu ils suscitent comme on va le voir dans la communaut de recherche du web s mantique De fait nous avons veill garder nos propositions compatibles autant que possible avec leurs sp cifications section 4 3 3 et les avons employ es dans des exp rimentations plus tardives section 5 2 Ici un concept renvoie un pr dicat unaire non inst
148. un objet instancie ce concept d s que les conditions de la d finition seront v rifi es Mais il pourra aussi consid rer que tout objet instanciant ce concept induit l existence des objets et des liens sp cifi s dans cette d finition Ainsi si une s quence particuli re est d crite comme une interview d expert on pourra la renvoyer parmi les r sultats d une requ te demandant des s quences auxquelles participent des experts m me si cette information n a pas t sp cifi e dans l index On peut aussi red finir plus pr cis ment les sp cialisations de Personne en indiquant quelle est la nature des r les que les individus qui les instancient jouent figure 2 12 InterviewExpert Interview jJaPourParticipant Expert Professeur Personne JjoueRole RoleProfesseur Expert Personne M JjoueRole RoleExpert Fic 2 12 D finition des concepts InterviewExpert Professeur et Expert en LD Un interview d expert est un interview auquel participe au moins une instance du concept expert et un professeur respectivement un expert est une personne qui joue un r le de professeur respectivement un r le d expert La sp cification par une condition n cessaire qui correspond l interpr tation logique de la relation de sp cialisation permet de sp cifier des propri t s essentielles de mani re indirecte on sait ce qu appartenir l extension d un concept implique pour l individu
149. un langage logique d indexation de l image Ces primitives sont accompagn es d un certain nombre d axiomes qui permettent de sp cifier le comportement du syst me de recherche d information documentaire qui les emploiera Dans un contexte plus explicitement ontologique et audiovisuel Rapha l Troncy a montr qu il tait souhaitable d articuler l ontologie du domaine trait par les documents que l on veut indexer une ontologie permettant de repr senter ces documents eux m mes Tro04 Certaines t ches habituellement d volues aux syst mes documentaires peuvent en effet tre prises en charge de mani re plus appropri e par un syst me base de connaissances 0 Cette probl matique de la constitution d un ensemble de connaissances documentaires par d faut n tait pas au c ur de notre th se Comme dans le cas d OPALES nous aurions pu nous contenter d une indexation purement th matique et laisser un syst me documentaire le soin de g rer le lien entre ces index et les documents qu ils d crivent Dans une telle vision un point de vue ontologique documentaire ne serait pas essentiellement plus important que les autres Cependant force est de reconna tre que ce point de vue est extr mement important surtout dans le contexte de PINA Dans la lign e des travaux de recherche que notre d partement effectue il est en effet tout fait raisonnable de penser que c est bien le r le de notre Institu
150. un support GC en CGXML 58 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche identique mais de type s quence Un moteur d inf rence calculera ainsi qu un graphe indiquant qu une personne donn e participe une interview quelconque sp cialise un graphe repr sentant un relation conceptuelle quelconque entre une personne quelconque et une s quence et en tirera des cons quences significatives du point de vue des r ponses retourn es cf section 2 3 2 Cette approche revient donc bien cr er une ontologie formalis e d un domaine On distingue bien les types d entit s qui nous int ressent et on les munit d une signification la fois pr cise et intelligible Concepts et relations sont interpr tables par la combinaison de leurs intitul s langagiers et de la relation de sp cialisation Dans le cas des relations la donn e des concepts qui jouent pour elles le r le de domaines vient compl ter ces renseignements Toutes ces informations ont leur int r t autant pour les utilisateurs humains que pour le sys t me Les sp cifications sont en effet interpr t es par le SBC puisque des m canismes de contr le d riv s de la s mantique formelle sont mis en place qui respectent la double s mantique des primitives Ainsi un syst me base de GC offre donc des garanties int ressantes quant la continuit s mantique Il est noter que les significations qui son
151. un thesaurus De telles approches existent mais elles sont excessivement rares les concepteurs refusant de complexifier inutilement les ressources surtout si celles ci sont syst matiquement exploit es par des op rateurs humains qui peuvent compter sur leurs connaissances afin de lever les ambigu t s relationnelles Le second concerne la capacit cr er des relations de mani re dynamique au sein m me des index pour rendre compte de la mani re dont le contenu d un document peut associer les notions qu il pr sente Or ceci est impossible dans le cas d un langage documentaire strictement th saural n autorisant pas de relation syntaxique entre les descripteurs Comment rendre alors compte de la richesse du contenu documentaire audiovisuel de son organisation comme de sa mati re Dans l une des applications du projet OPALES nous avons par exemple un documentaire qui contient une s quence d archives introduisant un discours historique et une s quence d interview vulgarisant un aspect technique Si toutes ces notions documentaire s quence d archives interview aspect technique discours historique vulgarisation sont livr es p le m le dans l index du document il est fort probable que l inter pr tation du chercheur soit quelque peu diff rente de ce que l indexeur a voulu communiquer un documentaire contenant une s quence d archives pr sentant une interview d un chercheur sur l histoire de la
152. v rifient la consistance d une base de connaissance ou y ajoutent de nouveaux l ments GFP02 62 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche recherche de la continuit s mantique puisqu il s agit de r interpr ter les index effectivement exprim s la lumi re des requ tes pos es Les syst mes documentaires classiques on l a vu peuvent assumer eux m mes une partie de ce travail de reformulation en s appuyant sur les connaissances du domaine Par exemple les relations hi rarchiques pr sentes dans le thesaurus sont exploit es de mani re intensive par les syst mes qui consid rent que l on peut g n raliser les descripteurs contenus dans un index pour r pondre une requ te Parfois m me on peut utiliser les relations transversales comme la relation d association pour augmenter le nombre de descripteurs concern s par une requ te Ce pendant si de telles techniques augmentent la quantit des r sultats retourn s pour une m me requ te la pr cision de la r ponse peut p tir du manque de rigueur dans l tablissement des rela tions th saurales Les liens hi rarchiques sont en g n ral con us pour rendre possible un change entre la notion subsum e et la notion subsumante lors des recherches mais les relations transver sales sont beaucoup plus floues Ainsi dans la branche audiovisuelle du thesaurus de PINA on peut observer que la notion
153. verbalisables dans une langue pourraient ne pas l tre imm diatement dans une autre L diteur se borne donc 131 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique l ancrage textuel de l ontologie diff rentielle en autorisant un lien explicite entre la notion et ses manifestations langagi res C est aussi un moyen d articuler l tape de normalisation avec les ventuels r sultats d outils d extraction de termes En ce qui concerne la cr ation du contenu conceptuel des notions diff rentielles l outil d velopp se propose d assister l utilisateur dans cette saisie voire d en automatiser une partie En effet au cours de nos exp riences de conception d ontologies diff rentielles quelques faits int ressants ont pu tre observ s En premier lieu il y a souvent partage de SWP et SWS par l ensemble des concepts membres d une m me fratrie En effet toutes les notions d une fratrie sont filles d un m me p re et toutes admettent une propri t discriminante d termin e partir d un axe s mantique commun cela est n cessaire la coh rence de la structure locale de l ontologie Par exemple dans le domaine de la petite enfance le travail de V ronique Malais a conduit la distinction parmi les diff rentes actions consid rer pour l application entre des actions entreprises au nom d un enjeu collectif comme des rites d int gration ou de rejet
154. 03 De fait Schreiber et ses coll gues ont tenu compte de cette difficult et propos pour la description du contenu des images proprement dit des formulaires beaucoup plus souples Comme la figure 3 9 le montre leurs champs peuvent en effet contenir des structures de connaissances complexes qui sont saisies leur tour dans des formulaires Si l utilisateur veut ajouter un l ment de description il n aura qu associer au champ de formulaire correspondant un concept de Vontologie et l interface pr sentera alors de nouveaux champs correspondant aux attributs du concept s lectionn Cependant on reste encore dans un cadre relativement fig si le sch ma de description jug pertinent pour l application admet des variations importantes dans quelques cas particuliers on ne peut pas vraiment en tenir compte et l outil d assistance ditoriale se mue en une contrainte qui peut rebuter l utilisateur Les auteurs reconnaissent par exemple que si leur sch ma est adapt la description d actions comprenant un seul agent il faudra recr er 97 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques une interface si une action en comportant plusieurs appara t De fa on g n rale un tel constat est videmment valable pour la description du contenu des documents audiovisuels une t che souvent plus complexe que la caract risation de leur contexte de production qui utilise habituellement des ens
155. 11 42 Des propositions pour rationaliser la conception des ontologies 113 4 2 1 Des m thodologies pour organiser le cyle de d veloppement des ontologies 115 4 2 2 Des principes pour rendre la conception coh rente 118 4 2 3 Initier le processus de conception des ontologies 122 43 Prescrire une mani re de construire les notions ontologiques 123 4 3 1 ARCHONTE un processus de conception d ontologies r gionales 124 4 3 2 Des outils pour faciliter la saisie des sp cifications formelles 128 4 33 DOE 3210 45 de ie AU A eee ee 2 woh ee wee Lan re 130 4 4 Ing nierie ontologique et patrons d indexation 136 4 4 1 Ing nierie ontologique et patrons de conception 137 4 4 2 Patrons de conception de haut niveau et besoins applicatifs 143 4 4 3 Vers une solution articulant patrons de conception et patrons d utili A a cotta e AE RS es Sack Gh a GA DE ok Ae eA 146 AAA Discussion m koeri 4 Bele Bb du amp Bod wk Sow Oh bebe eh eee 150 A CONCISION a ss cee eae he Beh ek Beh OU nu QU ee BR 153 5 Exp rimentations et discussions 155 5 1 R capitulatif des apports m thodologiques de cette th se 155 5 2 Exp rimentations ontologiques 158 DD GG VCS 4 2 A a ae re he mentales D egies EM NE es ER ES 158 J22 MOPARES Le SE RAS Se ENTRE re MRE US QUE Wire ea Bh eos 163 5 2 8 Ex
156. 19960126 FR3 001 016 Mat riel BETA SP 17 l ments Parall le antenne Couleur MONO D fini tion 625 lignes Format 1 2 pouce Proc d B ta Signal Analo gique Standard couleur SECAM 16 TAB 1 1 Extrait d une notice documentaire 1 2 Le probl me de l acc s l information pour les documents audiovisuels audiovisuel qu il d crit Le texte bien qu il reste soumis des interpr tations variables a en effet recours un syst me fonctionnel de signes la langue dont le rapport arbitraire et consensuel un signifi permet de prescrire un sens aux unit s qui le composent RCA94 La grande familiarit des utilisateurs avec le code linguistique ach ve de garantir une r interpr tation peu pr s conforme ce que le cr ateur de la description a voulu exprimer De plus le recours des descriptions textuelles permet d introduire dans le syst me de re cherche la possibilit d une interrogation utilisant elle aussi le langage naturel Requ tes et des criptions se pr sentant sous une m me forme peuvent tre plus ais ment compar es en vue d tablir la pertinence des documents Ceci est encore plus vrai dans un contexte num rique qui permet de b n ficier des possibilit s offertes par les syst mes informatiques de traitement textuel que ce soit par le biais de la classique recherche par occurrences de mot clefs dans le texte des notices ou via des fonctionnalit s plus complexes
157. 7 Mais nous avons d faire de nombreux am nagements pragma tiques cette typologie qui r sultait d une r flexion linguistique rigoureuse le rattachement privil gi de certains attributs des concepts particuliers peut pousser regrouper davantage les relations suivant les objets auxquelles elles s appliquent avant m me de consid rer leur si gnification propre La figure 5 1 montre en partie les notions r sultant de cette adaptation de ressources de haut niveau Differential Ontology Editor Ontologie du Cyclisme Differential Ontology Editor Ontologie du Cyclisme File Edit Metadata Language File Edit Metadata Language Differential Ontology Referential Ontology Differential Ontology Tree Browser Tree Browser Concept Relation Concept Relation Q AnyConcept Q anyRelation Objet Q reperageCirconstanciel Objetabstrait localisation SupportDeDescription estLocaliseSpatialementPar SupportDeDescriptioninformatique traverse SupportDeDescriptionCycliste estLocaliseTemporellementPar ObjetConcret attributionCirconstancielle objetConcretTemporel attriputionCirconstancielleEquipe ObjetTemporelDuratif attributionCirconstancielleCoureur ActiviteHumaine relationMereologique Evenement estConstitue ObjetConcretSpatial faitPartieDe Objetindividuel relationAppartenance Obj
158. 94 1 1 1 2 1 3 1 4 1 5 1 6 2 1 3 1 3 2 3 3 5 1 5 2 Liste des tableaux Extrait d une notice documentaire 16 Une s rie de reformulations de requ tes documentaires 23 Un extrait du thesaurus de PINA 26 Utilisation du texte libre en compl ment des mots clefs 28 Structuration d un ensemble de descripteurs 30 Les facettes dans le thesaurus de PINA 31 Constructeurs du langage OWL DL 60 Notes d usage dans le thesaurus de VINA 80 Principes diff rentiels associ s aux sp cialisations directes de Personne extrait de ENO ee dail ah neh RS ee CN ah Oe ER ak Tn ns ge 89 La grille d indexation d un accident m dical 93 M ta propri t s associ es des concepts g ographiques de l ontologie du cyclisme 162 Nombre de triplets explicites and inf r s dans la base de connaissances Sesame Le mod le RDF d signe les triplets d finissant le langage de repr sentation lui m me 178 1x Liste des tableaux 2 1 2 2 3 1 4 1 4 2 5 1 5 2 5 3 5 4 5 9 5 6 Liste des codes sources Extrait d un support de graphes conceptuels en CGXML Sp cifications formelles dans un support GC en CGXML Extrait du mod le de connaissances du concept human_being de l ontologie ME
159. A Forme nouvelle d un produit audiovisuel d j diffus TAB 3 1 Notes d usage dans le thesaurus de PINA NA note d application NH note historique En sus de ces informations internes au thesaurus on peut constater que ces constructions sont souvent accompagn es de guides extr mement complets sur les descripteurs qu il contient Michel Dauzats analysant quelques thesauri du domaine de l audiovisuel confirme que la plupart viennent avec une documentation volumineuse Dau94 De fait les thesauri sont reconnus par les sp cialistes de la documentation comme des objets complexes qui demandent une assez longue p riode de familiarisation avant de pouvoir tre utilis s correctement dans les processus de description et de recherche Et pourtant m me si ces sp cialistes rechignent a laisser les non experts seuls face aux syst mes th sauraux force est de reconnaitre que les thesauri apportent des sp cifications qui les mettent 4 port e d un public plus large Au moins peuvent ils guider les interpr tations de ceux qui ont des notions basiques dans le domaine qu ils concernent Le cas des ontologies est encore plus d licat I est vident qu on ne peut plus se passer d une assistance la compr hension l ontologie tant un objet comportant des sp cifications formelles tr s loign es des significations m tier Les ontologies doivent donc b n ficier d efforts qui poursuivent ce qui est entrepris p
160. Clean approach In LREC02 Workshop on Ontologies and Lexical Knowledge Bases OntoLex 2002 Las Palmas Canary Islands Spain 2002 OUNIS I et Pasca M Modeling Indexing and Retrieving Images using Conceptual Graphs In 9th International Conference on Database and Expert Systems Applications DEXA 98 1998 OUNIS I Un mod le d indexation relationnel pour les graphes conceptuels fond sur une interpr tation logique Th se de doctorat Universit Joseph Fourier 1998 OWL Web Ontology Language Reference W3C Recommendation 2004 http waw w3 org TR owl ref Poot M et ALII Evaluating Expert Authored Rules for Military Reasoning In Proceedings of the 2nd International Conference on Knowledge Capture K CAP 03 Sanibel Island Florida 2003 Pout J P et CARRIVE J Proposition d une architecture pour un syst me de structu ration automatique de flux audiovisuels In Actes de la Conf rence sur la COmpression et la REpr sentation des Signaux Audiovisuels 2005 CORESA 05 Rennes 2005 R T PEDAUQUE Le document forme signe et relation les re formulations du num rique Document de Travail R seau Th matique Pluridisciplinaire 33 D partement STIC CNRS 2003 http archivesic ccsd cnrs fr sic_00000511 htm1 PICHON J Le traitement documentaire des programmes de radio et de t l vision Rapport technique INA 1996 217 Bibliographie Pus01 PUSTEJOWSKY J Type Construction and th
161. D S eee A ee CR ar D Sn D a RP Re te ae 144 Patron de description d un document audiovisuel 145 Encha nement des patrons ontologiques 147 Encha nement des patrons ontologiques partiels pour la petite enfance 148 D duction d une relation partir d assertions respectant le patron D amp S 149 Une d finition possible pour le concept Program 150 Concepts et Relations de haut niveau de l ontologie du cyclisme extrait de TI02 159 D finition diff rentielle du concept ObjetGeographiqueAdministratif 161 Hi rarchie de concepts issue de l ontologie petite enfance 165 Hi rarchie de concepts issue de l ontologie de l eau 166 Utilisation de l outil SegmentTool pour produire une structure documentaire 171 Patron de description relationnel de l exp rimentation chirurgie cardiaque 171 Repr sentation graphique de l index du code 5 1 172 Index compl t avec des connaissances inf r es 173 Extraits du texte donn pour la sp cification des ontologies EON 181 Concepts de l ontologie EON 182 Deux index fabuleuse 2 235 bee ee ee ee a ee een BS ees 187 Un sch me s mantico cognitif du verbe rouler extrait de Dji00 193 La structure de qualia du nom commun lt beer extrait de PusOl 1
162. De fait beaucoup d tudes et c est l gitime dans un champ de recherche en cours d laboration se sont concentr es sur les difficult s d ordre plut t technique codage des annotations qui servent de support l indexation repr sentation op rationnalisable des connaissances de raisonnement mise en uvre de processus d inf rence exploitant ces raisonnements Nous cherchons plut t envisager ces probl mes techniques non en eux m mes mais en tant que moyens mis au service de 72 2 5 Conclusion sc narios d utilisation r els Comment une approche d indexation 4 base de connaissances peut tre correctement mise en place Peut on cacher la complexit inh rente une telle approche aux yeux de l utilisateur humain Une r flexion globale comme celle de MSDO0 r capitulant les enjeux de l utilisation des ontologies dans les syst mes documentaires et les confrontant aux projets exp rimentaux ef fectivement conduits voque bien la difficult que nous avons partiellement mise au jour Et WSWS01 qui a essay de transposer les connaissances contenues dans un thesaurus un SBC ontologique montre que le passage d une approche classique une vision plus formelle et plus riche ne peut pas faire l impasse sur des r flexions m thodologiques indispensables l efficacit du syst me Par exemple l utilisation des ontologies est tout fait justifi e par les possibilit s d assistance perm
163. EN TBC 02 Mais quoi qu il arrive ces reformulations ne poss dent pas l intelligibilit des expressions langagi res attest es dans l application Et elles ne rendent toujours compte que des sp cifications formelles ce qui pose des difficult s puisque celles ci ne sont pas directe ment li es au domaine d application et donc peuvent tre ressenties comme incompl tes par les utilisateurs Il faut donc aller plus loin et munir les ontologies d une interpr tation naturelle qui re contextualise correctement concepts et relations dans les usages de l application m me si ceux ci ne sont pas directement accessibles lors de l utilisation de l ontologie Pour clarifier les rapports entre l ments langagiers et l ments conceptuels Gilles Kassel dans KP99 KAB 00 propose un mod le de repr sentation ontologique qui fait explicitement la distinction entre trois composants distincts d un concept les termes qui sont employ s pour le d signer dans la langue la notion son sens pour des humains immerg s dans les pratiques de l application les objets du monde qui forment la r f rence du concept La notion est videmment ce qu il convient d expliciter correctement pour que le concept ait un sens accessible pour les utilisateurs de l ontologie Pour ce faire il faut s efforcer de doter les concepts de l ontologie d une d finition en langue naturelle De plus pour structurer quelque
164. ET J ZACKLAD M KASSEL G et BOURIGAULT D diteurs Ing nierie des Connaissances Evolutions r centes et nouveaux d fis Eyrolles 2000 Bac01 BACHIMONT B Mod lisation linguistique et mod lisation logique des ontologies Vapport de l ontologie formelle In Actes de la conf rence en Ing nierie des Connais sances IC 2001 Grenoble France 2001 Bac04a BACHIMONT B Arts et sciences du num rique Ing nierie des connaissances et critique de la raison computationnelle Habilitation diriger des recherches Universit de Technologie de Compi gne 2004 BAC04b BOURIGAULT D AUSSENAC GILLES N et CHARLET J Construction de ressources terminologiques ou ontologiques 4 partir de textes un cadre unificateur pour trois tudes de cas Revue d intelligence artificielle 18 1 2004 Bag03 BAGET J F Homomorphismes d hypergraphes pour la subsomption en RDF In 3 mes Journ es Nationales sur les Mod les de Raisonnement JNMR 03 Paris 2003 BBC2Z95 BouAUD J BACHIMONT B CHARLET J et ZWEIGENBAUM P Methodological principles for structuring an ontology In IJCAI 95 Workshop on Basic Ontological Issues in Knowledge Sharing Montr al 1995 BCKNO1 BARRY C CORMIER C KASSEL G et NOBECOURT J Evaluation de langages op rationnels de repr sentation d ontologies In Actes de la conf rence en Ing nierie des Connaissances IC 2001 Grenoble France 2001 BCMt03 BAADER F CALVANESE
165. Ing nierie ontologique et patrons d indexation Dans cette approche le niveau auquel sont sp cialis s les concepts reste assez abstrait m me si les concepts rel vent clairement du domaine L objectif est en effet d obtenir une mod lisa tion r duite aux notions les plus g n rales du domaine dite noyau Cette ontologie peut tre consid r e comme le plus grand d nominateur conceptuel commun toutes les ontologies qui concerneront le domaine d un point de vue plus appliqu La figure 4 5 montre en effet comment la transposition du patron de conception dans le domaine biom dical des inflammations les notions du centre de la figure va tre son tour sp cialis e pour apporter des notions proches des besoins des applications les notions de la p riph rie de la figure De fait la sp cialisation consistera rem dier au second plan l aspect fonctionnel des objets du patron sp cialis pour mettre en avant des objets m tier pertinents Rattacher une ontologie de domaine 4 un patron de conception de haut niveau am liore ind niablement sa qualit intrins que on clarifie l engagement ontologique en adh rant explicitement une conceptualisation qui a b n fici d une effort th orique important et qui de plus apporte des connaissances de raisonnement se r percutant via la relation de subsomption aux notions du domaine D amp S par exemple par l interm diaire des notions de l
166. L Extensible Markup Language Version 1 0 Third Edition W3C Recommenda tion 2004 http www w3 org TR REC xm1 XSL99 XSLT XSL Transformations W3C Recommendation 1999 http www w3 org TR xslt Zar00 ZARRI G P A Conceptual Model for Implementing Metadata on the Web In Fifth conference on Current Research Information Systems CRIS 2000 Helsinki Finland 2000 ZBB 99 ZARRI G P BERTINO E BLACK B BRASHER A CATANIA B DEAVIN D DI Pace L Esposito F LEO P MCNAUGHT J PERSIDIS A RINALDI F et SEME RARO G CONCERTO An Environment for the Intelligent Indexing Querying and Retrieval of Digital Documents In LNAI 1609 Foundations of Intelligent Systems Proc of the 11th Int Symp ISMIS 99 Warsaw Poland 1999 ZC94 ZWEIGENBAUM P et CONSORTIUM MENELAS MENELAS an access system for medi cal records using natural language Computer Methods and Programs in Biomedicine 45 1 2 1994 Zet02 ZETTL H Television Aesthetics In ADLER R P diteur Understanding Television Praeger New York 2002 221 R sum L indexation de documents audiovisuels est une t che difficile mais n cessaire si l on veut rechercher correctement des contenus dans des bases volumineuses Pour atteindre ses objectifs un syst me d indexation doit imposer un certain degr de contr le et assister ses utilisateurs tant pour la cr ation que pour la recherche des index Dans ce manuscrit nous
167. RONCY R Designing an Audio Visual Description Core Ontology In Workshop on Core Ontologies in Ontology Engineering 14th International Conference on Knowledge Engineering and Knowledge Management EKAW 2004 Whittlebury Hall Northamptonshire UK 2004 CEUR online Proceedings http ceur ws org Vol 118 ISAAC A et TRONCY R Ontologies et description du contenu de documents AV une exp rimentation dans le domaine m dical In Atelier Connaissance et Document Temporel 16i mes Journ es Francophones d Ing nierie des Connaissances IC 2005 Nice France 2005 ISAAC A et TRONCY R Using Several Ontologies for Describing AV Documents A Case Study in the Medical Domain In Workshop on Multimedia and the Semantic Web Second European Semantic Web Conference Heraklion Crete 2005 ISAAC A TRONCY R et MALAIS V Using XSLT for Interoperability DOE and The Travelling Domain Experiment In 2nd International Workshop on Evaluation of Ontology based Tools EON2003 at ISWC2008 Sanibel Island Florida 2003 http CEUR WS org Vol 87 JONES D M BENCH CAPON T J M et VISSER P R S Methodologies for Ontology Development In Proc IT amp KNOWS Conference XV IFIP World Computer Congress Budapest 1998 Jouis C Contribution la conceptualisation et la mod lisation des connaissances partir d une analyse linguistique de textes R alisation d un prototype le syst me SEEK Th se de doctorat EHESS P
168. a figure 5 6 il faut d crire les l ments AV en leur assignant certaines valeurs de propri t s par exemple la mani re dont ils sont produits et en les d composant d un point de vue documentaire Leur contenu doit galement tre index par l assertion de relations avec des concepts du domaine relations de nature strictement repr sentationnelle ce qui est montr dans les vid os ou plus interpr tatives quelle est l utilisation de ces repr sentations Comme on l a d j vu un tel patron peut en fait engendrer des descriptions extr mement riches comme celle repr sent e par le code 5 1 Nous pr f rons d ailleurs pr senter ici en figure 5 7 une version graphique et quelque peu simplifi e de cet index qui permet de mettre en valeur la distinction entre les deux types de connaissances qui nous int ressaient dans Le fait est que pour les besoins du formalisme de repr sentation retenu il nous a bien fallu int grer ces diff rentes branches au sein d une m me ontologie ce qui sans pour autant g ner son utilisation dans le point de vue applicatif retenu a pu nuire la coh rence th orique du r sultat final Cet outil a t d velopp par l quipe DCA de la direction de la recherche de INA et a t partiellement financ dans le cadre du projet PRIAMM CHAPERON 16Rapha l Troncy propose en effet d ancrer les descriptions conceptuelles dans un langage strictement docu mentai
169. about amp menelas hospital_role gt lt owl Class rdf about amp menelas professional_role_function gt lt owl unionOf gt lt owl Class gt lt owl Class gt lt owl complementOf gt lt owl Class rdf about amp menelas the_hospital_role gt lt owl complement Of gt lt owl Class gt lt owl intersection0f gt lt owl Class gt lt owl equivalentClass gt lt owl Class gt CODE 5 3 D finitions OWL des classes ExpertInterview et ExpertRole 177 Chapitre 5 Exp rimentations et discussions lt owl TransitiveProperty rdf about hasSubSequence gt CoDE 5 4 D claration de la transitivit de la propri t hasSubSequence sous s quence un objet qui repr sente un sujet quelconque alors le premier objet repr sente galement ce sujet Triplets explicites Triplets inf r s Total Mod le RDF 129 Ontologie AV 5231 10810 16041 Ontologie MENELAS 10534 26637 37171 Instances 276 1507 1783 Total 16041 38954 54995 TAB 5 2 Nombre de triplets explicites and inf r s dans la base de connaissances Sesame Le mod le RDF d signe les triplets d finissant le langage de repr sentation lui m me Il est vident que l enjeu de l exploitation du raisonnement dans un syst me d information va au del d un gain mesur quantitativement puisqu il s agit de simuler gr ce l impl mentation de connaissances de raisonnement propres un domaine d
170. accordent aux principes th oriques rigoureux des ontologies fondamentales Comme Men03 le souligne les approches concernant les ontologies de r f rence sont souvent inspir es par une d marche r aliste concentr e sur la d termination de mod les les plus proches d une r alit suppos e et ignorent souvent les consid rations pragmatiques qui ancrent une ontologie dans une t che donn e on recherche une mod lisation de la r alit sans se poser la question de l utilisabilit d une telle mod lisation ou m me du bien fond d une telle qu te De fait certaines approches essaient d adoucir leur engagement m taphysique en incluant dans leur pr occupations des cas de description conceptuelle g n riques C est notamment le cas de DOLCE et du patron D amp S qui s efforcent d obtenir des l ments de mod lisation inspir s par les usages ainsi que des consid rations cognitives ou linguistiques suppos es plus proches de ceux ci Mais comme on vient de le voir si ceci peut suffire obtenir une ontologie de domaine plus facilement adaptable diff rentes applications on n est pas s r de pouvoir rendre compte de tous les am nagements pragmatiques qui font d une ontologie applicative la ressource adapt e au fonctionnement concret d un SBC particulier La l gitimit d une ontologie est en effet galement li e sa facilit d utilisation et sa capacit permettre la conception de
171. act Q UrbanMOT Q StaticArtefact Underground Q IndependantStaticArtefact Taxi C TownSight RentalCar Q LodgingFacility CityBus C Hotel Train BedAndBreakfast Bike TransportFacility Date Airport City Port Airport TrainStation Trip Q DependantStaticArtefact Flight Accomodation Hotel OneStarHotel TwoStarHotel ThreeStarHotel FourStarHotel FiveStarHotel BedAndBreakfast Room Q Set SetofRooms TownSight skiResort Continent Country Room Q DynamicArtefact MeansOfTransport Plane g BoeingPlane AirbusPlane EarthlymoT UrbanOnlyMoT Underground CityBus Tramway InterurbanMOT CollectivelnterUrbanMOT Train Coach IndividualinterUrbanMOT C Car Motorbike Bike Ship Fic 5 10 Concepts de l ontologie EON a non structur s b structur s par introduction de concepts de haut niveau et application de la m thodologie ARCHONTE 182 5 2 Exp rimentations ontologiques d attributs pour des concepts comme Room TransportReservation etc De tels attributs attach s de mani re privil gi e au concept dont ils permettent de caract riser les instances sont peu propices se sp cialiser les uns les autres De fait si ontologie comporte finalement 79 et 48 relations il ne faut pas oublier qu il s agit d une ontologie jouet dont l objectif n tait que l valuation de notre outil DOE A
172. adre m thodologique complet traitant la fois de l utilisation et de la conception du contenu des ressources conceptuelles construites Ces travaux de plus n abordent cependant pas explicitement les documents audiovisuels Dans le domaine du traitement logique de repr sentation de l image fixe les travaux du laboratoire MRIM font r f rence MBC95 introduit un mod le de description sp cifique l image reposant sur plusieurs point de vues structurel spatial perceptif symbolique qui sont cens s en puiser les diff rentes dimensions Le contenu des descriptions lui m me est repr sent l aide de graphes conceptuels comme dans OP98 et MCMO03 Si les m canismes de recherche propos s tiennent bien compte des propri t s du medium visuel lors de la description et de la recherche l adaptation de ces m canismes aux entit s des domaines particuliers qui constituent le contenu th matique des documents semblent cependant plus probl matique Il faut d finir une approche plus g n rique o les ressources conceptuelles seraient modifiables suivant les applications rencontr es 21Ce qui est d ailleurs normal pour des travaux qui ont t men s une poque o de telles solutions n existaient pas Notre travail n a sans aucun doute pu se positionner de mani re diff rente que parce que nous pouvions justement d j utiliser des outils aussi int ressants que COGITANT GS98 67 Chap
173. ail de normalisation s mantique et comment on pouvait articuler concr tement les ontologies diff rentielles r f rentielles et compu tationnelles Ces efforts ont d bouch sur la cr ation d un outil de conception DOE qui n est certes qu un outil d dition mais qui a b n fici d un effort certain de rationalisation en vue de faciliter l appr hension de la m thodologie retenue Cet outil offre les fonctionnalit s basiques qu on est en droit d attendre pour effectuer la normalisation et la prolonger par une formalisa tion et une op ration l mentaires Il ne se place en effet pas ouvertement en concurrence avec les autres outils dont on a vu que les points forts concernaient justement ces deux derni res tapes Au contraire il essaie d attendre un niveau d interop rabilit satisfaisant permettant de b n ficier des avanc es r alis es sur l ensemble du processus de d veloppement d ontologies De fait notre outil semble avoir int ress nombre de personnes Accessible librement sur le site d OPALES d s sa cr ation il a t t l charg pr s de six cents fois en trois ans A d faut de savoir s il a combl d aise une partie significative de ce public nous pouvons d ores et d j affirmer qu il constitue une r ponse concr te des questions largement partag es au sein de la communaut de l ing nierie des connaissances Nous avons donc un cadre de conception coh rent pour les ontologies
174. aite n est pas forc ment atteignable Dans l exemple donn une information exprim e selon le patron de haut niveau contiendra des assertions qu on ne pourra pas d duire pr cis ment il faudra recourir la quantification existentielle de connaissances issues du patron d utilisation 149 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique de repr senter la contrapos e de notre r gle puisque celle ci fait appel des individus introduits par des quantificateurs existentiels individus auxquels on ne peut dans les LD sur lesquelles s appuient SWRL faire r f rence pour construire des cycles tels que celui de la figure 4 10 Il faut mentionner que la traduction d une structure une autre peut aussi passer par l expres sion de d finitions de concepts du patron noyau Ainsi de la d finition par condition n cessaire et suffisante d un programme cf figure 4 11 on peut d duire l existence d une s quence d v nements de diffusion dans laquelle ce programme joue le r le d objet diffus et r ciproquement Program AVDocument 1 J plays BroadcastedProgran M J modalityfor BroadcastCourseUfEvents TRS TRS Fic 4 11 Une d finition possible pour le concept Program Un programme est un document audiovisuel qui joue un r le de programme diffus dans une s quence d v nements de diffusion L expression formelle et op rationnelle donc
175. analyse du document audiovisuel Si on avait voulu rendre compte plus clairement de la signification de cette notion hors de son contexte on aurait s rement choisi une autre tiquette comme floril ge qui est reconnu comme terme proche mais ne peut tre employ comme descripteur Mais on se serait alors coup de la pratique qui mobilise le descripteur ce qui lui aurait retir de son intelligibilit et par cons quent de son utilisabilit Ensuite les thesauri couplent ce choix d intitul s langagiers pertinents avec une strat gie compl mentaire de re cr ation d un contexte d interpr tation On a vu comment les relations s mantiques sp cialisation synonymie association pr cisent l interpr tation d une notion Pour achever le travail d explicitation des significations de ces notions beaucoup de thesauri ont recours des notes d application que nous avons d j introduites en page 25 Ces br ves annota tions textuelles donnent celui qui acc de au thesaurus des instructions sur la mani re d employer le descripteur ou bien l vent une ambiguit qui pourrait subsister quant aux rapports entre le descripteur et un autre concept d acception ou de formulation proche Par exemple le thesaurus de PINA dans sa branche sur les formes artistiques comporte une grande quantit de ces notes pour indiquer aux documentalistes des subtilit s d emploi des descripteurs comme le fait que l art brut fait r f rence
176. anci en logique on emploie la formule introduite par Frege de pr dicat non satur 44 2 2 IC et expressivit descriptive Ici on est oblig d introduire des objets nomm s comme interview_1 pour faire r f rence a chaque individu auquel la A box fait r f rence On se heurte ici l une des limitations expressives possiblement introduites par les LD on ne consid re que des constantes correspondant des objets identifi s on ne peut introduire de variable N anmoins avec une logique plus expressive permettant l emploi dans la A box de descriptions complexes pour les instances de concepts on pourra exprimer notre index avec plus de subtilit figure 2 6 et garder l information selon laquelle notre interview n est pas d sign e explicitement Emission MN dcontient Interview MN participe ONE OF prof 1 emission decrite Professeur prof_ 1 Fic 2 6 Extrait d A box de logique de description volu e repr sentant un extrait d index Les notations des constructeurs empruntent la syntaxe abstraite employ e dans BCM 03 Ici on a voulu exprimer le fait que l mission d crite est une mission qui contient au moins une interview laquelle participe au moins une instance du concept anonyme d fini par extension comme contenant l unique individu profi qui est de type professeur On a donc vu que les principaux langages de repr sentation de connaissances autori
177. angage produire une sp cification d une conceptualisation c est fournir un vocabulaire d di une application et essayer de rendre compte de la mani re la plus explicite et fid le possible de ce quoi on se r f re dans le monde vis lorsqu on emploie ce vocabulaire Pour cela il faut expliciter des contraintes formelles ou non qui guident l interpr tation des notions propos es Pour conf rer aux descriptions qui seront produites avec les notions apport es par une on tologie le statut de connaissances il est important de ne pas oublier la dimension consensuelle n cessaire une ontologie M me dans le cadre d une application restreinte l ontologie doit tre rattach e une signification partageable non ambigu et compr hensible par tous les utilisa teurs de l application Bac96 Les sp cifications que constituent les ontologies doivent donc tre duales interpr tation formelle et op rationnelle les notions doivent tre repr sent es de mani re avoir une signification utilisable par un syst me Les syst mes informatiques tant d essence formelle cette signification doit s inscrire dans un syst me formel tel que la logique C est Vapproche qui a guid les premiers travaux sur les ontologies on verra en section 2 3 1 des exemples de langages offrant cette possibilit interpr tation intelligible les notions doivent tre compr hensibles pour l utilisateur final dans le cadre
178. ans l initiative du web s mantique RDF S RDF04b OIL FvH 01 DAML oIL et OWL OWLO4 En fait DOE enregistre les ontologies diff rentielles et r f rentielles dans son propre format qui utilise la syntaxe de XML XML04 Et comme nous le reverrons dans le chapitre suivant il applique ensuite une feuille de style XSLT XSL99 ce qui permet d op rer une traduction syntaxique du format de DOE 4 celui dans lequel on veut que Vontologie soit encod e Les ontologies r f rentielles export es dans les formats retenus sont donc importables dans la majorit des outils adapt s la formalisation et l op rationnalisation notamment ceux que nous avons pr sent s en section 4 3 2 Nous avons donc rendu notre diteur interop rable avec les outils les plus fr quemment rencontr s Car il faut galement mentionner que ce qui est valable pour l export l est aussi pour l import on peut traduire des ontologies d un format standard celui qui est utilis pour DOE Ainsi on pourra r cup rer des ontologies d j existantes ou des proto ontologies thesauri ou r seaux de termes dans DOE et conduire le travail de normalisation s mantique qui leur est n cessaire commencer la formalisation et ventuellement de la conclure dans un outil plus appropri Le probl me est que cette forme d interop rabilit est n cessairement limit e par l expressivit des diff rents outils et langages mis en uvre Par exemple
179. approches de r utilisation de patrons de conception En effet il est possible de rattacher le d veloppement d une ontologie de domaine des patrons de conception qui pr l vent au sein d ontologies de haut niveau les notions utiles un usage qui est cibl mais n cessairement ind pendant d un domaine et les pr sentent sous forme d un motif relationnel adapt cet usage Ces patrons de conception permettent de r utiliser des contenus ontologiques dans le processus de conception des ontologies de domaine et d appli cation ce qui le facilite grandement Ils permettent galement d obtenir des structures qui sont l gitim es mais uniquement du point de vue de la consistance et de la vraisemblance th orique L agencement obtenu en les sp cialisant simplement en particulier peut ne pas suffire rendre compte des usages concrets rencontr s dans un domaine En construisant une articulation expli cite employant sp cialisation et connaissance de raisonnement entre les patrons de conception et les patrons d utilisation plus pragmatiques on permet aux SBC de b n ficier en m me temps d une validation th orique et d une validation applicative 157 Chapitre 5 Exp rimentations et discussions Un tel cadre m thodologique permet dans le contexte de indexation base de connaissances une conception et une utilisation des ontologies qui se fassent plus facilement et de fa on mieux adapt e aux besoins que
180. arantir voire d am liorer la qualit du syst me de recherche documentaire Si on analyse la situation en termes de cha ne de traitement et de r ception de l information on peut distinguer trois leviers de changement la source de l interpr tation On peut orienter la mani re dont l interpr tation est produite en guidant ceux l m me qui la produisent A PINA des documentalistes sp cialis s dans l analyse des documents audiovisuels sont form s afin de produire les descriptions les mieux adapt es aux besoins de l institut Leur exp rience du milieu de la recherche documentaire audiovisuelle ainsi que la formalisation au sein de guides d un certain nombre de r gles relatives aux index produits garantit la pertinence de leur analyse Dans des applications plus restreintes l exp rience montre que ce sont souvent les experts de l application qui sont mobilis s en vue de la description des documents le support de l interpr tation et le comportement du syst me d information exploitant ce support Il faut d finir l encodage de l interpr tation en fonction de l utilisation que l on veut faire de cette interpr tation par un syst me de traitement de donn es La notice textuelle repr sente une premi re avanc e pour l insertion d une interpr tation pertinente du document audiovisuel dans le syst me documentaire qui les exploite surtout si celui ci b n ficie de fonctionnalit s de recherche te
181. arino d montre qu il s agit l d un cas typique de polys mie due au t lescopage de deux regards relativement diff rents sur le monde De fait si le concept Pays tait introduit de cette sorte il devrait tre anti rigide d un point de vue formel n importe quel pays peut cesser d exister sans que le lieu spatial sous jacent disparaisse lui aussi Le pr tendu lien d instanciation Celle ci est disponible sur la partie du site d OPALES h bergeant DOE http opales ina fr public 160 5 2 Exp rimentations ontologiques entre le concept de pays et ce lieu est donc rompu on peut par cons quent d duire que dans ce cas le concept Pays n est pas essentiel pour toutes ses instances et donc qu il est anti rigide Ce qui est en contradiction avec l id e qu on se fait d un pays s il peut changer de r gime politique ou de localisation le fait est qu il demeure d s que son existence a t affirm e une fois Pour rem dier ce probl me il faut donc d coupler les deux notions et introduire deux concepts distincts de R gionG ographique comme ObjetPhysique et de Pays comme ObjetSocial et comme LieuNonPhysique comme cela est fait dans l ontologie DOLCE GGM 02 Cependant nous n avons pas fait un tel choix dans notre ontologie En effet lorsque l on indique que le Tour de France traverse un pays il va de soi que l on consid re un objet spatial On a l affaire une figure de style une m t
182. aris 1993 KAB 00 KASSEL G ABEL M H BARRY C BOULITREAU P IRASTORZA C et PERPETTE Kas99 Kas02 214 S Construction et exploitation d une ontologie pour la gestion des connaissances d une quipe de recherche In Actes de la conf rence IC 2000 Journ es francophones d Ing nierie des Connaissances Toulouse 2000 KASSEL G PHYSICIAN is a role played by an object whereas SIGN is a role played by a concept In IJCAI 99 workshop on Ontologies and Problem Solving Methods Stockholm Sweden 1999 KASSEL G OntoSpec une m thode de sp cification semi informelle d ontologies In Actes de la conf rence IC 2002 journ es francophones d Ing nierie des Connaissances Rouen 2002 Kay97 KC95 KAYSER D La repr sentation des connaissances Herm s Paris 1997 KHEIRBECK A et CHIARAMELLA Y Integrating Hypermedia and Information Retrieval with Conceptual Graphs In Proceedings Hypertext Information Retrieval Multimedia Conference HIM 95 Konstanz Germany 1995 KFNMO4 KNUBLAUCH H FERGERSON R W Noy N F et MUSEN M A The Prot g OWL Plugin An Open Development Environment for Semantic Web Applications In Third International Semantic Web Conference ISWC 2004 Hiroshima Japan 2004 KHGP04 KALYANPUR A HASHMI N GOLBECK J et PARSIA B Lifecycle of a Casual Web Ontology Development Process In Proceedings of the WWW2004 Workshop on Application Design De
183. as l objet de beaucoup de recommandations alors que la cr ation d une telle hi rarchie est centrale pour l ensemble de la conception de l ontologie On aurait donc besoin de principes plus pr cis permettant d assurer la coh rence du processus de construction son ad quation l application qui emploiera l ontologie Existe t il des crit res qui garantissent la qualit de la conception tout en s ins rant dans un cadre m thodologique suffisamment global pour guider suffisamment le concepteur NMO01 par exemple propose un cycle de conceptualisation plut t complet et comparable ceux que nous venons de pr senter mais se pose la question de la correction de la construction de la hi rarchie est ce que la hi rarchie est con ue en accord avec l interpr tation courante de la relation de sp cialisation en particulier par rapport la transitivit de cette relation Est ce que les sp cialisations directes d un m me concept sont au m me niveau de g n ralit Comment utiliser au mieux les possibilit s d h ritage multiple 4 2 2 Des principes pour rendre la conception coh rente Des crit res de coh rence isol s Les r ponses qui sont apport es ces questions sont ce pendant plut t allusives elles sont en fait relativement pr cises d un point de vue pratique les classes d une m me fratrie doivent tre plac s sur une m me ligne mais ne s inscrivent pas dans un processu
184. ateur d ontologies finalis es Les outils auxquels on peut acc der une grande partie est disponible gratuitement du moins en version de d monstration sont tr s vari s et diff rent tant par les interfaces de sp cification et de visualisation de concepts et de relations que par la capacit offerte ou non de travailler en ligne la gestion des volutions des ontologies cr es l incorporation des raisonneurs ou plus simplement la richesse autoris e pour les sp cifications formelles qui d pend souvent du langage de repr sentation choisi comme r f rence pour l diteur Les plus anciens n offraient la possibilit d diter les ontologies que de mani re directe On sp cifiait la plus grande partie des d finitions en utilisant un langage de repr sentation donn reconnu par l diteur Celui d entre eux qui a rencontr le plus de succ s est Ontolingua Server FFR97 Ce serveur a t cr par le laboratoire KSL de l universit de Stanford au d but des ann es 90 dans le cadre du DARPA Knowledge Sharing Effort programme pionnier en concep tion de connaissances partag es Ontolingua Server cherchait privil gier le travail collaboratif plusieurs utilisateurs pouvant se connecter et travailler en m me temps sur une ou plusieurs ontologies Le langage de repr sentation sous jacent KIF pouvait servir de passerelle entre plu sieurs langages impl ment s de RC ce qui permettait un degr de r ut
185. ation Endurant participant in gt Perdurant a A DORE Patron de congeption D amp S AVRegion AVEndurant AVAction Organization SEA Person Program Emran Sequence corte FIG 4 6 Introduction de concepts g n raux de l audiovisuel suivant le patron de conception D amp S La vue du patron D amp S a t simplifi e pour la lisibilit de l ensemble Pour autant une telle structure sera t elle utilisable par l indexeur ou l expert du domaine La complexit des notions impliqu es par des consid rations abstraites peut masquer la vue applicative sur le domaine et limiter la pertinence de l ontologie Par exemple notre tude des besoins en mati re de description documentaire audiovisuelle reposant en grande partie sur l examen des notices produites VINA et concernant ce titre autant le catalogage que l indexation aboutit l obtention d un patron d utilisation dont la structure relationnelle illustr e en figure 4 7 est beaucoup plus simple que celle esquiss e en figure 4 6 IT04 Les descriptions dont nous avons r ellement besoin sont centr es plus sur les documents que sur les situations de production ou de diffusion certaines subtilit s informa La patron D amp S place en effet au c ur de la conceptualisation qu il propose la notion de s quence d v nements temporels 144 4 4 Ing nierie ontologique et patrons d indexation tionnelles du patron de conceptio
186. ation Il peut aussi consulter notre article d crivant le projet dans sa globalit ICG 04 Introduction Liens avec la recherche VINA et l Institut dans son ensemble La r alisation d un tel objectif m me dans le cadre plus restreint qui tait le n tre a for c ment exig une familiarisation approfondie avec le monde documentaire ou en tout cas du sous ensemble du monde documentaire que repr sente PINA Les paradigmes qui le structurent les probl mes que l on y rencontre Tout au long de ces trois ans nous avons donc suivi les efforts de recherche des quipes de l Institut qui abordaient des domaines connexes au n tre segmentation automatique PCO5 d tection de contenu textuel dans les images LWVJ04 construction d interfaces labor es de recherche TVV04 Toutes ces recherches ont voir avec le document audiovisuel ses usages la mani re dont il faut ou dont on peut le d crire et le rechercher Plus important pour nous nous avons pu participer des groupes de rencontre entre cher cheurs et documentalistes de notre Institut Des experts du monde documentaire nous ont ainsi pr sent les outils qu ils utilisaient thesaurus interface d indexation et de recherche etc la mani re dont ils les utilisaient les probl mes qu ils rencontraient Nous avons eu galement acc s aux traces les plus objectives du m tier de documentaliste les immenses bases de descriptions documentair
187. ation est n cessaire si l on veut cr er des expressions manipulables par un programme informatique con u pour faire des calculs partir de ce qui ne sont que des formes toute expression informatique m me si elle est labor e repose finalement sur un codage binaire Dans notre situation les index devront tre repr sent s de sorte avoir une signification formalis e De la signification intelligible des l ments composant les index celle qui r sulte de l interpr tation humaine ancr e dans la verba lisation et la pratique d un domaine applicatif on va abstraire des sp cifications qui s inscrivent dans un cadre interpr tatif formel Bac96 La signification des expressions s obtient alors par tir des significations de leurs composants l mentaires processus qui s appuie traditionnellement sur des interpr tations en termes d ensembles et d op rations ensemblistes Cette signification formelle sera alors facilement exploitable pour obtenir une sp cification des inf rences autoris es pour les programmes de raisonnement ces inf rences constituent une interpr tation calculatoire lhe terme concept est ambigu du fait de son emploi suivant des acceptions diff rentes dans diverses disciplines son sens variant m me parfois l int rieur d un m me champ En repr sentation des connaissances on verra par exemple qu un concept pour les logiques de description correspond un type d
188. aturel d aller vers l indexation de documents non audiovisuels On 54 WORDNET peut par exemple tre utilis comme connaissance de contexte dans des processus d alignement d ontologies 55Mais on peut consid rer que celui propos dans GM03 pourra d j tre r utilis dans nombre d applications son usage descriptif le pla ant au c ur des activit s traditionnelles de repr sentation 6On peut consulter par exemple les articles BTWO1 Wag03 et HPB 04 mais aussi des initiatives comme le r seau d excellence europ en REWERSE http rewerse net On remarquera que tout cela est toujours vi demment conforme la vision du visionnaire Tim Berners Lee qui avait astucieusement song ins rer un item rules dans son g teau 204 perdrait certaines des ressources que nous avons pu concevoir pour l indexation audiovisuelle notamment l ontologie de l audiovisuel d velopp e avec Rapha l Troncy ICG 04 mais la m thodologie est toujours applicable D autres contextes sont envisageables le tout est d tre confront une application qui demande des descriptions riches qui offre les moyens de les ob tenir m me si les structures sp cialisant les patrons d utilisation sont obtenues par extraction d information automatique et qui requiert des traitements inf rentiels labor s partir du contenu et en particulier du contenu relationnel de ces descriptions 205
189. aux concepts de notre ontologie les principes de v rification formelle apport s par Nicola Guarino cf section 4 2 2 La premi re de nos remarques d ordre pratique est que cette exp rience s est faite de fa on ad hoc puisqu au moment o nous l avons conduite il n existait pas encore d interface de saisie et de v rification de telles informations formelles comme ODECLEAN FG02 Ensuite d un point du vue plus fondamental et comme nous l avons d j indiqu dans la section 4 2 2 l application des principes formels de Guarino pour les concepts n a pas modifi de mani re notable l organisation que nous avions obtenue lors de la normalisation s mantique De fait nous avons pu observer que la clarification obtenue suite cette normalisation a pour effet de lever un certain nombre d ambiguit s dont beaucoup comptent parmi celles que d noncent Nicola Guarino et ses coll gues Par exemple dans l un des articles exposant leur m thodologie d analyse ontologique WG01 ceux ci pr sentent le cas du concept Pays Ce concept peut dans une premi re approche tre mod lis comme une LocalisationSpatiale ce qui traduit son ancrage g ographique mais aussi comme un AgentL gal pour rendre compte de son r le vis vis des soci t s humaines On serait donc dans une situation o il serait pertinent de recourir l h ritage multiple pour d finir cette notion Pourtant l analyse ontologique de Welty et Gu
190. b Conference ESWC 2005 Heraklion Greece 2005 TSINARAKI C POLYDOROS P et CHRISTODOULAKIS S Integration of OWL ontolo gies in MPEG 7 and TV Anytime compliant Semantic Indexing In 16th International Conference on Advanced Information Systems Engineering CAiSE 2004 Riga Lat via 2004 TRONCY R Formalisation des connaissances documentaires et des connaissances conceptuelles l aide d ontologies Application la description de documents audiovi suels traitant du cyclisme Th se de doctorat Universit Joseph Fourier Grenoble I 2004 TURNER J Images en mouvements Stockage Rep rage Indexation Presses de l Universit du Qu bec Qu bec Canada 1998 TEMPICH C et VOLZ R Towards a benchmark for Semantic Web reasoners An analysis of the DAML ontology library In 2nd International Workshop on Evaluation of Ontology based Tools EON2003 at ISWC2003 Sanibel Island Florida 2003 THI VRE J VIAUD M L et VERROUST BLONDET A Using Euler Diagrams in Traditional Library Environments In First International Workshop on Euler Diagrams Euler 2004 Brighton United Kingdom 2004 USCHOLD M et GRUNINGER M Ontologies Principles Methods and Applications Knowledge Engineering Review 11 2 1996 USCHOLD M et KING M Towards a Methodology for Building Ontologies In IJCAI 95 Workshop on Basic Ontological Issues in Knowledge Sharing Montr al Canada 1995 VAN RIJSBERGEN C J
191. base de faits lui tout seul on ne peut 186 5 3 Discussions m thodologiques r br sente infarctus Bouchon P infarctusX bouchonY segment 2 S quence repr sente Bouchon re Cholesterol 9 s quence2 p bouchonY cholesterolZ Fic 5 11 Deux index fabuleux S quence segment ts s quence1 se servir des connaissances apport es par les autres index pour r pondre une requ te Ainsi si le segment 1 pourra r pondre une recherche de s quences repr sentant un accident caus par un probl me art riel puisque les concepts d infarctus et de bouchon sp cialisent ces deux notions En revanche il ne pourra pas figurer dans les r sultats d une recherche de s quences repr sentant des accidents caus s par des anomalies sanguines puisque la connaissance selon laquelle le bouchon est li un taux lev de cholest rol est pr sente dans un autre index recherche d information Dans ce paradigme le lien entre la connaissance repr sent e par l index et le document lui m me est mis au second plan on recherche un contenu informationnel avant tout Ici tous les index sont consid r s comme une seule base de faits On saura donc que cholesterolZ a caus infarctusX ce qui permet de r pondre des requ tes cherchant toutes les causes d accidents cardiaques apparaissant dans la base d index Pour obtenir des r sultats qui soient vraiment des documents il faut ajouter des foncti
192. bserver les solutions qui ont d j t avanc es pour faciliter la t che de conception des ontologies et en am liorer le r sultat Dans la lign e des travaux que nous avons effectu s au d but de notre th se BIT02 TI02 nous montrerons qu en la mati re s il existe de nombreuses propositions de m thodes ou bien d outils de conception peu ciblent les usages autant que nous devons le faire Et que ces propositions qui concernent surtout la gestion du cycle de vie des ontologies l assistance la saisie ou le contr le des sp cifications formelles en dehors de toute vis e applicative explicite doivent tre compl t es par d autres guidant le concepteur de mani re plus pr cise Nous verrons en particulier que le probl me des taxonomies est souvent abord de mani re sommaire alors que cet l ment est central pour la compr hension et l utilisation des artefacts ontologiques et donc pour leur conception Pour r soudre cette difficult nous allons nous tourner nouveau vers les propositions de Bruno Bachimont qui ins rent les prescriptions interpr tatives que nous avons vues au chapitre 3 dans une r flexion globale sur la conception d ontologies de la pr cision des significations lin guistiques rencontr es dans un domaine la cr ation de r f rentiels op rationnels disponibles pour des SBC concrets Nous pr senterons cette m thode laquelle nous avons contribu au tra vers d exp rimentations
193. c dents ont bien t mises en uvre dans des exercices concrets et significatifs de mod lisation Ces efforts d application ont ensuite en retour contribu au mtirissement de la dite m thodologie Il faut d ailleurs noter qu un tel retour n a t possible et l gitime que parce que nos exercices sont loins de n avoir constitu que de simples jouets En effet sur les cinq exp rimentations que nous avons pr sent es une seule n a pas t explicitement r alis e en vue de l usage d indexation auquel nous destinions nos r flexions Et m me si elles sont loin de faire de ceux ci les contributions les plus significatives de l ing nierie ontologique la taille ainsi que la richesse des mod les la r alisation desquels nous avons particip n ont strictement rien de honteux Il nous faut n anmoins reconna tre que nous avons manqu d utilisateurs r els lex ception notable du cas d OPALES Nos exp rimentations correspondent bien des besoins et des usages observables mais en l absence de validation finale par l utilisateur ou d un concepteur diff rent de nous m me la qualit de notre analyse peut tre prise en d faut Nous pouvons cependant nuancer cette remarque par le fait que ces exp riences b n ficient d un certain effet de nombre Du fait de l organisation de la recherche sur les ontologies PINA notre travail d acquisition de connaissances a t en effet toujo
194. cas particulier Alors que la plupart des thesaurus se restreignent un domaine applicatif donn celui de VINA pour ce m me imp ratif applicatif est condamn aborder tous les domaines que peuvent traiter les documents audiovisuels ce qui lui donne une dimension encyclop dique plus de 12000 descripteurs organis s en plus d une centaine de champs sur 8 niveaux de profondeur 25 Chapitre 1 La description des documents audiovisuels dans les processus documentaires audiovisuel radio mat riel radiophonique poste transistors CF PHYSIQUE TRANSISTOR poste de radio UP r cepteur radio mission radiophonique image sonore NA Son caract ristique a fort pouvoir vocateur v nement lieu p riode etc jeu radiophonique journal parl t l vision technique audiovisuelle animation CF DESSIN ANIME effet d image UP effet image image de synth se CF IMAGE VIRTUELLE montage TAB 1 3 Un extrait du thesaurus de VINA 26 1 3 Le contr le du support de l indexation chemins relationnels et ainsi soulager une partie de l effort consistant pallier une rupture de continuit interpr tative entre l indexeur et celui qui effectue la recherche cf exemple du tableau 1 2 Par exemple si un utilisateur recherche des documents utilisant une technique audiovisuelle particuli re les documents dont les index contiennent la notion animation li e la pr c dente par la relation hi rarchique
195. catif Au cours de cette th se nous avons com menc r fl chir de tels objectifs en compagnie de V ronique Malais doctorante VINA Mais nous n avons pu y consacrer les efforts qu nos yeux cette piste m rite articulation entre patrons de conception et patrons applicatifs conomies cognitives et engagement ontologique Lorsqu on veut rendre compte des conceptualisations existant dans un domaine particulier on se retrouve souvent face des idiomes propres ce domaine marqu s par l usage de figures de style ou bien de glissements de sens qui refl tent des fa ons de penser profond ment ancr es dans les pratiques Ainsi dans le domaine du cyclisme on emploiera la pr position avant dans un sens qui n est pas imm diatement temporel Il a chut avant le col est une expression attest e Or pour repr senter une telle connaissance il faudrait en premi re approche lier par une relation exprimant l ant riorit temporelle un v nement la chute et un objet spatial le col Ceci serait videment incorrect d un point de vue ontologique En revanche on peut faire remarquer que cette pratique est autoris e dans le domaine cause de la sp cificit de la notion de course qui se d roule sur un parcours Un rep rage temporel entre des v nements peut en effet impliquer une forme de rep rage spatio temporel sur l axe du trajet de la course que le parcours temporel munit d un
196. cc s aux index s mantiques a_pour_ l ment_de_description Calebasse a_pour_caract ristique_de_localisation Habitatindividuel Fic 3 11 Sp cialisation d un patron d indexation en un index d hygi ne usuels et l action est d crite comme tant pratiqu e sur le nombril du nouveau n et non sur celui ci consid r dans son ensemble ce qui nous place dans une configuration diff rente de celle du graphe patron On a bien ici une illustration de la pertinence puisque la structure est tout de m me tr s proche et les concepts assez peu loign s dans la hi rarchie de l ontologie mais aussi de la souplesse de cette approche Nombril Nouveau n Fic 3 12 Un index ne sp cialisant pas logiquement le graphe patron Pour synth tiser la notion de patron d indexation on peut proposer la d finition suivante y P Un patron d indexation ontologique est une construction relationnelle adaptable qui pr sente dans un contexte d indexation typique l articulation entre les concepts et les relations ontologiques les plus caract ristiques d une application Ce patron sert de point de d part au processus d indexation qui consiste 4 modifier ses l ments et sa structure de mani re 4 rendre compte d un contenu documentaire donn 100 8 8 Assister la formulation des descriptions On sait alors quels sont la nature et l usage de tels patrons Cependant plus de pr
197. ce conceptuelle reste employ e dans un contexte limit le plus souvent celui d un syst me d information sp cifique ou d une organisation particuli re Pour les ontologies surtout si celles ci sont cr es en conformit avec la vision du web s mantique la situation est diff rente Leur repr sentation se doit en effet d in corporer toutes les informations permettant de cerner la conceptualisation qu elles repr sentent surtout si ces informations ont fait l objet d une explicitation lors de la phase de conception Cela est indispensable au partage des compr hensions associ es aux primitives contenues dans ces vo cabulaire cela peut aussi l tre dans le cas o des syst mes auraient acc der des l ments de signification qui n avaient pas d utilit vidente pour les taches classiques de description et de re cherche d information Valentina Tamma qui dans sa th se a propos un jeu de m ta propri t s relationnelles Tam02 insiste bien sur le fait que de telles informations pouvent tr s bien servir comme donn es pour des algorithmes d alignement d ontologies Elles sont par cons quent sus ceptibles d am liorer l interop rabilit de SBC reposant sur des conceptualisations diff rentes ce qui est l un des objectifs de l initiative du web s mantique Pour notre diteur d ontologies qui devait videmment enregistrer et acc der l ensemble des informations requises par la m thodologie
198. celle que demanderait un utilisateur humain SL usage en anglais est de recourir au terme template qui peut se traduire par celui de patron N anmoins et pour marquer la diff rence avec les patrons d indexation que nous proposons par la suite nous pr senterons comme des formulaires ce qui a pu tre introduit comme template En effet les structures d sign es par ce terme sont plus proches d une structure lin aire remplir que d une structure articul e pouvant tre directement imit e pour la cr ation des index ce que sont nos patrons 94 8 8 Assister la formulation des descriptions name Exist BePresent father Exist position in H TEMP 2 3 NL description EXIST vari var7 varg vars SUBJ varl var2 OBJ var3 var4 SOURCE var5 var6 BENF MODAL var7 TOPIC var8 CONTEXT var9 modulators abs var3 varS lt human being or social body gt lt action_name gt lt property_ gt lt event_ gt lt action_name gt var2 var4 var lt physicai_location gt name BePresentWithSomeone father Exist BePresent position 2 32 EXIST varl var7 varg var9 var2 var2 FIG 3 7 Le template Be present et une de ses sp cialisations extrait de Zar00 na NL description Be Present Somewhere with Someone SUBJ varl var2 OBJ var3 var SOURCE var5 var6 BENF MODAL var7 TOPIC var8 CONTEXT var9 m
199. chapitre 4 de cette th se Cette ontologie se concentre d abord sur la caract risation d l ments documentaires le concept principal est celui d objet de production AV qui repr sente la notion m me de document AV La premi re distinction intervient entre programmes entit s plut t ind pendantes du point de vue de la production et de la diffusion et s quences parties de programmes ou d autres s quences Ces concepts sont ensuite sp cialis s en fonction de traits diff rentiels li s la forme ou au contenu on obtient ainsi une hi rarchie de genres audiovisuels Par exemple les pro grammes sont r partis entre composites et simples les premiers contrairement aux seconds tant compos s d une suite d l ments autonomes du point de vue de la forme et du contenu Ils sont ensuite class s suivant leur longueur et leur contenu g n ral fiction information di vertissement Apr s quelques tapes additionnelles de sp cialisation on peut trouver les genres t l visuels courants com die de situation documentaire spectacle TV L ontologie introduit galement les notions utilis es pour pr ciser les caract ristiques des objets AV Tout d abord nous avons introduit une hi rarchie des r les que les personnes peuvent jouer dans un programme soit en tant qu auteurs producteur r alisateur mentionn s cause de leur importance dans la production du programme soit comme participants animateur act
200. cherche documentaires qui vont plus loin dans l articulation entre documents index et raisonnements De fait si l on effectue une recherche sur les liens entre un accident cardiaque et une anomalie sanguine nos deux segments pourraient tre renvoy s Mais il serait encore plus int ressant de les renvoyer en une seule combinaison documentaire ne serait ce qu une simple concat nation des deux segments qui soit consid r e comme une unique r ponse au besoin exprim Le pro bl me est qu une telle solution demanderait dans une certaine mesure l application de strat gies 5 Pour les besoins de notre argumentation nous consid rons que la relation cause est transitive 187 Chapitre 5 Exp rimentations et discussions d explication des raisonnements conduits I faut en particulier conserver les liens avec les index ayant permis la conduite des raisonnements Il serait galement n cessaire de faire appel des connaissances indiquant le moyen dont un syst me peut composer de mani re semi automatique de nouveaux documents partir des raisonnements conduits et des liens entre les r sultats de ces raisonnement et les sources documentaires qui l ont permis De telles m ta connaissances de composition devraient s rement tre mises en rapport avec les connaissances ontologiques du point de vue th matique retenu pour l indexation dans notre exemple il serait int ressant d introduire des contraintes rela
201. cherche documentaire Concr tement nous allons chercher un support de description qui sera exploitable de mani re pertinente par un syst me d assistance l acc s au contenu Ici nous n allons pas sugg rer de m canisme physique particulier d encodage de l information mais plut t nous pr occuper de la cr ation de langages de description des contenus documentaires en nous focalisant sur le niveau conceptuel de telles descriptions En effet plus que sur la repr sentation g n rale des contenus des documents nous nous concentrons sur la description des significations que peuvent prendre ces contenus pour des applications sp cifiques Au cours de ce chapitre nous avons montr que les langages documentaires actuels pr sentent des lacunes au regard de la description des interpr tations documentaires Pour obtenir un sys t me d indexation et de recherche plus performant il est important d apporter des am liorations aux langages existants en proposant des dispositifs de cr ation de langages et d index qui puissent tre valu s positivement par rapport aux fonctionnalit s r sum es ici F1 Expressivit Il est indispensable de pouvoir produire au sein du syst me d indexation des descriptions suffisamment riches et pr cises de la signification des documents afin de les restituer le plus fid lement possible Ceci implique de traiter correctement les points de la forme et de la substance des descriptions
202. ci pr cise en quelque sorte des objectifs compl mentaires ceux qui sont traditionnellement mentionn s d finition d un vocabulaire encodage de celui ci selon un m ta langage de repr sentation formelle L enjeu de ce chapitre est donc de revenir la probl matique disciplinaire que nous avons voqu e dans notre introduction g n rale Comment les consid rations applicatives que nous avons d velopp es jusqu pr sent peuvent elles tre ins r es dans le processus de conception des ontologies Peut on proposer des outils concrets m me d assister les concepteurs d ontologies dans leurs travaux A ce stade de notre r flexion on sent bien que la d termination d objectifs pr cis pour la conception des ontologies peut tre un moyen d am liorer et de faciliter le processus de mod lisation formelle des connaissances Peut on formaliser l influence de nos propositions sur ce processus de sorte qu elle le guident et lui apporte une l gitimit imm diatement identifiable au lieu de le complexifier sans contrepartie vidente pour son auteur Cela implique en particulier de r flechir au processus de formalisation Comment articuler d une part la d termination d une interpr tation formelle pour les concepts et les relations de l ontologie visant des calculs symboliques dans le cadre du SBC et d autre part l expression na turelle des connaissances Par exemple si l on recherche un processus d
203. cisions sont n cessaires si l on veut en particulier cerner le statut du patron et des notions qu il mobilise par rapport aux autres ressources ontologiques Pr cisions sur les patrons d indexation ontologiques Tout d abord il est indispensable de remarquer la compl mentarit de l ontologie et du patron d indexation En effet le patron d indexation constitue en quelque sorte un mode d emploi du langage d indexation qui comme nous l avons montr dans la chapitre 2 repose sur l ontologie de l application consid r e ce titre on ne peut envisager le patron sans l ontologie celle ci clarifie la signification des concepts et relations qu il utilise et par la donn e des notions qui leur sont proches et des contraintes formelles qui s y appliquent indique quelles sont les volutions l gitimes qu il peut subir De m me dans le cadre d une application pr cise le patron d indexation est indispensable l ontologie si celle ci en fournissant deux interpr tations m tier et formelle donne ses notions une signification claire dans un contexte d usage elle ne donne pas ce contexte d usage Le patron lui peut tre consid r comme la formalisation d un tel contexte puisqu il donne un exemple d utilisation pr cis et explicite des notions de l ontologie Par exemple les d finitions formelles telles que celles introduites en logique de descriptions si elles introduisent des motifs qui peuvent
204. comportement inf rentiel satisfaisant par rapport aux besoins de recherche et aux variations informationnelles possibles Par exemple on trouvera les r gles de transmission de la localisation pr sent es en page 107 ou bien une r gle de distribution de la participation une action si un groupe d entit s est impliqu dans une action alors on consid re que chacun des membres de ce groupe est impliqu individuellement dans ladite action Au final l ontologie de la petite enfance comporte 474 concepts 68 relations pour une pro fondeur hi rarchique maximale de 15 niveaux ainsi que 106 r gles de raisonnement La figure 5 3 donne un aper u du contenu de son arborescence conceptuelle C est une d marche semblable qui a t suivie pour le point de vue relatif au traitement documentaire de l eau dans le domaine g ographique Le corpus retenu comportait une vingtaine de documents soit 5 heures de vid os Des besoins observ s nous avons con u une ontologie comportant 598 concepts et 55 relations pour une profondeur hi rarchique maximale de 16 ainsi que 35 r gles relationnelles Nous en donnons un extrait en figure 5 4 Ici l accent a t nettement moins mis sur la normalisation du haut niveau ontologique que sur le niveau structurant de l application Les cat gories propos es dans le patron d indexation cf figure 3 13 page 104 correspondent en effet des entit s relevant de domaines relativement diff ren
205. compr hensions rencontr es dans le domaine d application On utilise la langue et ses verbalisations m tier comme fondement m me de la construction des concepts et des relations et l on se r f re des patrons d utilisation qui refl tent fid lement les besoins de l application en mati re de description conceptuelle Les solutions sugg r es apportent donc l ensemble du processus un bien fond certain en ce qui concerne les usages Ensuite on b n ficie d une l gitimit et d une coh rence th oriques importantes L expression naturelle des significa tions ob it des principes justifi s par une th orie linguistique reconnue Et les cons quences en termes de rapports hi rarchiques de ces prescriptions interpr tatives sont respect es lors des tapes suivantes de formalisation et d op rationnalisation De plus au cours de la conception le rattachement des patrons applicatifs aux patrons de conception permet de situer l engagement ontologique du concepteur par rapport une th orie de haut niveau que l on peut consid rer comme une source de vraisemblance et de consensus En d autres termes on peut dire que nos propositions r pondent la fois aux probl mes d utilisation et de reprise de l ontologie Car une plus grande r utilisabilit d coule naturellement de la plus grande capacit de l ontologie faire consensus et donc tre partag e mais aussi de la possibilit qu elle a de
206. connaissances assertionnelles qui permettent de r pondre efficacement aux questions de comp tence De fait l application stricte de principes m thodo logiques tels que ceux que nous venons de voir aide r pondre des questions de comp tence mais du type de celles qui s int ressent plus l ontologie en tant que telle qu au comporte ment du syst me dans lequel celle ci sera ins r e est elle coh rente Est ce qu elle rend compte convenablement des lois du monde Est ce qu on peut la partager facilement Se contenter de sp cialiser un patron de conception ne suffit donc pas toujours obtenir de v ritables patrons d utilisation tels que les motifs d indexation que nous avons voqu s tout au long de ce manuscrit On doit faire la part entre les d cisions th oriques d un patron de conception 145 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique quant l organisation du monde d crire et le domaine qui peut exiger une mod lisation plus pragmatique Dans un cadre appliqu concret il faut veiller se placer au niveau des notions typiques de l application qui ne sont pas n cessairement les notions g n rales du domaine et chercher obtenir une structure vraiment proche du besoin descriptif C est pourquoi nous pensons que le param trage des conceptualisations tel que pr sent dans CTP00 BLS 00 permettant de s lectionner ou non les l ments de mod
207. contr le et traitements pour des syst mes d indexation et de re Cherche sis este sans ee E Reh eh races Ge Me BU save ee Me De ds ent ake 49 2 3 1 Sp cifications ontologiques et respect de la continuit s mantique 50 2 3 2 Inf rence continuit s mantique et pertinence d un SBC 62 2 4 Utilisations concr tes d ontologies par des syst mes de recherche d information 66 D2 Conclusion 23 ewer L ARE ns amp AN eo PA how ns Le ile BS eh ch HQE 70 Partie II Prendre en compte l usage dans l impl mentation de solutions d in dexation ontologique 3 Faciliter la conception et l acc s aux index s mantiques 77 3 1 Introduction vers une prise en compte des usages dans les solutions existantes 77 3 2 Aider la compr hension de la substance des descriptions 79 3 2 1 Le n cessaire ancrage dans les compr hensions et usages du domaine 79 3 2 2 Des notions ontologiques normalis es 86 3 3 Assister la formulation des descriptions 91 3 3 1 Prescrire le contenu des index 92 3 3 2 Patrons d indexation 98 3 3 3 Utilisation des patrons d indexation et raisonnement 106 SA Conclusion fea das due Ba oe Pas ee BP Bee LUE Se der 108 Faciliter la conception d ontologies pour l indexation s mantique 111 Adly Introductions Se amie Rate ee Vet Boe es amen He ae Bee 1
208. criptions de ce document Nous nous concentrerons tout sp cialement sur la cr ation et l utilisation de descriptions du contenu du document audiovisuel pour des syst mes de recherche documentaire ou de recherche d information En particulier nous ne chercherons pas analyser finement la mani re dont la num risation bouleverse les modalit s pratiques de production de stockage et d acc s au docu ment audiovisuel int gration de la cha ne de production d lin arisation de l acc s au document m me s il est acquis que ce bouleversement est l origine des pr occupations qui motivent les actions de recherche de VINA dont cette th se fait partie 1 1 2 La probl matique de la description du contenu Dans un environnement comme celui de l Institut on se rend rapidement compte qu il est loin d tre facile d organiser la gestion et la mise disposition des documents audiovisuels Apr s le probl me imm diat de la conservation il faut r soudre celui d un acc s raisonn aux documents et l information qu ils contiennent pr lude indispensable une r utilisation correcte de ces l ments Il s agit de permettre la compr hension par les usagers ou les clients du mat riel qu on leur propose ainsi que de souligner sa valeur pour le besoin qui a motiv leur recherche documentaire r utilisation pour une nouvelle production ou simple gt besoin d information Nous verrons dans ce chapitre que la
209. criptions qu ils ont cr es on pallie ainsi une partie des variations observ es dans les pratiques d explicitation et de reformulation N anmoins il est vident qu une telle approche ne peut tre retenue pour toutes les ap plications Des techniques existent qui en agissant sur la mani re dont on exprime les index permettent un contr le de l interpr tation et une exploitation moins exigeante en investissement humain Nous avons vu qu il est courant dans le monde documentaire de se tourner vers des lan gages s appuyant sur des thesauri qui normalisent les interpr tations des notions utilis es dans les descriptions On montre cependant que parfois ces thesauri sont trop limit s sp cialement par leur manque de relations s mantiques d di es des cas applicatifs pr cis En effet en parti culier dans le domaine de la description audiovisuelle il est n cessaire de pouvoir exprimer des relations entre les composants d un index Et les techniques traditionnelles ne suffisent pas on peut normaliser la structure d une description et la mani re dont cette structure est interpr t e mais l obtention d un contr le satisfaisant se fait souvent aux d pens de la finesse et de la richesse des expressions autoris es On retrouve l un probl me g n ral aux solutions documentaires utilis es couramment des progr s normes ont t accomplis au regard des performances des syst mes de gestion et d acc s aux descri
210. criptive plut t que contraignante I faut galement que cette structure mette l accent sur Vemploi des relations de l ontologie Dans le cadre du projet OPALES ces besoins se faisaient sentir de fa on importante puisque les communaut s en pr sence souhaitaient d crire des faits dont le niveau de structuration est lev v nements impliquant plusieurs participants faisant possiblement l objet d une description rapports complexes entre des documents structur s les l ments de cette structure et le contenu th matique associ ces l ments Pour rem dier ce probl me la fa on la plus naturelle est de fournir une premi re forme approximative d index s mantique L utilisateur se voit ainsi proposer une information dont il pourra directement s inspirer pour effectuer son travail En fait sa t che est d autant plus simplifi e que cette forme est int gr e au processus d indexation en en constituant par exemple le point de d part effectif Pour OPALES de tels index g n riques ont t cr s et employ s lors de l indexation sous l appellation de graphes patrons Pour chaque point de vue les concepts et relations de l ontologie correspondante sont mobilis s dans un graphe conceptuel cens refl ter un index typique Cette approche peut sembler proche de celle des formulaires mais elle marque une progression sur deux points essentiels on utilise les relations du domaine applicatif et on prescrit
211. ct risation compl te comme montr en figure 3 7 On retrouve l une vision proche de celle des frames Min81 o un concept est introduit comme une construction compos e d attributs qui prennent des valeurs sp cifiques chaque instance Le probl me est que cette vision est plut t restreinte quant ses possibilit s du point de vue des relations entre l ments on ne peut exploiter des structures complexes de fa on flexible puisque les liens tranversaux entre entit s du domaines ou entre entit s et v nements sont en retrait par rapport aux objets fondamentaux de la mod lisation que sont les v nements On sera donc moins tent par remettre en cause la structure pr conis e puisqu elle est attach e S QKHO3 et Svd 04 donnent un aper u des r flexions sur ce domaine dans le cadre du web s mantique TNous excluons tous les travaux qui visent la population automatique de base de connaissances Le 03 SCB 04 HS03a S ils parviennent masquer la complexit des sBc en soulageant l utilisateur de la t che de cr ation des connaissances ils se placent dans un cadre r solument diff rent du n tre On pourra d ailleurs remarquer qu peu pr s tous utilisent pour guider les algorithmes d extractions de connaissances des structures pressenties comme tant celles qui devront appara tre dans la BC Et que dans ce cas c est en quelque sorte le syst me lui m me qui a besoin d une assistance comparable
212. cuments ce langage doit galement permettre des traitements qui utilisent la mati re des index et ce d une fa on galement adapt e au point de vue applica tif A l heure o les besoins documentaires deviennent plus complexes l exploitation de l index point de passage oblig entre des acteurs documentaliste expert du domaine utilisateur non expert de plus en plus isol s face au syst me documentaire est cruciale Il faut donc voir comment introduire des m canismes plus fins de repr sentation des interpr tations dans le sys t me documentaire et comment ces m canismes peuvent tre employ s avec des connaissances qui sp cifient le comportement du syst me dans un contexte applicatif particulier Nos besoins on l a vu concernent la fois des fonctions li es 1 l expressivit des descriptions nous voulons des index complexes dont les l ments peuvent tre articul s par des liens typ s sp cifiques l application envisag e 2 au contr le de l expression le syst me doit fonctionner de mani re garantir une continuit d interpr tation entre les utilisateurs divers qu ils soient cr ateurs d index ou chercheurs Ceci implique que les index doivent tre cr s et manipul s conform ment un r f rentiel partag de signification 3 la manipulation des descriptions pour l assistance la recherche d index le syst me doit tre capable de mettre en uvre des
213. d interfaces qui dans la continuit de ce que l utilisation des hi rarchies offre vulgarisent les sp cifications formelles Poursuivant sur la lanc e des langages de RC qui essaient d utiliser des primitives pist mologiques relativement compr hensibles pr sent es de mani re plus ou moins informelles GHB96 Kas02 diff rents outils de visualisation d ontologies la plupart coupl s des interfaces de conception de ces artefacts proposent des moyens plus ou moins graphiques d acc der cette signification CM01 LN03 Certains outils proposent galement de g n rer automatiquement des verbalisations des expressions d finissant les concepts et les relations RZST99 KV03 KHGP04 comme en figure 3 3 On construit alors des expressions langagi res partir de termes associ s aux primitives logiques et non logiques de la sp cification de l ontologie et de r gles syntaxiques qui refl tent celles qui s appliquent au m ta langage De telles solutions ont pu tre appliqu es des r gles d inf rences plus com plexes que les expressions des logiques de description HNM02 ou encore en association avec des moyens visuels classiques comme dans le cas de l extension de l diteur Prot g d di e la conception d ontologies en OWL KFNM04 cf figure 3 4 pour un exemple de sp cification dans notre domaine audiovisuel ou de l diteur d ontologies d velopp dans le cadre du projet SHAK
214. d crit Cependant pour que de telles primitives constituent un v ritable syst me de repr sentation intelligible et exploitable il faut soigner tout particuli rement leur introduction et leur emploi dans le langage que ce soit pour la concep tion ou l utilisation du SBC L objectif est bien de pourvoir un ensemble de descripteurs d une interpr tation qui soit utilisable dans un langage de construction de descriptions complexes et que la signification qui est associ e de ce fait aux expressions produites s inscrive correctement dans le fonctionnement d un syst me d acc s aux connaissances en particulier en sp cifiant les calculs qu il peut effectuer On rejoint l les consid rations li es la notion de vocabulaire de description dans les langages documentaires qui imposent une conception et une articulation pr cises entre langage de description descripteurs et traitements applicables Pour r soudre de tels probl mes l approche de la RC suivie par l initiative dite du web s mantique propose le recours des sp cifications conceptuelles pouvant servir de vocabulaire de repr sentation les ontologies 2 2 2 Vocabulaire de repr sentation et ontologies Dans le cadre des syst mes documentaires on a vu qu il faut pr ciser ce qui constitue la substance des descriptions On doit fixer un vocabulaire dont l emploi lors de la construction des expressions garantit celles ci une intelligibilit et des traiteme
215. dans le projet MIA extrait de SBC 02 Plus proches des possibilit s expressives et inf rentielles offertes par les ontologies sont les propositions de l quipe de l universit d Amsterdam SBC 02 SDWW01 HSWW03 que nous avons d j voqu es Dans les plate formes d annotation de documents visuels que ces travaux pr sentent il est tenu compte du contr le ditorial qui a cours dans les pratiques documentaires vis es par ces applications Les concepts de l ontologie comme dans ZBB 99 sont 4 rapprocher de frames mais cette fois ci les attributs sont eux aussi des primitives de connaissances relevant de l ontologie utilis e par le syst me et non d un sch ma g n ral de description De fait on a affaire ici A des adaptations des approches th saurales classiques dans le cadre ontologique SBC 02 introduit pour la saisie des m ta donn es documentaires sous forme de connaissances un template de description pour les objets a d crire qui ressemble fort aux notices documentaires que l on peut trouver dans les syst mes traditionnels cf figure 3 8 On cr e ainsi une interface d annotation qui concr tise en termes de concepts et de relations de l ontologie une mani re 96 8 8 Assister la formulation des descriptions d organiser les donn es saisir et qui peut assister la t che des utilisateurs Cette d marche a t souvent reprise dans MSD00 ou DDH 04 par exemple L utilisation d un
216. dans un v nement d origine sociale human_being _x attr gt sex nec val_qual gt sex_val nec attr gt age nec val_quant gt quantitative_val7nec reference_unit gt temporal_duration nec 30 years old categorised_as gt general_category old young defines_cultural_function gt medical_subfunction cultural_role gt patient defines_cultural_function gt medical_subfunction cultural_role gt physician participate_to gt social_event CODE 3 1 Extrait du mod le de connaissances du concept human_being de l ontologie MENELAS Pour MENELAS il n y a donc pas de graphe patron refl tant un besoin unifi d indexation mais une quantit importante de prescriptions de type patron chacune centr e sur un type d en tit privil gi Cela est tr s li au fait que ces ressources servent en fait 4 guider une indexation automatique qui a partir des manifestations textuelles des concepts isol s essaient de construire un r seau complexe suivant justement les patrons associ s chacun de ces concepts Une telle forme de pr conisation si elle est l gitime dans l absolu pr sente beaucoup de d savantages pour une indexation manuelle il faut en effet avoir d j choisi le concept central de la description parmi les nombreux candidats dont on peut supposer qu ils sont tous d un int r t peu pr s quivalent pour l application envisag e L
217. dant ces deux sujets Mais il s agit plus d une interpr tation fond e sur l habitude des usages que sur un engagement formel 41 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV la figure 2 3 Dans un tel r seau on constate bien que l on d finit l mission consid r e comme tant une Emission qui contient un objet rattach a la notion d Interview qui est une sorte de S quence et que l individu prof_1 de type Professeur participe cette interview S quence sorte de Professeur 4 est_un est_un est_un emission_ decrite Fic 2 3 R seau s mantique repr sentant un extrait d index contient participe prof_1 9 9 Sans contr le au niveau de la cr ation des r seaux de telles m thodes de repr sentation pr sentent cependant des limitations imm diates Il faut tre rigoureux quant la d finition et au typage des liens employ s et faire la diff rence au sein du formalisme entre les liens n cessaires l organisation rationnelle de la connaissance pouvant faire l objet de traitements sp cifiques de la part d un syst me de RC comme la relation d instanciation est_un ou la relation de sp cialisation sorte_de et les relations relevant uniquement du domaine d application consid r comme contient ou participe Il faut aussi viter la confusion entre des informations relevant d assertions accidentelles les situat
218. de et pour l instant n apparait pas parmi les fonctionnalit s couramment offertes Un formulaire ne peut tout anticiper et rester facilement utilisable Certains thesaurus proposent des m canismes permettant de pr ciser le r le dans une situa tion d crite des entit s auxquelles r f rent les descripteurs les facettes Map95 A l int rieur d un m me champ s mantique on va classer les notions la relation hi rarchique est alors de type genre esp ce suivant des cat gories de haut niveau qui indiquent implicitement des relations entre ces notions L exemple du tableau 1 6 extrait du thesaurus de PINA montre comment dans une m me branche hi rarchique les notions sp cialis es peuvent tre envisag es selon le r le qu elles joueront ici dans un sch ma actanciel g n rique des personnes participent des actions pratiqu es selon des techniques donn es dans des lieux sp cifiques etc Mais ces liens comme ceux donn s par un formulaire sont fig s et restent formul s un niveau souvent trop g n ral par rapport aux besoins applicatifs que faire si on veut expliquer dans le cadre du sch ma implicite de notre exemple qu une notion en plus de d noter une personne sera associ e au r le de patient ou d agent d une action Il faudrait introduire une autre hi rarchie correspondant ces r les en mettant l hypoth se forte et fausse qu une personne ne peut pas tre agent dans un cas
219. de cette arborescence distinction entre entit s ind pendantes les objets de plein droit du monde physique et conceptuel et celles qui ne le sont pas parties ou propri t s des pr c dentes Ces crit res sont en fait introduits pour r pondre des besoins commun ment observ s qui rejoignent en partie ceux introduits par Thomas Gruber Rec03 souhaite en particulier minimiser le caract re implicite des distinctions ontologiques la cr ation de notions se sp cialisant les unes les autres ob it des besoins de diff rentiation on retrouve la dif ferentia que nous avons voqu e en section 3 2 2 Or les diff rences consid r es rel vent la plupart du temps de consid rations qui sont non formelles et par cons quent ne peuvent se retrouver dans une ontologie encod e via une logique de description Pour limiter ce probl me inh rent l approche logique il vaut mieux se borner lors de la conception n introduire sous une notion g n rique des notions sp cifiques qui ne rel vent que d une diff rentiation unique et ais ment identifiable obtenir une hi rarchie ontologique modulaire et homog ne toutes les diff rences exprim es dans une sous branche de l arbre ontologique doivent pouvoir tre rattach es un m me type de diff rentiation structurel fonctionnel Ceci permet de faire appara tre au sein d un m me ensemble hi rarchique des notions similaires conceptuellement c
220. de des outils propos s dans le cadre de l initiative du web s mantique ce qui n est pas n gligeable vu que ce paradigme m me si ce n est pas exactement le n tre est devenu la r f rence dans notre communaut Enfin la mani re dont des ressources ontologiques d une importance significative qu il s agisse de r utilisation d adaptation ou de conception ex nihilo peuvent somme toute tre convenablement exploit es dans ce contexte technologique sp cifique constitue une preuve de la valeur des hypoth ses rete nues toutes ces ressources ayant un moment ou un autre b n fici de l application de principes repris ou nonc s dans cette th se 5 3 Discussions m thodologiques 5 3 1 Utilisation d ontologies pour indexer des vid os En ce qui concerne l utilisation des ontologies nos propositions que l on peut tr s bri ve ment regrouper en trois th mes indexer et rechercher dans des bases de connaissances faciliter l accessibilit des index aider leur cr ation par des graphes patrons sont globalement vali ri d es par nos exp rimentations Trois probl mes importants subsistent cependant sur lesquels bj l orientation de nos r flexions n a pas permis d mettre des recommandations construites Articulation entre les fonctionnalit s d un SBC et celles d un syst me documentaire Au d but de notre travail nous avons fait l hypoth se simplificatrice d ignorer la diff rence
221. de donner une liste des termes autoris s apporte un contexte d interpr tation qui facilite leur compr hension et leur manipulation Ces relations sont la relation hi rarchique qui aide structurer les champs s mantiques des notions en pr ci sant les rapports de subordination entre notions de la plus g n rique la plus sp cifique cf tableau 1 3 Elle permet par exemple de retrouver un document traitant de notions sp cifiques partir d une question portant sur une notion plus g n rale la relation d association voir aussi CF pour conf re qui met en rapport des notions de sens ou d usage voisins situ s dans des champs s mantiques diff rents Elle assouplit l organisation hi rarchique en permettant d largir les requ tes vers des sujets diff rents mais rapproch s par la pratique la relation d utilisation pr f rentielle utilis pour UP qui en plus d indiquer les termes dont les significations sont jug es quivalentes permet de distinguer les termes pr f r s de ceux dont l emploi est prohib Il existe une version non orient e de cette relation l quivalence qui se contente de signaler que les termes li s sont interchangeables Un exemple d organisation de termes dans un thesaurus est donn par l extrait du thesaurus de PINA pr sent en tableau 1 3 o l indentation d note la relation de sp cialisation entre notions Le thesaurus est donc
222. de l ontologie Qui plus est on peut extraire des relations s mantiques entre ces termes synonymie hyp ronymie m r onymie ainsi que des relations conceptuelles plus ou moins sp cifiques par rapport l application concern e localisation participation une action Ces relations permettent de placer le terme dans un contexte d usage structur on a ainsi une bauche du contexte d interpr tation dont on a vu qu il tait n cessaire pour l ontologie De fait beaucoup de travaux tels ceux de V ronique Malais VINA MZB04 se sont concentr s sur l obtention de hi rarchies de termes que l on peut utiliser comme une premi re hi rarchie de sp cialisation Cependant de m me que les termes ne sont pas des concepts les hi rarchies de termes peuvent ne pas correspondre aux hi rarchies de sp cialisation de concepts dont l interpr tation est la subsomption formelle Si l on veut obtenir une hi rarchie ontologique partir des r sul tats d extraction de connaissances partir de textes il faut valider les propositions issues de l application des heuristiques de recherche Il ne peut s agir que d un travail semi automatique impliquant un part significative de contr le de normalisation des termes et de la signification qui leur est associ e On retrouve une situation comparable dans les d marches qui essaient d initier le processus de d veloppement d ontologies l aide d
223. de la cr ation des index Bien au contraire on rajoute des sp cifications que l indexeur doit assimiler tout en ne donnant pas de consigne positive sur la structure g n rale de ce qu il doit effectivement formuler Le risque est donc grand de voir la variabilit intra ou inter indexeur atteindre un niveau lev sans consignes on peut retomber dans la situation observ e pour les syst mes documen taires utilisant la langue non contr l e Dans l absolu les SBC permettent d employer des langages riches et de produire une multitude de combinaisons Ceci peut videmment nuire la continuit s mantique et la bonne utilisation du syst me d indexation et de recherche Comment peut on tre certain que les index r pondront aux besoins de la recherche et en particulier que les va riations observ es ne perturberont pas les r sultats des processus de recherche dont nous avons vu qu en th orie ils pouvaient grandement b n ficier du recours des ressources ontologiques riches Il faut l encore que le recours un cadre complexe d indexation ne coupe pas l utilisateur du contexte traditionnel que constituent les pratiques de l application vis e par le syst me Nous allons voir comment peuvent tre mises en places des solutions m me d assister le travail des indexeurs 91 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques 3 3 1 Prescrire le contenu des index Ce dont il
224. de la repr sentation des connaissances d finition de classes instances de la primitive rdfs Class qui permettront de typer les objets d une description organisation de ces classes par des liens hi rarchiques rdfs subClassOf la s mantique 1Pour une pr sentation compl te de RDF Resource Description Framework on pourra se reporter RDF04a 20Bien que d un point de vue de la repr sentation fondamentale rien ne distingue ces d finitions correspon dant elles aussi des triplets des assertions classiques 21Dans notre terminologie il s agit donc d un m ta langage de repr sentation puisqu il d finit les primitives de connaissances qui seront utilis es ensuite pour repr senter les faits d une application donn e Ici le terme sch ma est comprendre au sens des sch mas XML ces sp cifications syntaxiques puisque XML n a pas vocation repr senter le sens des objets qu il permet de manipuler qui d finissent des r gles permettant de valider des fichiers XML 173 Chapitre 5 Exp rimentations et discussions lt xml version 1 0 encoding ISO 8859 1 gt lt rdf RDF xmlns rdf http www w3 org 1999 02 22 rdf syntax ns xmlns rdfs http www w3 org 2000 01 rdf schema xmlns av http www ina fr Audiovisual xmlns menelas http www ina fr Menelas gt lt av Program rdf about JNV_enfantsCardiaques gt lt av hasSubSequence rdf resource EC_
225. des connaissances ontologiques tr s influenc par la logique formelle c est la s mantique ensembliste extensionnelle qui s impose On va ainsi construire une ontologie compos e de primitives caract ris es par des prescriptions concernant leur rapport aux objets du monde leur r f rence On parle alors d ontologie r f rentielle Ces primitives formelles n ont pas intrins quement de sens interpr tatif elles n en acqui rent que parce qu elles sont reli es par leur libell aux notions diff rentielles Cependant ce sont des primitives et elles peuvent gr ce aux m canismes de composition de sens d une s mantique formelle servir d finir de nouveaux concepts formels Les concepts tant li s par r f rence leur extension qui est un ensemble d objets du domaine on peut avoir recours des op rations de composition ensembliste r union intersection compl mentaire On introduit ainsi les axiomes logiques qui r gissent les caract risations des individus qui constituent l extension des concepts formels Par exemple on pourra d finir un concept comme tant la disjonction de deux autres concepts ou bien la n gation d un concept Dans l ontologie du cyclisme les concepts PersonnelEpreuve PersonnelEquipe et Spectateur forment une partition disjointe du concept Personne On peut aussi exprimer des lois concernant les relations comme les pro pri t s alg briques r flexivit transitivit
226. des index pertinents dans le cadre applicatif vis Ces primitives comportent des concepts mais aussi des relations qui permettent de construire des index structur s De surcro t les notions ontologiques voient leurs significations d taill es de sorte ce qu elles puissent tre interpr t es suivant des cri t res formels stricts pr lude leur manipulation directe par un syst me base de connaissances Finalement les ontologies sont encodables dans des m ta langages de repr sentation de connais sances qui permettent de d finir des langages de repr sentation d index dont les primitives li es des connaissances de raisonnement sont accessibles par les SBC Nous avons vu tout au long du second chapitre au travers d exemples issus de nos ex p rimentations et en particulier de celles r alis es au cours du projet OPALES comment les fonctionnalit s habituellement offertes par les syst mes ontologiques r pondaient nos besoins en termes de conception de r f rentiels s mantiques formels cr ation de hi rarchies la signifi cation pr cise d finitions formelles des concepts r gles de composition relationnelles On peut d s lors envisager des proc dures de contr le des expressions construites ainsi que l utilisation de m canismes d inf rence exploitant ces significations pour compl ter les informations fournies par les index et mieux r pondre aux requ tes pos es par les utilisateurs En d autr
227. des propositions concr te en la mati re on peut se reporter BACO04b la fusion et l adaptation d ontologies ici on vise la reprise de conceptualisations sp cifi es dans des ontologies d ja existantes li es au domaine que l on veut conceptualiser Pour cela on int gre une ou plusieurs ontologies plac es ou non sur un pied d galit et en en modifiant les sp cifications au besoin Ceci n cessite tr s souvent une tape d alignement qui identifie les concepts et les relations que ces ontologies ont en commun Des exemples de propositions m thodologiques ou techniques concernant cette approche sont trouvables dans ONIONS GPS99 ou PROMPT NMO03 le d veloppement collaboratif d ontologies ces travaux cherchent davantage 4 mettre en valeur et assister la n cessaire collaboration entre les concepteurs des ontologies en mettant leur disposition des dispositifs de discussion et de gestion de versions diff rentes des ressources en cours de construction Dom98 TNL 05 Dans le cadre des travaux conduits VINA notamment dans le cadre des r flexions conduire pour OPALES notre t che nous a cependant amen consid rer la mani re de d velopper le contenu des ontologies proprement dit ind pendamment des r flexions sur des moyens auxiliaires M me si un concepteur peut avoir souvent acc s des ontologies ou d autres sources concernant des th mes proches de son activit on consid re ici qu
228. desquels travaille un grand nombre de documentalistes et pendant une assez longue dur e comme c est le cas VINA Dans de telles situations les risques de variation dans le processus et les r sultats de indexation sont lev s Tout d abord il faut observer que les langages documentaires traditionnels n ont pas vocation proposer des expressions privil gi es pas plus qu ils ne peuvent en l absence de sp cifications formelles riches contraindre l utilisation du vocabulaire au sein des expressions construites I faut donc se tourner vers l environnement du langage documentaire que ce soit le syst me lui m me ou son environnement organisationnel plus large De fait on fait souvent en la mati re confiance au savoir faire de celui qui indexe C est son ex pertise dans le domaine ainsi que sa connaissance du syst me documentaire sur le plan technique et m thodologique qui sont garantes de la formulation correcte d une bonne interpr tation Ce pourquoi on consid re qu il vaut mieux que les index soient r alis s par des sujets ayant b n fici d une formation approfondie ou qui ont disposition les ressources qui leur permettent de faire face aux interrogations qui ne manqueront pas d apparaitre pendant l indexation Il faut noter que les ressources dont il est question sont aussi bien d origine humaine connaissances des autres indexeurs exp rience acquise par le sujet indexant que ma
229. discutons de la fa on dont on peut concevoir des syst mes d indexation et de recherche base de connaissances SBC En les adaptant aux pratiques de PINA et aux besoins de projets exp rimentaux comme OPALES nous reprenons les concepts et techniques de la repr sentation des connaissances et du web s mantique Nous nous concentrons principalement sur les ontologies mod les conceptuels formalis s sur lesquels s appuient les SBC pour le contr le des descriptions et la conduite de raisonnements Nous mettons en particulier en uvre une m thode d assistance la conception des ontologies et insistons sur l int r t d utiliser des patrons de conception ontologiques Dans nos r flexions figure aussi la notion de patrons d indexation structures relationnelles refl tant les index typiques d une application donn e Les patrons d indexation facilitent la cr ation des index tout comme ils permettent de rationaliser la conception des ontologies notamment celle des connaissances de raisonnement qui sp cifient les inf rences r alis es par le SBC Nos proposi tions m thodologiques ont t appliqu es dans un certain nombre de r alisations informatiques et d exp rimentations pour des domaines r els que nous voquons et discutons tout au long de ce manuscrit Discipline Informatique Mots cl s Ontologies Indexation s mantique Indexation de documents audiovisuels Construc tion d ontologies Patrons de conception Patron
230. diting Onto logies on the Web In 11th Banff Knowledge Acquisition Workshop KAW 98 Banff Canada 1998 DSW 99 DUINEVELD A J STOTER R WEIDEN M R KENEPA B et BENJAMINS V R Wondertools A comparative study of ontological engineering tools In 12th Workshop on Knowledge Acquisition Modeling and Management KAW 99 Banff Canada 1999 ES03 ENSER P et SANDOM C Towards a Comprehensive Survey of the Semantic Gap in Visual Image Retrieval In International Conference on Image and Video Retrieval CIVR 2003 Urbana Italy 2003 FAD 00 FENSEL D ANGELE J DECKER S ERDMANN M SCHNURR H P STUDER R et WITT A Lessons Learned from Applying AI to the Web Journal of Cooperative Information Systems 9 4 2000 Fel98 FELLBAUM C diteur WordNet An Electronic Lexical Database MIT Press 1998 FFR97 FARQUHAR A FIKES R et RICE J The Ontolingua Server A Tool for Collaborative Ontology Construction International Journal of Human Computer Studies 46 6 1997 FG02 FERNANDEZ LOPEZ M et GOMEZ PEREZ A The Integration of OntoClean in We bODE In EKAW 2002 Workshop on Evaluation of Ontology based Tools EON2002 Siguenza Spain 2002 FGJ97 FERNANDEZ M GOMEZ PEREZ A et JURISTO N METHONTOLOGY From On tological Art Towards Ontological Engineering In AAAI97 Spring Symposium Series on Ontological Engineering Stanford USA 1997 210 Fil68 F r04 Fre71 FvH 01
231. donc qu il existe une signification des index qui soit intel ligible par les utilisateurs et exploitable par les machines et que la cr ation et l exploitation de ces index se font conform ment ce qui est attendu au regard de cette signification L encore le recours aux ontologies peut apporter une solution En ce qui concerne la substance des descriptions tout d abord les ontologies si elles pro posent un vocabulaire de termes que le syst me d indexation s engagerait utiliser font plus que cela puisque selon la d finition commun ment accept e elles doivent rendre compte d une conceptualisation d un domaine Cette notion reste cependant tr s floue et il faut voir ce en quoi consistent concr tement ces constructions qui permettent de sp cifier une conceptualisa tion et de faire en sorte que le SBC fonctionne conform ment un engagement ontologique Le vocabulaire de repr sentation dont nous avons besoin doit en effet s appuyer sur un effort d abstraction et d impl mentation dont l objectif est la l gitimation du fonctionnement du SBC au regard du domaine d application Si on reprend l articulation entre descriptions langage et syst me de la fin du chapitre 1 il s agit d ancrer les descripteurs du langage d indexation dans un contexte interpr tatif qui fasse en sorte que les descriptions soient exploit es par le syst me en accord avec les besoins de l application Conceptualisat
232. ds un document r pondant ses besoins Quel traitement documentaire effectuer Pour trouver des r ponses ces questions PINA emploie des chercheurs dont on esp re qu au contact des professionnels du monde documentaire ils sauront viter une formalisation purement th orique des probl mes que l on rencontre de ce monde et des solutions qu on peut leur apporter D s le d but notre recherche a donc t marqu e par un double ancrage universitaire puisque nous tions rattach au laboratoire LaLICC de l Universit Paris IV Sorbonne mais aussi industriel puisqu en tant que doctorant CIFRE Convention Industrielle pour la Formation et la Recherche en Entreprise nous tions consid r comme employ de plein droit de VINA 2 Probl matique L objet de notre recherche est l indexation Nous verrons dans le premier chapitre de ce manuscrit que cette op ration consiste interpr ter et reformuler un contenu documentaire pour le rendre accessible et exploitable par un syst me d information En fait l indexation des documents audiovisuels AV est une activit ancr e dans le quotidien de PINA Depuis la cr ation de l Institut ses documentalistes cr ent des repr sentations qui forment la base des donn es par l interm diaire de laquelle on peut acc der au contenu des collections documentaires Le contexte de cette pratique est cependant en train d voluer Tout d abord on peut observer de fa on
233. duire des informations dont la structure est d sormais conforme ce que l on attend g n ralement Activit pratiqu Sur _ ObjetSpatial faitPartieDe ObjetSpatial pratiqu Sur RE Dee SS ns te Gl Isa ObjetSpatial _ _ pratiqu K Activit Localisation Sdi e Fic 3 15 R gles de raisonnement d duisant des connaissances conformes un patron d indexa tion d une structure de connaissance diff rente Les connaissances explicit es par le raisonnement sont repr sent es en gris La r ciproque est galement possible partir des connaissances exprim es dans une structure conforme celle du patron d indexation on peut vouloir expliciter de nouvelles connaissances On pourra ainsi r pondre des questions dont l agencement des notions est diff rent de celui du patron et dont les besoins ne pourraient donc pas directement tre satisfaits par celui ci Ainsi pour continuer dans notre exemple le patron d indexation de la petite enfance associe de fa on privil gi e une action sa localisation et ne pr conise pas le rep rage des participants Pourtant de nombreuses requ tes pourraient exiger une telle information d ductible naturellement de la localisation des activit s d crites Par exemple si une action est situ e dans un lieu donn il est l gitime de consid rer que ses participants sont galement situ s dans ce lieu puisque les acti
234. e de recherche documentaire utilisant un thesaurus GS93 montrait comment l utilisation de sys t mes experts exploitant les hi rarchies diminue le travail de celui qui recherche une informa tion qui peut par cons quent concentrer son activit sur d autres points plus subtils de la recherche documentaire Le recours des syst mes ontologiques va encore plus loin puisque c est justement la prise en compte efficace des relations propres au domaine d application qui est reconnue comme un point d am lioration des syst mes de recherche documentaire existants TAJO1 VPS03 Blo04 La recherche concernant les ontologies et les SBC qu elles permettent de cr er constitue un domaine tr s actif De nombreux projets ont vu le jour notamment dans le contexte du web s mantique Pour PINA l enjeu est quelque peu diff rent s il est indispensable de ma triser les propositions techniques qui sont amen es merger de ces initiatives il faut faire en sorte de les adapter la probl matique de l indexation des documents audiovisuels et l utilisation d une telle repr sentation de leur contenu dans les syst mes de recherche documentaires Notre th se a t initi e dans cette optique et a cherch retirer des exp rimentations r alis es dans le projet OPALES ou dans les initiatives proches un cadre coh rent et pertinent de conception et d utilisation des ressources ontologiques dans les processus documentaires
235. e Logic of Concepts In BOUILLON P et Busa F diteurs The Syntax of Word Meaning Cambridge University Press 2001 QKH0O3 Quan D KARGER D R et HUYNH D F RDF Authoring Environments for End Users In International Workshop on Semantic Web Foundations and Application Technologies SWFAT 2003 Nara Japan 2003 Qui68 QUILLIAN M R Semantic Memory In Semantic Information Processing MIT Press 1968 Ran00 RANWEZ S Composition Automatique de Documents Hyperm dia Adaptatifs par tir d Ontologies et de Requ tes Intentionnelles de l Utilisateur Th se de doctorat Universit Montpellier II 2000 RBF 02 Rousset M C BIDAULT A FROIDEVAUX C GAGLIARDI H GOASDOU F REYNAUD C et SAFAR B Construction de m diateurs pour int grer des sources d information multiples et h t rog nes le projet PICSEL Revue Information In teraction Intelligence 2 1 2002 RBvt 00 RUTLEDGE L BAILEY B VAN OSSENBRUGGEN J HARDMAN L et GEURTS J Generating Presentation Constraints from Rhetorical Structure In Proceedings of the 11th ACM conference on Hypertext and Hypermedia San Antonio Texas 2000 RCA94 RASTIER F Cavazza M et ABEILLE A S mantique pour l Analyse Masson Paris 1994 RCP02 RoussEy C CALABRETTO S et PINON J M Le th saurus s mantique contribu tion l ing nierie des connaissances documentaires In Actes de la conf rence C2002 journ es francophone
236. e RDF est un langage de repr sentation d essence relationnelle les faits y sont repr sent s sous forme de triplets sujet propri t objet RDF propose un petit nombre de propri t s standards qui permettent de d finir les entit s consid r es Par exemple on pourra donner un individu un type en utilisant la propri t rdf type ou comme dans le code 5 1 une balise marqu e par le nom du type RDF en tant que langage de repr sentation de connaissances orient vers l utilisation des r seaux permet le recours toutes les fonctionnalit s offertes par la syntaxe XML XML04 sur laquelle il repose Il devient en particulier possible de faire r f rence des objets situ s dans des espaces de nommage distants ce qui permet entre autres d utiliser plusieurs ontologies ou bases de faits physiquement d connect es dans une seule description Le code 5 1 donne la repr sentation de notre index favori dans ce langage RDF par son emploi de types et de propri t s appelle videmment la cr ation des r f rentiels permettant justement d introduire de tels objets en tant que langage de description propre une pr occupation particuli re Pour cela le langage de repr sentation de sch mas RDFS pour RDF SCHEMA a t cr Nous ne rentrerons pas dans les d tails de cette norme le lecteur peut se reporter RDF04b mais on peut toutefois en signaler les fonctionnalit s principales du point de vue
237. e a t d finie doit tre propag e correctement le long de la hi rarchie de subsomption De m me dans DOE les domaines d une relation sp cialisent les domaines de la relation qu elle sp cialise Ainsi en cas d h ritage multiple les domaines de la relation fille doivent tre des sous concepts des domaines de toutes les relations parentes Il faut galement mentionner qu en mati re de coh rence des sp cifications notre diteur prend en compte les relations d inter d finition entre les entit s r f rentielles lors des modifica tions de l ontologie Ainsi il sera impossible de supprimer un concept qui est employ comme domaine d une relation De m me si une notion r f rentielle est supprim e toutes les notions que cette suppression rend orphelines sont galement retir es sauf si par exemple cela vient contredire la r gle pr cis e auparavant Articulation des tapes diff rentielle et r f rentielle La m thodologie que nous avons retenue insiste bien sur les diff rences entre les deux premi res tapes Les objets qui y sont manipul s sont de nature diff rente linguistique pour les uns logique pour les autres ce qui a des r percussions sur la mani re dont on les construit Il ne faut cependant pas oublier qu il y a des liens forts entre ontologie diff rentielle et ontologie r f rentielle les notions diff rentielles donnent une signification linguistique aux concepts r f rentiels auxqu
238. e ces trois ann es de th se nous avons donc proc d des exp rimentations qui ont beaucoup apport nos r flexions que ce soit sur le plan de la conception des ontologies ou de leur utilisation effective dans des syst mes d indexation et de recherche Cela nous a permis de tester nos hypoth ses m thodologiques et nos outils ainsi que les propositions des autres acteurs de la communaut de l ing nierie des connaissances Et m me si la conception de certaines de ces ontologies ne s inscrit pas directement dans le cadre de cas d utilisation appliqu s il demeure qu elles constituent une exp rience concr te de mod lisation Ce qui en soi se r v le positif d autant plus que pour chacune des exp rimentations except e celle du voyage nous nous sommes toujours efforc s de garder un lien relativement clair avec les usages observables dans notre domaine celui de l indexation La premi re des exp rimentations celle du cyclisme s inscrit en effet dans l optique d une assistance automatique la cr ation d index Pour cette exp rimentation qui ne demandait pas de cr ation de syst me de description et de recherche en tant que tel nous nous sommes surtout concentr sur la qualit de la conception de l ontologie en vue d une exploitation de ses notions dans des m canismes d extraction d information partir de texte con us par Estelle Le Roux La proximit de ces notions avec les l ments d
239. e concept pour les graphes conceptuels En premi re approche on peut suivre l acception simpliste qui associe le terme concept tout ce qui peut tre pens Pour une discussion beaucoup plus int ressante sur la signification de cette notion le lecteur est invit se tourner vers Bac04a pp 128 140 38 2 1 Introduction repr senter au niveau de la connaissance pour indexer des index elles explicitent leur signification pour la machine qui les traitera on parle alors de signification computationnelle Dans un syst me base de connaissances les expressions sont contr l es par le recours un langage de repr sentation Celui ci fournit le vocabulaire les primitives et la grammaire pour cr er des expressions valides ainsi que les l ments permettant de leur associer une interpr tation formelle puis op rationnelle Il faut alors construire une sp cification de ce langage qui soit correcte vis a vis de la conceptualisation Pour cela on utilise des artefacts labor s les ontologies nous en discuterons plus en d tail dans la section 2 2 2 dont l objectif est d expliciter autant que faire se peut le sens du vocabulaire propos par cette conceptualisation Adosser un langage de repr sentation de connaissances une telle ontologie on parle d enga gement ontologique GCG94 permet de donner une signification aux index qui seront construits par son moyen aussi bien pour le syst me cha
240. e conceptualisation pr sents dans ces textes tait imp rative la r alisation d un syst me performant En ce sens la conception de cette ontologie a permis une validation qualitative de l approche de conception par normalisation s mantique puis formalisation Ensuite le cadre d OPALES a permis une exp rimentation compl te de nos hypoth ses puisque le syst me d indexation et de recherche con u pour le projet avait pour ambition de permettre la cr ation et l utilisation de descriptions complexes dans des sc narios r els de re cherche d information La proximit avec les usages qu il s agisse de la reconnaissance d l ments de conceptualisation pertinents ou de la facilitation de l emploi des descripteurs dans des index exploitables utilement tait au c ur de ce projet L articulation de la normalisation s mantique avec les r sultats des outils d acquisition automatique de terminologie d velopp s par V ronique Malais la cr ation de patrons d indexation la formalisation des ontologies faisant intervenir des connaissances de raisonnement r ellement utiles et finalement le contact avec des utilisa teurs r els ont permis de valider qualitativement une grande partie de nos propositions La taille des ressources ontologiques mises en jeu fait galement de cette exp rimentation une validation quantitative appr ciable L int r t des exp riences r alis es dans le cadre de l atelier EON est moins imm d
241. e de la bande image et de la bande son qui peut suivre une approche morphologique ou esth tique la mani re de Zettl dans Zet02 et qui demande l indexeur une grande part d interpr tation Et puisque la mise en forme peut s appuyer sur la richesse structurelle qu autorise le montage audiovisuel l analyse doit aussi rendre compte de la structure du contenu documentaire en n omettant pas de s appliquer galement aux s quences des extraits d autres films par exemple que celui ci contient A PINA c est l indexation formelle qui a pour r le de pr senter l organisation la structure des documents ainsi que les dispositifs techniques utilis s la r partition du contenu entre les niveaux visuel et sonore etc Ces informations sont capitales pour cerner l int r t de l laboration de chaque document ou segment documentaire et donc pour mieux appr hender l ventail de ses utilisations pertinentes Ce sont elles qui guident la production des notices qui se situent de fait plusieurs niveaux documentaires la collection de documents fiches collection le programme notice relative une mission et quand le programme est compos et pr sente un int r t suffisant les s quences ou sous programmes qui composent ce programme Cette situation conduit Gwendal Auffret Auf00 analyser l indexation comme le r sultat de trois phases la localisation qui consiste rep rer les segments doc
242. e deux syst mes sont con ues en r f rence explicite une conceptualisation de haut niveau partag e ou s ils font r f rence des conceptualisations abstraites pour lesquelles des connaissances d alignement existent d j il devient plus facile de les comparer De fait l utilisation des connaissances de raisonnement d di es au passage entre une concep tualisation m tier et une conceptualisation de haut niveau pourrait faciliter le travail de m ca nismes d alignement automatique d ontologies th me en vogue dans le web s mantique l heure o ce manuscrit a t crit En particulier alors que la plupart des algorithmes ont pour cible la simple cr ation de liens de correspondance entre des concepts provenant d ontologies diff rentes on pourrait envisager une nouvelle g n ration d outils qui renverraient un diff rentiel de connaissances entre les structures dans lesquelles ces concepts sont habituellement employ es Ces connaissances reposant sur des r gles de raisonnement riches et pr cises car con ues manuellement lors de la construction de l ontologie pourraient tre utiles pour valuer la compatibilit entre deux concepts autant que peuvent l tre des d finitions formelles de ces concepts dans un langage comme OWL Il est cependant vident qu une telle piste de recherche reste largement prospective et qu elle n est voqu e ici que pour donner un indice de l int r t que
243. e les m thodes propos es dans les projets existants et comment ces m thodes sont mises en uvre par des outils concrets ce qui nous poussera r examiner les solutions d j pr sent es en gardant cette fois ci l esprit les trois points m tho dologiques d gag s dans l introduction de cette partie Puis nous pr senterons les solutions que nous avons avanc es ou bien reprises et appliqu es m thodiquement dans le cadre de notre travail de th se Nous nous attacherons en premier lieu aux moyens de rendre les termes de l indexation compr hensibles en voyant comment on peut les relier aux compr hensions rencontr es dans le domaine applicatif Nous montrerons ensuite qu il est possible d assister la cr ation des index eux m mes par des pr conisations d indexation Et que l on peut concevoir des connaissances 78 3 2 Aider la compr hension de la substance des descriptions de raisonnement ais ment reconnues comme pertinentes puisqu elles vont contribuer abaisser les contraintes impos es l indexeur ou au chercheur tout en laissant au syst me des capacit s int ressantes en ce qui concerne l appariement entre index et requ tes 3 2 Aider la compr hension de la substance des descriptions 3 2 1 Le n cessaire ancrage dans les compr hensions et usages du domaine Il ne faut donc pas oublier qu un syst me documentaire doit permettre au document index d tre utilis dans des pratiques pr cises
244. e les raisons de l introduction des concepts dans l ontologie ce qui est un atout en ce qui concerne leur utilisation future Et comme nous venons de le mentionner en page 84 cette sp cification employant des l ments purement langagiers est ensuite doubl e d une sp cification semi informelle qui rend compte du sens formalis des concepts et des relations en employant un langage semi informel dont la figure 3 5 donne un exemple Expbyee EP SLD an EMPLOYEE is a PERSON who WORKS ON BEHALF OF an EMPLOYER EP RL Every EMPLOYEE IS PAID BY the EMPLOYER who empbys him SA The concept EMPLOYEE is specialised in ENGINEER RESEARCHER according to the nature of work realized by the EMPLOYEE Electronic document EP SLD An ELECTRONIC DOCUMENT is a DOCUMENT which HAS A SUPPORT ekctronic EP RL Every ELECTRONIC DOCUMENT HAS FOR FORMAT a FORMAT EP LME The ELECTRONIC DOCUMENTS ane opposed to PAPER DOCUMENTS Works on behalf of is enpbyed by EP SSL WORK ON BEHALF OF inplies TO BE USED AS A RESOURCE BY DR amp RR An EMPLOYEE WORKS ON BEHALF OF an EMPLOYER Fic 3 5 D finition de concepts et de relations selon la m thode OntoSpec La compr hension de ces formulations reste videmment d licate pour un non expert mais elle l est moins que celle des axiomes formels qu elles traduisent Le probl me des propositions de l quipe du LARIA de notre point de vue r side plut t dans la gestion des informations formul es
245. e orientation bien d finie On peut m me cr er un axiome rendant compte d une certaine forme d implication entre ces deux relations de rep rage Vt l ObjetTemporel t A ObjetSpatial l avantST t l Ju ObjetTemporel u A localisationSpatiale u l avantT t u L articulation des patrons d utilisation avec les patrons de conception permet justement de mettre en lumi re et m me de prendre en compte automatiquement certaines de ces conomies 45Les noms donn s ici aux concepts et relations ne reprennent pas n cessairement ceux de nos ontologies 195 Chapitre 5 Exp rimentations et discussions cognitives sp cifiques un domaine En effet les patrons de conception sont g n riques ils ne subiront donc pas eux m mes ce type d adaptation Il peut donc tre int ressant de situer un engagement ontologique par rapport de telles r f rences Par exemple dans le domaine de l audiovisuel le patron d utilisation de notre ontologie cf figure 4 7 page 145 semble laisser de c t nombre des distinctions introduites par le patron D amp S distinctions que l on avait pourtant reprises lors d une premi re sp cialisation de ce patron de conception cf figure 4 6 page 144 En particulier les r les ne sont pas s par s des objets qui les jouent mais sont directement introduits pour classer ceux ci les valeurs des param tres attach s aux r les dans le patron de concepti
246. e peut tre davantage obscurci par le fait que certains travaux proposent de se tourner vers des syst mes qui sortent du cadre bien tudi de la logique du premier ordre MCMO03 propose par exemple de revenir vers des techniques de recherche d information traditionnelle o le calcul de Vimplication logique est remplac par des consid rations sur le poids des concepts et relations dans un index par ticulier et dans une collection d index Une telle technique pr sente l avantage d autoriser un classement des r sultats d un requ te par ordre de pertinence D autres interpr tations de l implication partagent cette pr occupation l utilisation de m canismes de calcul de degr de similarit entre repr sentations en s aidant des informations fournies dans les ontologies ou en tout cas dans les hi rarchies conceptuelles que l on y trouve est une piste que l on rencontre parfois MGLB01 AHAS03 ANNO3 Plus proche de la d duction logique traditionnelle figurent les solutions recourant la logique floue ou les l ments d un index sont associ s des niveaux de certitude TBH03 qui seront ensuite exploit s par des m canismes de d duction appropri s Ces approches sont cependant l heure actuelle adopt es par un tr s petit nombre de chercheurs ce qui ne leur garantit pas une p rennit comparable celle des solutions plus classiques qui b n ficient des efforts de communaut s plus impo
247. e qui en facilite la compr hension et la maintenance Ces crit res de conception peuvent parfois se r v ler extr mement utiles Cependant outre le fait que nous ne soyons pas enti rement d accord avec la totalit de ces principes et qu ils soient parfois flous il faut remarquer que ces propositions ne suffisent pas construire un cadre m thodologique coh rent Comme voqu dans l introduction de cette section on a affaire des bonnes pratiques utiles mais qui ne constituent pas vraiment un cadre m thodologique g n ral les l ments de ces solutions n ont parfois pas de lien clair entre eux Mais surtout ces solutions ou certains de leurs l ments ne s appliquent pas toutes les ontologies mais celles qui ont une vocation pr cise ou qui sont encod es l aide d un langage appartenant une famille donn e Rec03 ne s en cache pas qui reconna t que les m thodes qu il propose pour la mod lisation d ontologies en LD sont appliquer sur une hi rarchie qui a d j fait l objet d efforts de rationalisation tels que ceux que nous allons pr senter TEn LD ce terme d signe les concepts qui sont introduits l aide de conditions n cessaires par opposition aux concepts d finis qui sont introduits dans des conditions n cessaires et suffisantes 8Ceux de Gruber sont en effet bas s sur le fait qu une ontologie r sout d abord le probl me de la mod lisation d un domaine en s
248. e repr sentation langagi re Generated English dans le programme GALEN extrait de RZS 99 OR 400 ew AA FED OH 5 BB as lt E prot g owtciasses PI Properties Forms I gt Individuais 2 Metadata SUBCLASS RELATIONSHIP Z mh CLASS EDITOR woe TY For Project menelascorrige2 For Class Expertinterview instance of owl Class Asserted Hierarchy WS t x Ja owl Thing Name SameAs DifferentFrom U Annotations Ci 8 D Property Value Lang Expertinterview Expertinterview gt entity lecessary and Sufficient Conditions gt rdf Property interview gt Interview any object which has an at least one of the values of the plays property is of type expert role as its participant ExpertRole Asserted GAMES PI Properties Bj Gi oF EL Ej x Asserted Conditions G Ej ae X d Ol hasParticipant NECESSARY amp SUFFICIENT C Interview 3 hasParticipant 3 plays ExpertRole Gp Disjoints G ge Pag s2 x r 8 8 Logic View Properties View Fic 3 4 Visualisation d une classe d finie dans Prot g 85 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques les sp cialisations d un concept donn ceux qui ont des crit res de d finition commun Ces regroupements permettent de mieux comprendr
249. e sa d sambigu sation De fait l accent mis sur la recherche de consensus et le partage des notions lors de la cr ation d une ontologie correspond tout fait aux imp ratifs guidant la conception des vocabulaires de description l engagement ontolo gique renvoie d une certaine mani re aux choix qui taient faits lors de la d finition de langages documentaires traditionnels A ceci pr s qu on recherche pour les notions d une ontologie des 61 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV sp cifications plus compl tes que celle des descripteurs th sauriques au besoin en utilisant des d finitions labor es reposant sur des interpr tations formelles L engagement plus strict dont b n ficient les ontologies que ce soit de la part de ceux qui les congoivent ou de ceux qui les utilisent garantit une meilleure compr hension du contenu des descriptions et donc favorise la continuit s mantique Ensuite le fait que les descripteurs se voient pr sent plac s dans un cadre formel permet alors un SBC pour qui de telles sp cifications sont accessibles via leur encodage dans un m ta langage de RC muni d une s mantique formelle de jouer un r le actif en ce qui concerne le contr le de la continuit s mantique Comme on l a d j voqu pour le cas particulier des GC Les SBC peuvent en effet invoquer des m canismes de v rification automatique pour contr ler la valid
250. e thesauri Ces derniers constituent comme on l a vu une source de l gitimit par rapport au domaine et pr sentent des similarit s structurelles im portantes avec les ontologies du moins les plus simples d entre elles Nombreux sont ceux qui ont tent d adapter ces structures pour concevoir des ontologies AFS00 WSWS01 vMS 04 SLL 04 Cependant nous avons d j montr combien diff rent ontologies et thesauri notam ment du point de vue de la rigueur avec laquelle les liens entre termes sont interpr t s De fait le passage d un thesaurus semi formel une ontologie formalis e demande des efforts im portants Il faut d terminer puis appliquer des strat gies complexes pour concilier la fois les liens s mantiques naturels du thesaurus et l interpr tation formelle que l on voudrait obtenir Ta relation d hyp ronymie relie un terme sp cifique un terme qui le g n ralise Ta relation m r onymique ou m r ologique relie un terme d signant un objet un terme renvoyant une partie de cet objet M me si ces deux notions sont li es de mani re intime Les contributions de Gilles Kassel KAB 00 ou de Catherine Roussey RCP02 tout comme les travaux de recherche effectu s VINA en tiennent d ailleurs compte dans les ontologies qu ils proposent 122 4 3 Prescrire une mani re de construire les notions ontologiques pour ces m mes liens I en va de m me pour l obtention de connai
251. e une dizaine d entit s Ils ont enfin effectu quelques sessions informelles de recherche pour tester les possibilit s apport es par les capacit s de raisonnement du SBC Comme voqu dans ICGT 04 et d taill dans SCC03 ces utilisateurs ont tr s vite reconnu Vapport d une m thode de description qui met en valeur les relations entre entit s d crites Les possibilit s offertes par les inf rences s appuyant sur des sp cifications formelles ont t appr ci es comme on l a d j d montr il devient en effet possible de d coupler la forme des requ tes de celle des descriptions deux contenus similaires sur le plan du fonds pouvant pr sent tre appari s grace aux connaissances de raisonnement transf rant des informations entre individus des graphes Cependant l utilisation des ontologies a soulev de nombreux probl mes dans OPALES De fait le constat de complexit que nous avons tabli en ce qui concerne l utilisation des ontologies par des utilisateurs non experts en RC repose en grande partie sur les observations que nous y avons r alis es Premi rement la compr hension de concepts et de relations bien plus pr cis que des mots clefs est d licate ce titre les sp cifications langagi res recommand es par la m thodologie de Bruno Bachimont sont d une grande aide on fixe un contexte d interpr tation m tier qui simplifie l acc s aux notions Cependant l int r t de ces d fini
252. eb Conference ISWC 2002 Sardinia Italia 2002 BLGP03 BAYERL P S LUNGEN H Gut U et PAUL K I Methodology for Reliable Schema Development and Evaluation of Manual Annotations In Proceedings of the Second In ternational Conference on Knowledge Capture K CAP 2008 Workshop on Knowledge Markup and Semantic Annotation Semannot 2003 Sanibel Island Florida 2003 Blo04 BLOCKS D A qualitative study of thesaurus integration for end user searching Th se de doctorat Univerity of Glamorgan 2004 BLSt 00 BENSLIMANE D LECLERQ E SAVONNET M TERRASSE M N et YETONGNON K On the definition of generic multi layered ontologies for urban applications Computers Environments and Urban Systems 24 3 2000 BMPT91 BRACHMAN R J MCGUINESS D L PATEL SCHNEIDER P F RESNIK L A et BorGIDA A Living with CLASSIC When and how to use a KL ONE like lan guage In SOWA J F diteur Principles of Semantic Networks Morgan Kaufmann Publishers San Mateo California 1991 Bra79 BRACHMAN R J On the Epistemological Status of Semantic Networks In FIND LER N V diteur Associative Networks Representation and Use of Knowledge by Computers Academic Press 1979 BTW01 BoLey H TABET S et WAGNER G Design Rationale of RuleML A Markup Language for Semantic Web Rules In Proceedings of the International Semantic Web Working Symposium SWWS Stanford University California USA 2001 Car00 CARRIVE
253. eines possibilit s d une approche ontologique et en particulier de ce qu offrent les m canismes de raisonnement en termes de production et de contr le des connaissances il faut des ontologies complexes dont les concepts et les relations seront rattach s 4 des connaissances de raisonnement De telles ontologies sont lourdes concevoir l exemple de Cyc Len95 ontologie univer selle dont la mise au point s tend sur des ann es est l pour en donner une id e Si l immense majorit des ontologies d velopper n a pas pour objectif l axiomatisation compl te de toutes les cat gories abstraites qui structurent la pens e humaine il n en reste pas moins que d velopper des sp cifications formelles m me dans un domaine limit n est pas chose ais e Pour preuve le petit nombre d ontologies dont le niveau de complexit est lev TV03 qui a cherch cat goriser les ontologies d un r pertoire public utilisant un langage d di la sp cifications d ontologies en LD trouve que le plus gros contingent regroupe en fait des vocabulaires n utili sant que les axiomes de sp cialisation et introduisant tr s peu de relations de domaine De son c t HNM02 analysant un corpus d ontologies plus anciennes mais utilisant un langage plus riche r v le que seules 10 d entre elles contiennent des axiomes complexes Depuis ces derni res ann es on a pu observer un regain d int r t pour
254. el rattachement est n cessaire la rigueur de la conceptualisation veiller modulariser convenablement les ressources de mani re ne pr senter l utilisateur les notions les plus abstraites que lorsqu il en fait la demande explicite L introduction de points d entr e dans l ontologie r f rentielle tels que le concept de Protagoniste que nous avons voqu dans le cas de l ontologie de la petite enfance peut aussi constituer un moyen de r concilier pragmatisme et exigence de coh rence De tels concepts g n ralisant les notions du patron de fa on les consid rer d un point de vue plus fonctionnel Ces utilisateurs taient n anmoins experts dans les domaines retenus documentalistes du CNRS pour le point de vue de la petite enfance et professeurs du CNDP pour celui de l eau 167 Chapitre 5 Exp rimentations et discussions facilitent la navigation des utilisateurs humains dans des espaces conceptuels davantage d ter min s par la proximit d usage Ces rajouts de concepts fonctionnels sont rapprocher de ce qui a lieu pour la conception ontologique lorsqu on consid re des patrons de conception de haut niveau On avait bien dans cette situation des structures d di es un usage que l on essayait de rattacher aux concepts et relations d un domaine donn Dans un certains sens nos exp rimentations dans OPALES valident bien ce type d approche les concepts m tiers ont besoin
255. elle ci quand on acc de l ontologie lors de la cr ation des index Il est naturel d affirmer qu une telle solution sera d un int r t majeur d s que des sujets humains seront en contact avec les entit s de l ontologie Si une telle confrontation n est pas acquise en ce qui concerne l utilisateur final on peut imaginer que ces informations seront toujours utiles au concepteur des ontologies m me et peut tre surtout s il doit tre assist d outils de construction semi automatique I faut cependant mettre un b mol cette affirmation l appli cation de cette m thode tout fait apte d sambiguiser le sens des concepts dans un contexte applicatif pr cis peut se r v ler contre productive dans des cas o l on recherche justement une mod lisation tenant compte de certaines ambiguit s et de rapprochements que l on n autorise rait pas dans le genre d ontologies que nous souhaitons utiliser Par exemple WORDNET est un r pertoire terminologique qui essaie de repr senter des relations d hyperonymie de synonymie etc dans le domaine de la langue g n rale Fel98 Sa structure est donc relativement peu ri goureuse comme lont montr les travaux d Oltramari et de ses coll gues OGGM02 Pourtant cet artefact est bel et bien catalogu comme une ontologie aussi contestable puisse tre ce rattachement d un point de vue th orique et il est reconnu comme utile du fait m me du flou
256. elle de tous les pr dicats qu introduisent Guarino et ses coll gues on a O Vx Personne x Personne x o O est le quantificateur modal de la n cessit 163 Chapitre 5 Exp rimentations et discussions leur b b actions qui peuvent tre rep r es spatialement par diff rents l ments de localisation Au cours de la formalisation de l ontologie nous avons pu rajouter des notions qui en am liorent la lisibilit notamment des concepts li s 4 une fonction particuli re dans le graphe patron Ces concepts regroupent des entit s que leur d finition diff rentielle rendait incompatible par exemple le concept Protagoniste permet de donner une g n ralisation commune aux concepts de Personne et de GroupeHumain qui h ritent de notions diff rentielles en opposition et ce un niveau qui fait toujours sens du point de vue m tier Ces concepts sont int gr s de mani re natu relle dans la structure ontologique r f rentielle issue de l ontologie diff rentielle via les relations d h ritage multiple Pour que les descriptions produites puissent tre effectivement exploit es par le syst me nous avons enfin personnellement ajout aux informations classiques du support de Gc formant l ontologie computationnelle relation d h ritage domaines de relations une s rie de r gles de raisonnement relationnel Ces r gles taient en effet n cessaires l obtention d un
257. elque peu de celles dictant l laboration des langages documentaires stricto sensu qui doivent effectivement s int resser la gestion des aspects logiques de l organisation du contenu des documents De telles approches ayant fait l objet de r flexions approfondies VINA notamment dans le travail de th se de Rapha l Troncy Tro04 il ne nous appartient pas de proposer ici nos propres solutions Par rapport ce qui a t voqu la page 19 nous n abordons donc pas directement les tapes de localisation et de structuration Pourtant il appara tra au lecteur des chapitres suivants que nous ne nous refusons pas d crire certains aspects de la structuration logique du contenu nous avons d ailleurs travaill autour de certaines propositions de Tro04 Il s agit juste de reconna tre que dans notre optique la r ponse ce besoin est subordonn e sa reconnaissance dans une application pr cise M me dans le cadre audiovisuel la signification utile d un document peut dans certains cas faire abstraction de son organisation 34 1 4 Conclusion substance de la description les descriptions doivent effectivement tre cr es l aide du vocabulaire sp cialis voqu ci dessus Il faudra faire en sorte que l acc s aux notions mo bilis es dans les descriptions puisse s effectuer en ayant acc s la signification qui a t arr t e lors de la d finition de ce vocabulaire par la constructi
258. els SEEK JAVA identification et interpr tation de relations entre concepts Th se de doctorat Universit Paris IV Sorbonne 2000 LE Roux E Extraction d information dans des textes libres guid e par une ontologie Th se de doctorat Universit Paris X Nanterre 2003 LENAT D B Cyc A Large Scale Investment in Knowledge Infrastructure Com munications of the ACM 38 11 1995 LESPINASSE K Acquisition s mantique en langue g n rale l heure de v rit de la paradocumentation textuelle pour l indexation des documents audiovisuels sur la politique Th se de doctorat Universit Paris III 2002 LITTLE S et HUNTER J Rules By Example a Novel Approach to Semantic In dexing and Querying of Images In Proceedings of the Third International Semantic Web Conference ISWC2004 Hiroshima Japan 2004 LESPINASSE K HABERT B et BACHIMONT B Le p ritexte un s same pour les donn es audiovisuelles In 5 mes Journes Internationales d Analyse Statistique des Donn es Textuelles Lausanne Suisse 2000 215 Bibliographie LNO3 LIEBIG T et NOPPENS O OntoTrack Fast Browsing and Easy Editing of Large Ontologies In 2nd International Workshop on Evaluation of Ontology based Tools EON2003 at ISWC2008 Sanibel Island Florida 2003 LWVJ04 LANDAIS R WOLF C VINET L et JOLION J M Utilisation de connaissances a priori pour le param trage d un algorithme de d tection de textes dans les docu
259. els ils sont directement associ s La cons quence directe est d ailleurs la reprise dans l ontologie r f rentielle de la hi rarchie de subsomption tablie dans l ontologie diff rentielle Une question s est alors pos e l diteur doit il pr senter ces deux tapes de front ou l une apr s l autre 133 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique D apr s notre exp rience il semble pr f rable de construire l ontologie r f rentielle au fur et mesure de l laboration de la taxinomie diff rentielle En effet les notions qui y sont pr sentes ont pour but de pr ciser le sens des entit s r f rentielles correspondantes Mais ces entit s doivent pouvoir servir l introduction d autres entit s concepts ou relations d s qu elles sont d finies Attendre que toute la taxinomie diff rentielle soit enti rement termin e pour introduire des concepts r f rentiels qui auraient pu l tre bien plus t t peut se r v ler pr judiciable la s r nit suppos e du concepteur d ontologies Par exemple le concept Grimpeur_Rouleur de la page 126 devrait pouvoir tre d fini d s que les concept Grimpeur et Grimpeur sont introduits via l ontologie diff rentielle L diteur permet donc de mener ces deux tapes simultan ment en passant tout moment d une ontologie en construction l autre Il faut alors souligner les probl mes de coh rence que cela induit
260. embles de m ta donn es relativement stables et adapt s la saisie par formulaires Le contenu audiovisuel on l a vu est en particulier propice une profusion de liens entre ses l ments qui prohibe toute approche trop rigide de ce point de vue Si on peut faciliter la t che des utilisateurs en ordonnant les propri t s des objets qu ils sont cens s d crire cette assistance ne doit pas nuire l obtention des fonctionnalit s en particulier F1 n cessaires une indexation correcte Comme voqu dans BLGP03 on a souvent le r flexe de simplifier abusivement l indexation pour diminuer les probl mes de variabilit des descriptions et am liorer les performances des syst mes d information Cela peut tre dangereux les seules contraintes devant effectivement s appliquer aux index construits sont celles li es aux concepts et relations de l ontologie et non celles d rivant de l emploi d interfaces donn es Une fois assur le contr le des index par le SBC au niveau m me de la connaissance il n est en principe pas utile de rajouter une interface de contr le ditorial strict Une pr conisation souple de la structure des descriptions semble beaucoup plus indiqu e surtout dans le cas de l indexation des documents audiovisuels 3 3 2 Patrons d indexation Des structures pour initier l indexation Afin d assister l indexation s mantique il faut donc proposer une structure qui ait une valeur pres
261. emise gt lt premise gt lt subject var yyy gt lt predicate uri amp av represents gt lt object var zzz gt lt premise gt lt consequent gt lt subject var xxx gt lt predicate uri amp av represents gt lt object var zzz gt lt consequent gt lt rule gt CODE 5 5 D claration de la composition des propri t s hasSubsequence et represents dans Sesame travaux du web s mantique 5 2 4 Exp rimentation EON L exp rimentation suivante pr sent e dans l article ITM03 a eu lieu dans le cadre de l va luation des diteurs d ontologies men e pour l dition 2003 de l atelier Evaluation of Ontology Tools Cette ann e l l enjeu tait de tester la capacit des diteurs con us par la communaut de l ing nierie ontologique en ce qui concerne l change d ontologies Il s agissait plus pr cis ment de voir comment ces diteurs pouvaient changer les conceptualisations qu ils avaient permis de repr senter Pour cela l unique moyen est d exporter et d importer ces sp cifications au moyen des langages standards de repr sentation d ontologies La question qui se pose est alors de savoir comment les informations qui permettent de sp cifier les ontologies dans un diteur peuvent tre encod es dans ces langages et import es par les autres environnements de conception Ces informations sont videmment diff rentes d un diteur l autre puisque ceux ci ont
262. employons pour les d signer le vocable de patron de conception ontologiques pist miques Rei99 ainsi propose une s rie de patrons en vue de la repr sentation et de la gestion d ontologies terminologiques afin d am liorer la r utilisabilit d ontologies m dicales qui doivent permettre la conception de d finitions ou d expressions terminologiques complexes Pour cela des patrons sont propos s qui fournissent par exemple les outils n cessaires la composition de cha nes d expression tenant jour leur contexte en l occurrence une information repr senter une expression qui se d compose en expressions concr tes maintient un lien vers ce contexte tout en permettant d acc der son successeur dans la liste des autres expressions qui peuvent exprimer le contexte Le contexte virus infectant une bact rie peut ainsi tre d sign par les expressions phage puis bact riophage Comme nous l avons fait remarquer on a plus faire ici des structures facilitant la mod lisation on est encore un niveau relativement informel de l ontologie en vue d une application donn e que d agencements des l ments sp cifiques du contenu de celle ci C est une vision similaire quoique plus tourn e vers la formalisation qui guide les travaux cherchant d terminer des patrons pour la conception des axiomes ontologiques SEM01 pro pose par exemple des patrons s mantiques pour repr senter
263. en appliquant notre d marche des notions que nous n avions pas d j utilis es les pr c dentes exp rimentations n avaient en effet repris de cette ontologie que son haut niveau sans se pr occuper de ses notions plus sp cialis es 13Un extrait de la hi rarchie de ces programmes est repr sent dans la figure 2 7 de la page 56 169 Chapitre 5 Exp rimentations et discussions Se pose ensuite la question du traitement effectu sur ces ontologies avant de proc der l indexation Faut il comme dans OPALES cr er un r f rentiel conceptuel unifi permettant de rendre compte de mani re compl te mais rigide d un point de vue descriptif De fait plut t que de fusionner cf page 114 les deux ontologies utilis es ici nous avons choisi de les garder dis tinctes et introduit quelques quivalences de classes quand cela tait n cessaire Par exemple on peut avec les langages du web s mantique que nous avons utilis s on verra le d tail par la suite affirmer que av person et menelas human_being sont des concepts quivalents en tout cas du point de vue extensionnel les ensembles d individus qu ils d notent sont gaux Ceci permet d articuler l ontologie de l audiovisuel et l ontologie th matique sans que les conceptualisations respectives dont celles ci rel vent soient rendues plus confuses par une trop grande proximit Il est int ressant de noter que cette possibilit de faire r f
264. en effet n cessaire au consensus recherch et donc autorise une plus grande r utilisabilit Ces objectifs g n raux sont de fait relativement proches de ce que l on recherche en repr sentation de connaissances ontologiques des sp cifications de conceptualisation partag es et r utilisables mais aussi exploitables dans des syst mes concrets Inspir s par ces similarit s des chercheurs ont donc propos d adapter ces concepts de g nie logiciel l ing nierie ontologique Director Director Builder BuildPart for all objects in structure ConcreteBuilder Product builder gt BuildPart ja 0 BuildPart GetResult i Fic 4 3 Structure du patron Constructeur employ dans Dev99 Les premi res contributions reconnaissant la pertinence du contenu de patrons de conception logiciels particuliers ont directement essay de les utiliser comme mat riau pour leurs ontologies Dev99 GFP02 Par exemple Dev99 utilise un patron Constructeur qui permet de repr senter un processus de construction logicielle de mani re distincte de cette construction elle m me dans le cadre de g n ration d explications de ce processus Ce patron voir figure 4 3 introduit les classes de directeur la classe qui lance la construction constructeur une interface g n rique auquel acc de le directeur constructeur concret celui qui prend effectivement en charge la construction et produit Ces classes ainsi
265. en langues naturelle Il n y a en effet pas de guide tr s pr cis pour la cr ation des axes et l expression des diff rences cela tient en grande partie au flou qui demeure quant la mani re dont on peut rendre compte de l intension des concepts Si on doit utiliser la langue il serait bienvenu de restreindre la mani re dont on l emploie de recourir une th orie interpr tative pr cise donnant aux d finitions obtenues une signification pr visible La possibilit de d finir autant d axes de sp cialisation de concept que souhait est galement troublante s il existe plusieurs axes peut tre pouvait on introduire auparavant introduire un axe permettant de r pertorier rationnellement ces diff rents points de vue de d finition Les propositions de ces travaux de recherche vont n anmoins clairement dans le bon sens si on suit cette approche l utilisateur peut disposer d une explicitation lisible de la signification des entit s de l ontologie Mais il semble que la clart de engagement ontologique doit r sulter d une plus grande rigueur au niveau non formel comme on va le voir pr sent 3 2 2 Des notions ontologiques normalis es D s qu il s agit de rendre accessible le sens des notions de l ontologie on a pu observer que l utilisation de la langue naturelle tait ce vers quoi l on tendait tiquetage des concepts par des signifiants langagiers est une pratique largement r pandue et l
266. en mesure de faciliter la compr hension des termes dans le contexte de l application puisqu il utilise un vocabulaire adapt tout en organisant ce vocabulaire en un r seau pouvant guider l interpr tation de mani re convenable Par exemple dans l extrait du tableau 1 3 le terme technique audiovisuelle est pr cis par les termes qui le sp cialisent il s agit de proc d s qui sont employ s lors de la production et la transmission de l image et du son acc l r effets sp ciaux mixage y figurent mais pas pour l encodage physique du document sur un support audiovisuel particulier on ne trouve pas 16mm ou compression MPEG Au cas o il resterait des ambiguit s un thesaurus peut associer ses termes des notes d application NA qui clarifient l emploi d un descripteur image sonore est ainsi pr cis par Son caract ristique fort pouvoir vocateur v nement lieu p riode etc Int r ts et limites des thesaurus pour les syst mes documentaires Les relations entre termes peuvent aussi contribuer au bon fonctionnement du syst me d une certaine mani re le thesaurus permet au syst me de mieux interpr ter lui aussi les notions et de les manipuler d une mani re qui soit pertinente pour l application vis e Concr tement le syst me peut aider l appariement entre requ tes et index par le biais de reformulations en utilisant les 117 est noter que le thesaurus de PINA est un
267. ence Ontologies vs Applications Ontologies 26th German Conference on Artificial Intelligence KI 2003 Hamburg Germany 2003 MGLBO1 MONTES Y GOMEZ M GELBUKH A LOPEZ LOPEZ A et BAEZA YATES R Flexible Comparison of Conceptual Graphs In 12th International Conference on Da tabase and Expert Systems Applications DEXA 2001 Munich Germany 2001 MGOS04 MrkA P GANGEMI A OBERLE D et SABOU M Foundations for Service On tologies Aligning OWL S to DOLCE In Proceedings of the Thirteenth International World Wide Web Conference WWW2004 New York 2004 ACM Press Min81 Minsky M A Framework for Representing Knowledge In HAUGELAND J diteur Mind Design MIT Press 1981 Mou99 Movis A M L indexation de la collection Cin astes de notre temps In L indexation l re d Internet Colloque d ISKO France Lyon France 1999 MPEG 701 MPEG 7 Information Technology Multimedia Content Interface Rapport tech nique 15938 ISO IEC 2001 MSD00 Motta E SHUM S B et DOMINGUE J Ontology driven document enrichment principles tools and applications International Journal of Human Computer Studies 52 6 2000 216 MSSSO00 A MAEDCHE H P SCHNURR S STAAB et R STUDER Representation Language MZB04 NB96 New8 2 INFM00 NMO1 N03 NNK03 Neutral Modeling of Ontologies In Proceedings of the German Workshop Modellie rung Koblenz Germany
268. ent des t moignages pr cieux sur les v nements les personnages les pr occupations qui ont t la raison de leur cr ation et de leur diffusion Ainsi PINA s est vu reconna tre tout fait officiellement une mission importante la conservation des archives audiovisuelles produites et diffus es dans le cadre national Il exerce galement une seconde activit plus commerciale la revente d extraits de documents audiovisuels aux professionnels de la production Ces deux occupations ne ciblent pas les m mes fonds documentaires et ont impliqu la cr ation de deux directions op rationnelles distinctes le plus ancien est le D partement des Archives DDA cr partir du fonds d archives de l Office de Radiodiffusion et T l vision Fran aise ORTF dont la disparition en 1974 constitue galement l acte fondateur de VINA Ce d partement a pour mission la conserva tion et la valorisation commerciale d un ensemble de documents qu il met la disposition des journalistes r alisateurs documentaristes qui peuvent ainsi se servir d extraits choisis pour illustrer les documents qu ils produisent l Inath que de France a t quant elle cr e en 1995 Elle r sulte de la volont des pouvoirs publics d organiser un D p t L gal de la radio et de la t l vision ind pendamment de toute pr occupation commerciale La mission de l Inath que est de capter l ensemble de la production audiovisuel
269. ent donc des versions am lior es de ces langages dites combinatoires Dans ces langages l unit retenue est la notion elle m me exprim e l aide de termes issus du vocabulaire des utilisateurs L id e est de faciliter la combinaison de ces notions pour former des sujets adapt s ce que l on a besoin d exprimer que ce soit pour l indexation ou la recherche A la diff rence de l approche pr c dente le sujet n est plus con u de mani re statique et l attention se concentre sur les composants th matiques les notions qui permettent de le construire 10TINA par exemple propose une liste des r les que peuvent tenir les personnes impliqu es dans la conception d un document audiovisuel r alisateur pr sentateur producteur etc 24 1 3 Le contr le du support de indexation Le thesaurus instrument de contr le du vocabulaire par excellence L exemple le plus abouti de ces langages est le thesaurus La norme ISO 5694 1 d finit cet objet comme un vocabulaire d un langage d indexation contr l organis formellement de fa on ex pliciter les relations a priori entre les notions par exemple les relations g n rique sp cifique Les relations que l on trouve dans un thesaurus pour organiser les termes ont comme objectif de lever les ambigu t s du langage lors de la formulation de l index ou de la requ tes Elles d finissent en effet un r seau s mantique qui outre le fait
270. ention d un niveau lev de continuit s mantique Mais aux difficult s de la cr ation de l utilisation et de l acc s aux index ontologiques vient s ajouter celles de la conception des ressources partir desquelles sont construits ces index Les ontologies sont des artefacts dont le d veloppement est d licat les connaissances encoder sont complexes surtout dans l optique que nous avons retenue qui rend n cessaire des sp cifications riches Qui plus est il faut garantir leur pertinence vis vis des applications pour lesquelles sont con us les SBC qui emploient ces ontologies Nous avons vu au cours du chapitre 4 que loin de ne constituer qu une source de complexit suppl mentaire la consid ration des probl mes m tiers d s la conception permet de rationaliser ce processus et d assister le concepteur dans la d termination d un contenu ontologique pertinent pour l application Et que ceci se fait d une mani re avantageusement compl mentaire des autres propositions m thodologiques du domaine de l ing nierie ontologique qui se concentrent sur le cycle de vie g n ral de l ontologie sur l obtention de proto ontologies pour lesquelles un important travail de conceptualisation reste faire ou bien encore sur la validation formelle d ontologies ayant d j b n fici d un engagement significatif de la part de leur concepteur Tout d abord la m thodologie de Bruno Bachimont va bien au del
271. entre ce que nous avons d sign comme des syst mes documentaires savoir des syst mes dont la fonction est la recherche des documents eux m mes et les syst mes de recherche d information qui doivent renvoyer l aide des connaissances contenues dans une base des r ponses factuelles aux requ tes des utilisateurs Du point de vue des sp cifications d un SBC et en particulier des connaissances ontologiques d finir et des inf rences conduire cela ne semble pas faire de diff rence au premier abord Et pourtant la situation se complexifie tr s vite dans le cadre de syst mes comme OPALES qui ont se pr occuper du traitement des donn es assertionnelles les index par des m canismes de raisonne ment de la gestion des liens entre les index et les l ments documentaires eux m mes ainsi que de l exploitation des r sultats que les moteurs d inf rence permettent d obtenir partir de ces index Par exemple partir des deux indexations vocation purement p dagogique pr sent es en figure 5 11 on peut consid rer trois cas de figure recherche documentaire classique Dans ce paradigme l accent est mis sur la recherche de segments documentaires des documents dans leur int gralit ou bien leurs parties dont le contenu est pertinent par rapport au besoin informationnel de l utilisateur besoin dont la requ te est lexpression Ici chaque index est consid r comme une
272. er beer ARGSTR ARG1 x liquid FORMAL X QUALIA 2 TELIC drink e y x Fic 5 13 La structure de qualia du nom commun lt beer extrait de Pus01 Il serait donc possible de trouver des s mantiques linguistiques alternatives la s mantique interpr tative de Fran ois Rastier la condition de pouvoir conserver la facult qu a cette th orie de pouvoir justement fournir des m canismes qui s adaptent 4 des contextes interpr tatifs pr cis Le fait que toutes ces d finitions soient formalis es et complexes est une raison suppl mentaire de tester leur r utilisabilit A un niveau g n rique nous tenons peut tre l des structures dont on pourrait faire d river des patrons de conceptions ontologiques Au sens o dans notre optique plus pragmatique le biais applicatif peut l emporter sur la cr ation d un syst me coh rent permettant de rendre compte d un nombre maximal des ph nom nes observables 194 5 3 Discussions m thodologiques Les patrons dans la conception des ontologies des l gitimations naturelles pour les patrons Jusqu pr sent les patrons d indexa tion dont nous avons parl ont t obtenus par acquisition manuelle des sch mas de connaissances structurants du domaine applicatif consid r Le probl me est que si on r utilise des patrons de conception qui l gitiment nos efforts d un point de vue th orique on n a pas cr le lien direct a
273. erie ontologique et patrons d indexation principes propices consensus et d une reconnaissance m tier gt apport e par une prise en charge correcte des structures de description typiques La notion de patron de conception import e depuis la communaut du g nie logiciel est en effet une id e de plus en plus populaire dans la communaut de l ing nierie ontologique Cette notion a cependant t adapt e de diff rentes mani res Apr s avoir bri vement abord quelques points de vue constradictoires sur le sujet nous d taillerons la proposition d Aldo Gangemi et de ses coll gues celle ci introduit dans le cadre d ontologies de haut niveau des patrons de conception qui sont sp cialis s en vue d applications concr tes Nous montrerons que cette approche pr sente cependant des imperfections que nous tenterons de corriger par une prise en compte mieux appropri e des patrons d indexation 4 4 1 Ing nierie ontologique et patrons de conception Les Design Patterns GHJV95 du g nie logiciel ont pour ambition de pr senter des solutions attest es des probl mes de conception logicielle courants dans le domaine de la programmation orient e objet Servant de guides pratiques pour les d veloppeurs ils d crivent des conceptions logicielles consensuelles un niveau plus abstrait que celui des classes et des instances normale ment utilis es dans les syst mes impl ment s Un tel effort d abstraction est
274. es d monstrateurs souvent jug es trop faibles De plus il s agit d un formalisme insuffisant d un point de vue pist mologique s il permet l encodage formel de nombreuses conceptualisations il ne propose pas de cadre qui pr conise telle ou telle organisation a priori pour celles ci De fait il y a souvent une distance trop grande entre la connaissance ressource structur e et structurante relevant d un domaine d application et les interpr tations ensemblistes sur lesquelles repose le langage logique C est pourquoi des approches ont t propos es qui s loignant plus ou moins de ce m ca nisme de repr sentation purement formelle ont propos de remettre la notion certes floue de connaissance au c ur de l activit de conception des syst mes d information Si l on veut que de tels syst mes fonctionnent de fa on effective il faut qu ils puissent rendre compte d un engage ment plus complet par rapport l organisation des donn es qu ils manipulent et de la mani re dont ces connaissances informatis es sont rattach es aux connaissances effectives du domaine d application consid r Certaines d marches s appuient sur des bases non logiques C est le cas des frames propos es par Minsky Min81 Cette approche met en avant l importance au niveau psychologique de structures r currentes complexes et pr conise la mod lisation de ces structures les frames comme l objectif principa
275. es des d partements op rationnels de PINA mais aussi les compte rendus des ses sions de recherche effectu es par les documentalistes dans ces bases Nous avons donc pu appuyer nos r flexions sur une analyse des usages dans la documentation ainsi que sur un aper u global des volutions en cours et des pistes de recherche pour le plus long terme Cette impr gnation de notre recherche par la probl matique documentaire au sens large a t extr mement utile dans la mesure o le r sultat de notre travail a la pr tention d tre utilis dans un cadre appliqu 3 2 Retour sur ce qui a t fait dans la th se et plan du manuscrit Ces diff rents niveaux de r flexion et d exp rimentation ont permis de consolider les proposi tions que contiennent ce manuscrit Le plan de celui ci essaie de les organiser en une progression logique du probl me g n ral pos par les pratiques existantes aux solutions pr cises que nous pr sentons pour r soudre des points particuliers de ce probl me Tout d abord notre th se apporte une r flexion sur les usages actuels en mati res d indexation et de recherche et met le doigt sur leurs limites les plus flagrantes vis vis de la probl matique que nous avons d gag e Le chapitre 1 insiste en particulier sur la d finition et les enjeux de l indexation et la mani re dont on y r pond le plus souvent dans le monde documentaire Il abordera en particulier la notion de langage de description c
276. es m ta propri t s formelles ne vient pas remettre en cause ce choix puisqu on se place dans un monde applicatif plus restreint que celui retenu par Welty et Guarino dans WG01 le temps d un Tour de France la couverture spatiale d un Pays ne change pas on peut donc consid rer que ce concept est rigide m me s il est instanci par un lieu Le fait que ce lien pourrait tre remis en question dans des applications plus g n riques n est pas pertinent pour notre cadre applicatif limit Comme on peut le d duire en observant le tableau 5 1 il n y a alors aucune contre indication ce que les trois concepts d 0bjetG ographique d Objet G ographiqueAdministratif et de Pays soient sur une m me ligne de sp cialisation ObjetG ographique rigidit R identit I condition n cessaire h rit e d 0bjetConcret deux objets g ogra phiques sont identiques s ils ont la m me localisation spatio temporelle unit U unit topologique toutes les ventuelles parties de l objet g ogra phique sont localis es dans la zone spatio temporelle qu il couvre d pendance D on ne peut pas dire a priori que tous les objets g ographiques d pendent d objets instanciant un concept particulier ObjetG ographiqueAdministratif rigidit R identit O deux objets correspondant la zone d un m me exercice adminis tratif sont identiques unit U h rit e d 0bje
277. es syst mes documentaires est de rendre possible un acc s raisonn au contenu des documents ad quat aux applications envisag es Ceci est encore plus important dans le cas de l audiovisuel forme qui ne prescrit pas naturellement d interpr tation qui permet trait de manipuler ais ment ce contenu on doit alors imp rativement effectuer une indexation Au cours de ce processus une des nombreuses significations possibles du document audiovisuel celle qui est pertinente par rapport l application envisag e sera explicit e puis reformul e de sorte tre exploitable dans le cadre d une application particuli re Traditionnellement les syst mes d indexation utilisent la forme textuelle qui a l avantage sur l audiovisuel de s inscrire dans un syst me fonctionnel d assignation de sens Cependant nous avons rappel qu une exploitation correcte ne peut tre assur e que si une r elle continuit s mantique s applique l ensemble de la cha ne de description et de recherche Dans le cas pr cis de l index il faut que la forme documentaire retenue soit m me de garantir une compr hension pr cise et univoque dans un syst me documentaire il faut obtenir des descriptions dont l interpr tation est contr l e Le premier des moyens est de contr ler l acc s aux descriptions A VINA quand on le peut on fait en sorte que les documentalistes puissent assister ou effectuer eux m mes les recherches parmi les des
278. es termes un syst me qui fasse b n ficier d une meilleure continuit s mantique d un bout l autre de la cha ne documentaire Le probl me est que de telles solutions ne sont pas ais es mettre en place Le cadre dans lequel nous nous sommes situ s est celui d une indexation manuelle o l interpr tation de l indexeur joue un r le crucial Et l utilisation pour une telle indexation de primitives la signification formelle complexifie les index alors que ceux ci m me dans un contexte plus naturel sont d licats concevoir et comprendre Nous avons donc mis en place des proc d s facilitant les rapports de l utilisateur avec les deux aspects fondamentaux des index savoir leur substance le vocabulaire qu ils emploient et leur forme leur structure relationnelle Pour la premi re nous avons repris la m thode propos e par Bruno Bachimont qui rattache les primitives du langage d indexation des signifi s m tier formul s de fa on rationnelle l aide de la langue en exprimant les similarit s et les diff rences entre notions l aide de principes diff rentiels on leur donne une signification naturelle mais pr cise Pour la seconde nous avons d taill la mani re d utiliser des patrons d indexation qui refl tent les besoins de l application en mati re de contenu des index comme des formulaires peuvent le faire dans les syst mes classiques Ces graphes sont des struct
279. esp r le On peut galement pr ciser pour un r le le domaine domain et le co domaine range On trouvera par exemple dans une T box les axiomes de la figure 2 10 qui indiquent que les concepts Interview et Professeur sont respectivement des sp cialisations on utilise le constructeur C qui d note l inclusion ensembliste de Sequence et Personne et que le r le aPourInvite est subsum par aPourParticipant Le r le aPourParticipant lui relie des s quences ou des programmes des personnes Des connaissances semblables seront incluses pour caract riser les diff rents r les que peut jouer une personne On notera d ailleurs 59 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV que l association de joue ses domaines est ici indispensable pour lever l ambiguit s mantique qui r sulte du choix d une tiquette langagi re hautement polys mique Ces sp cifications comme dans le cas des GC et de la logique du premier ordre qui les sous tend sont interpr t es de mani re ensembliste les concepts d notent des ensembles auxquels appartiennent les l ments les instanciant Mais les logiques de desciption ont vocation exprimer des d finitions employant d autres constructeurs que les GC On peut vouloir dire par exemple que plusieurs concepts r alisent une partition d un autre toute instance de ce dernier est obli gatoirement instance d un des premier
280. essentiellement interpr tative d analyse et de reformulation qui de mande beaucoup de soin et de savoir faire Et que la recherche dans une base d index doit tenir compte de toutes les impr cisions qui pourraient appara tre dans ceux ci En particulier nombre d informations sont n cessairement laiss es implicites par l indexeur qui fait confiance aux connaissances que le recherchiste dans le contexte bien pr cis qui encadre chaque pratique d indexation est suppos partager avec lui Le probl me est donc qu une certaine continuit s mantique doit tre conserv e des pratiques et compr hensions des indexeurs celles des utili sateurs qui acc dent au r sultat de leur activit L tat de l art recommande pour contr ler la validit de cette continuit s mantique le recours des langages documentaires Ces langages permettent de contr ler les expressions qui servent d index mais aussi de fournir des r f rentiels qui guident l interpr tation du vocabulaire qu ils fournissent Les thesauri sont les plus labor s de ces r f rentiels documentaires qui pr sentent des termes norm s dans un contexte structur par des liens de sp cialisation s mantique Cepen dant ces thesauri ne suffisent pas garantir un niveau d efficacit satisfaisant en ce qui concerne la prise en charge de la continuit s mantique par le syst me lui m me Les points d am lioration on l a vu concernent l exp
281. essions en langue g n rale la polys mie verbale par exemple et non pour rendre compte de conceptualisations extr mement marqu es par leur contexte d application qui n cessitent un effort d une autre nature bien moins r aliste De plus il n est pas dit qu une telle th orie s mantique r ponde nos imp ratifs en mati re d accessibilit Comme on l a vu le travail d adaptation des ressources conceptuelles complexes des cas applicatifs simples peut se r v ler d licat et des utilisateurs non experts pourraient ne pas tre capables d en saisir les subtilit s De fait nous ne fermons videmment pas la porte Vemploi de ces solutions pour un cadre ontologique appliqu Mais une telle piste demande plus de r flexions que ce que nous avons pu lui consacrer pendant cette th se CIFRE qui devait se concentrer sur des probl mes plus imm diats Il en va de m me pour d autres th ories s mantiques comme celle de James Pustejovsky Pus01 Celui ci propose en en effet une d composition des significations lexicales en qualia cf figure 5 13 qui repr sentent les attributs fondamentaux des l ments d finis Mais l encore comme l article que nous venons de citer le pr sente d ailleurs fort bien ces travaux ciblent prioritairement la conception de ressources g n rales Leur adaptation des cas particulier et ses cons quences sur le statut des d finitions apport es reste encore tudi
282. et la recherche proposent tout de m me des ressources ontologiques pouvant convenir au cas des documents audiovisuels dont on peut s inspirer pour la cr ation de r f rentiels exclusivement d di s la mod lisation des documents AV comme celui pr sent dans la section 5 2 3 de ce manuscrit Il existe donc une grande vari t d initiatives de recherche cherchant utiliser les ontologies dans un cadre documentaire De fait la multiplication de ces projets a conduit fixer des paradigmes et des m thodes b n ficiant d un int r t qui d passe et de loin le cadre de laboratoires isol s L initiative du web s mantique en particulier a f d r une communaut de vues et de moyens tout fait propice la maturation acc l r e des techniques propos es N anmoins l indexation audiovisuelle dans le cadre d un domaine interpr tatif donn n est pas le contexte applicatif affich par le plus grand nombre loin s en faut Et toutes les approches voqu es ne s attachent pas explicitement sur les objectifs que nous avons isol s dans le chapitre 1 Il est donc pertinent pour PINA de poursuivre un effort de recherche allant dans cette direction On peut d ailleurs noter que ces conditions valables au moment o le projet OPALES a t lanc le sont encore au moment de la r daction de ce m moire Peu d tudes ont cherch la fois prendre en compte explicitement les usages de l indexation audiovisuel
283. etBiologique Q attributionRigide ObjetGeographique attributionRigideCoureur ObjetManufacture Q attributionRigideEquipe Collection sponsor Propriete attributionRigideEpreuve Lieu attributionRigideVille LieuSpatial attributionRigideRang LieuTemporel participant Fic 5 1 Concepts et Relations de haut niveau de l ontologie du cyclisme extrait de TI02 L ontologie a fait ensuite l objet d une formalisation et d une op rationnalisation Nous ne 159 Chapitre 5 Exp rimentations et discussions nous attarderons pas sur les r percussions de ces deux derni res sur le contenu ontologique puisque les pratiques cibl es ne n cessitaient pas l introduction de connaissances de raisonne ment complexes En particulier SEIGO ne demandait qu un r pertoire arborescent de concepts avec les relations qui pouvaient tenir entre ceux ci Cette derni re condition a tout de m me fait que certaines d finitions ont t consid r es Par exemple il pouvait tre utile pour l extrac tion d information de savoir qu une Equipe a n cessairement un leader D s que l analyseur lexico syntaxique reconna t une occurrence d une quipe il peut d clencher les patrons d ana lyse dont l objectif est de reconna tre un coureur li cette quipe le co domaine de la rela tion aCommeLeader est CoureurCycliste et cr er
284. eur apparaissant dans la description parce que visibles dans le document Ensuite nous pouvons trouver un ensemble important de propri t s qui refl tent diverses pr occupations ou modalit s de la production filmage comme pour mouvement de cam ra montage ou post production comme pour insertion de texte et la diffusion date de diffusion p riodicit public vis Le fait que la conception de l ontologie ait r pondu des crit res m thodologiques pr cis permet de l tendre assez facilement pour l adapter aux besoins applicatifs venir Et si pour les besoins d OPALES nous en avions int gr une premi re version dans celle d un de nos points de vue lors de cette exp rimentation nous avons r alis l op ration inverse en ajoutant des relations basiques qui d notent des jugements interpr tatifs concernant la mani re dont le contenu th matique est pr sent par ces documents clarifie exemplifie d montre Finalement nous proposons des relations conceptuelles liant les objets AV des th mes externes ce qui permet la description du contenu proprement dit Pour cette description du contenu th matique nous nous sommes rapidement tourn vers l ontologie MENELAS qui d crit le domaine des pathologies coronariennes ZC94 et contient une importante quantit de concepts li s la chirurgie cardiaque Ceci nous permettait de r utiliser une ontologie d j accessible celle de MENELAS tout
285. f rences Nous montrons ici comment une partie du patron D amp S43 pr sentant comment un objet physique peut participer un objet temporel en jouant un r le dans une s quence d v nements qui inclut cette activit Dans le domaine le patron noyau concernerait donc des personnes qui jouent des r les particuliers li es la petite enfance dans des actions pr cises que l on regroupe du point de vue de pratiques unificatrices Une telle complexit est bien entendue exclue du patron d indexation couramment utilis o les notions plus sp cialis es ne sont pas organis es de la m me fa on les pratiques existent mais ne sont 2Dans le cas des graphes conceptuels on se retrouve un niveau de granularit descriptive comparable celui qui est demand pour la r alisation des graphes canoniques cf page 57 d un domaine 43 Celui ci peut encore une fois tre utilis dans un de nos domaines d application Il faut reconna tre que l usage qu il vise la description est videmment proche de nos activit s d indexation 148 4 4 Ing nierie ontologique et patrons d indexation pas au c ur des indexations les plus courantes et les r les les plus typiques comme M re directement incorpor s aux types d individus qui les jouent Articuler patrons applicatifs et patrons noyaux par des connaissances de raisonne ment Si on veut pouvoir b n ficier des avantages de chacune des mod lisations propos es
286. f the First European Semantic Web Symposium ESWS 2004 Heraklion Greece 2004 HSWW03 HOLLINK L SCHREIBER G WIELEMAKER J et WIELINGA B Semantic An Hun03 notation of Image Collections In Workshop on Knowledge Markup and Semantic Annotation KCAP 03 Sanibel Island Florida USA 2003 HUNTER J Enhancing the Semantic Interoperability of Multimedia through a Core Ontology IEEE Transactions on Circuits and Systems for Video Technology Special 213 Bibliographie TBLO5 ICG 04 Isa01 IT O4 ITO5a ITO5b ITM03 JBV98 Jou93 Issue on Conceptual and Dynamical Aspects of Multimedia Content Description 13 1 2003 ISAAC A BACHIMONT B et LAUBLET P Indexation de documents audiovisuels ontologies patrons de conception et d utilisation In 16i mes Journ es Francophones d Ing nierie des Connaissances IC 2005 Nice France 2005 ISAAC A COUROUNET P GENEST D MALAIS V NANARD J et NANARD M Un syst me d annotation multiforme et communautaire de documents audio visuels Opales In Journ e sur les Mod les Documentaires de l Audiovisuel Se maine du document num rique SDN 2004 La Rochelle France June 22 2004 http archivesic ccsd cnrs fr sic_00001268 html ISAAC A Vers la mise en uvre informatique d une m thode de conception d on tologies M moire de D E A Laboratoire LaLICC Universit Paris IV Sorbonne 2001 ISAAC A et T
287. faces de visualisation des assertions et des documents qui y sont li s que sur la mise en place de v ritables m thodes d assistance l utilisateur Parmi les approches propos es pour guider le processus d indexation le formulaire est celle qui appara t le plus souvent sous des formes et avec des emplois divers On retrouve donc des solutions proches de ce qui a t propos dans le cadre des syst mes classiques d s qu il s agit de g rer des index dont la structure est complexe solutions que nous avions d j voqu es au chapitre 1 Ainsi dans le SBC CONCERTO de ZBB 99 Zar00 le r pertoire des l ments ontologiques contient outre les concepts employ s pour cr er les annotations des templates d inspiration lin guistique Ces sch mas de description sont associ s divers v nements qu ils d crivent l aide d attributs sp cifiques proches des cas s mantiques Fil68 On aura par exemple un template permettant de caract riser une situation tre pr sent quelque part par la mention d un sujet obligatoire d un objet facultatif Celui ci sera sp cialis pour d crire une situa tion plus pr cise tre pr sent avec quelqu un dont les attributs et leurs modalit s pourront tre diff rents et qui pourra nouveau tre d riv en un template sp cifique une application donn e Chaque template fournit la liste des l ments qui sont n cessaires sa cara
288. faciliter d ventuels changes entre syst mes partageant des l ments 153 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique de conceptualisation fondamentaux communs Qui plus est les principes que nous recommandons sont de nature prescriptive plut t que de proposer des indications abstraites o l utilisateur reste seul face la sp cification du contenu ontologique et la fa on d en organiser les l ments on indique des mani res d exploiter des infor mations concr tes et accessibles expressions en langue patrons de conception disponibles dans des biblioth ques d ontologies fondamentales Ces principes viennent donc compl ter utilement les autres d marches d ing nierie ontologique attach es soit l organisation g n rale du cycle de d veloppement soit la validation de son r sultat selon des crit res au champ d application extr mement pr cis Les solutions m thodologiques de conception que nous avons avanc es dans ce chapitre lont t en complet accord avec les pr conisations d utilisation des ontologies d gag es en mati re d indexation dans le chapitre 3 De fait l ensemble de nos propositions forme pr sent un cadre m thodologique coh rent et pertinent au regard des trois points que nous avions d gag s en introduction de cette partie La conception du vocabulaire ontologique est en effet correctement guid e pour faciliter la compr hension de descr
289. ficace de ces ressources dans les processus d indexation et de re cherche On retrouve au cours de nos discussions des crit res employ s traditionnellement pour d finir ou valuer une ontologie pertinence consensus partage interop rabilit etc Mais la mise en pratique de ces notions abstraites est videmment indissociable d une r flexion compl te sur l utilisation de ces ontologies dans un contexte concret et partant sur la mani re d acqu rir un niveau de pertinence satisfaisant par rapport aux pratiques observables Le d roulement de notre th se a donc fait que nous nous sommes int ress une probl matique plus large que la simple capture de contraintes interpr tationnelles du fait de l ancrage de nos travaux dans des projets concrets d utilisation d ontologies ce dernier aspect a pris une part plus importante au fur et mesure de nos r flexions Finalement on peut constater que ce que cette th se apporte c est un ensemble de points m thodologiques qui permettent de situer correctement les activit s de conception d ontologies mais qui concernent galement leur utilisation pour la cr ation de bases de connaissances qui puissent tre correctement interpr t es par les utilisateurs humains et par les syst mes formels eux m mes Plus important est le fait que ces points ne constituent pas des id es ind pendantes mais un cadre qui l on s est efforc de donner une r elle coh rence La concept
290. fication explicite A VINA il s agit plus pr cis ment de r duire la polys mie de ces l ments en repla ant le document dans son contexte de production puis selon l optique retenue de d gager le potentiel de r utilisation des l ments qui le composent ou de pr ciser leur int r t en tant qu items du fonds patrimonial que constitue le D p t L gal de la radio et de la t l vision On doit alors faire en sorte que cette interpr tation soit correctement instrument e Il va s agir d ins rer ce processus dans un cadre m thodologique et technique coh rent et efficace assurant la pertinence du syst me documentaire Le premier des probl mes est celui de l encodage de l interpr tation il faut en conserver une trace pour raccourcir les recherches venir et faciliter l exploitation de leur r sultat dans la cha ne documentaire Nous avons observ que la nature m me du document audiovisuel et plus pr cis ment le fait que sa signification ne r l ve d aucun syst me symbolique clairement d fini constitue un obstacle son exploitation On va voir que tout l enjeu est d obtenir une repr sentation interm diaire satisfaisante du contenu du document audiovisuel ce qu on appellera un index Cette repr sentation qui doit tre de nature symbolique afin de pallier l ind termination s mantique du document audiovisuel et de pouvoir tre manipul e correctement dans un syst me documentaire informatis ou non
291. finies clairement lors de la cr ation du langage d indexation des m canismes d assistance automatique plus efficaces s appuyant par exemple sur des raisonnements conduits par le syst me lui m me sont envisageables Lorsqu on observe des exemples de reformulations de requ tes documentaires tel que celui du tableau 1 2 on voit que le paradigme de description que nous recherchons doit permettre la manipulation de symboles munis du statut de v ritables connaissances Dans la s rie de re formulations qui est pr sent e on se repose sur le fait que les diff rents types de supermarch s constituent des notions qui sont proches et que si on substitue l une l autre on modifie assez peu l interpr tation de la description Ou encore qu il est utile d exploiter pour une recherche documentaire la connaissance selon laquelle une entit un magasin est li e une autre une ville Il faut donc chercher reproduire les proc d s d association qui sont utilis s afin de reformuler les requ tes et qui reposent sur les connaissances qu ont les op rateurs humains du domaine d application du syst me documentaire Au del du r le de clarification terminologique classique des langages documentaires les structures pr sent es doivent tre suffisamment pr cises pour pouvoir tre exploit es par des syst mes de raisonnements formels capables d assister les documentalistes ou utilisateurs non sp cialistes de la recherc
292. finis ind pendamment de leur encodage dans un programme On esp re ainsi en rapprochant les entit s repr sent es et les traitements effectu s par le syst me de la compr hension que peut avoir un agent expert du domaine vis am liorer le processus de conception et d utilisation des outils informatiques Comment de tels m canismes peuvent ils tre mis en uvre Dans le monde lt r el nous avons des cas correspondant aux situations diverses rencontr es dans une application cas qui sont d crits l aide de la langue naturelle qui permet d en stabiliser une repr sentation intelli gible Par exemple nous pouvons d crire une s quence d entretien avec un m decin comme tant l interview d un expert si les notions d interview et d expert sont celles qui nous int ressent en priorit Dans un syst me documentaire on a vu qu il fallait plus de rigueur dans l expression des index Il faut r aliser un effort d abstraction pour isoler dans un cas les l ments pertinents et la mani re dont ils sont organis s leur configuration Concevoir une telle abstraction pr suppose une repr sentation th orique du domaine que l on ne peut qu approcher et cela au prix d un effort cons quent d acquisition des connaissances relatives l application Il faut en particulier isoler et organiser les concepts qui permettent d organiser les connais sances rencontr es dans le domaine Un tel travail de conceptualis
293. gies dans le processus d indexation 1 La description des documents audiovisuels dans les processus documen taires 1 1 1 2 1 3 1 4 11 Introduction ELLE DER Pee OS oS BE a ohn e Mee iG E 11 1 1 1 Le statut documentaire du document audiovisuel 11 1 1 2 La probl matique de la description du contenu 12 Le probl me de l acc s l information pour les documents audiovisuels 13 1 2 1 La n cessaire interpr tation des documents audiovisuels 13 1 2 2 La description linguistique comme substitut documentaire 15 1 2 3 Am liorer la qualit de l indexation dans son contexte de production t d Usage ape w 4 ite denses MR ee Se QU Det de CU ee ete 21 Le contr le du support de l indexation 22 1 3 1 Index recherche et variabilit textuelle 22 1 3 2 Contr ler le vocabulaire des index 24 1 3 3 Structurer les index 28 Concl sio mtean A AS ANS A A PU ANR AM ARE A ok ns es 33 Hi Table des mati res 2 Ontologies et SBC pour la description conceptuelle de documents AV 37 2 1 Introduction repr senter au niveau de la connaissance pour indexer 37 2 2 IC et expressivit descriptive 40 2 2 1 IA et langages structur s 40 2 2 2 Vocabulaire de repr sentation et ontologies 46 2 3 Ontologies
294. gique globale qui puisse les articuler de mani re convenable Dans cette perspective nous nous sommes donc d abord tourn vers les m thodes g n riques de d veloppement d ontologies qui visent rationnaliser le cours de la construction d ontologies formalis es de sorte ce que les concepteurs voient leur t che assist e par sa d composition en 114 4 2 Des propositions pour rationaliser la conception des ontologies plusieurs sous objectifs plus ais ment atteignables 4 2 1 Des m thodologies pour organiser le cyle de d veloppement des onto logies De nombreuses propositions de gestion g n rale du cycle de vie d une ontologie ont donc pour but d autoriser la cr ation de sp cifications formalis es pertinentes le plus facilement possible Ces propositions sont souvent inspir es des solutions courantes de g nie logiciel qui s attachent la cr ation de programmes a partir de sp cifications des fonctionnalit s plus ou moins abstraites que les concepteurs de ces programmes doivent mettre en ceuvre Ou bien encore elles prennent pour mod les des m thodologies de conception de SBC g n riques telles COMMONKADS SAAT99 qu elles s efforcent d adapter au cas sp cifique des syst mes ontologiques Parmi les propositions les plus marquantes on peut noter celles d Uschold et Gr ninger celles de l quipe du LAI de Madrid ainsi que celle du projet ON TO KNOWLEDGE Nous devons noter que parmi
295. gorithmen Graphentheorie SonwareEngineering SQM SSSs sess eesesses 3 3 E Ont Designer 1 0 LEE Ar cl of ViE ok Part ni t P rj Part O FIG 3 2 Diff rentes visualisations hi rarchiques d ontologies OilEd BHGS01 WebOnto Dom98 Delogviz HS03b OntoEdit SEA 02 WebODE Arp00 83 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques de sp cialisation ce que Guarino dans Gua98b appelle la surcharge de cette relation On pourra par exemple trouver l affirmation selon laquelle un objet physique est une quantit de mati re alors qu en fait cet objet est compos de cette quantit Pour r utiliser un thesaurus dans un cadre d indexation ontologique on est donc oblig de faire un travail de re formalisation et de nettoyage selon des crit res comme par exemple ceux de Guarino que nous pr senterons dans le chapitre 4 Les exemples de AFS00 WSWS01 vMS 04 sont l pour montrer que cela est une op ration difficile qui demande beaucoup d ef forts Et finalement la hi rarchie obtenue peut tre diff rente de celle du thesaurus initial Ces diverses approches ne garantissent pas coup s r l acc s une signification non formelle ad quate pour les descripteurs employ s dans le SBC Les seules significations accessibles de fa on certaine sont celles issues des sp cifications formelles On peut toujours essayer de les rendre plus accessibles par l emploi
296. he documentaire dans leur travail Pour l instant il est encore bien s r d raisonnable d esp rer un syst me g n rique capable d exploiter une base documentaire de mani re aussi fine qu un humain Mais on peut tout fait envisager la sp cification d outils d assistance en fonction des besoins d une pratique ou d un domaine particulier afin de leur faire effectuer quelques raisonnement basiques au moment m me 190n peut remarquer que cette variabilit rev t deux aspects tout aussi probl matiques une variabilit inter indexeur deux indexeurs diff rents peuvent d livrer des formulations diff rentes pour des contenus identiques une variabilit intra indexeur un m me indexeur deux moments peut conduire des strat gies d interpr tation ou de formulation diff rentes 39 Chapitre 1 La description des documents audiovisuels dans les processus documentaires o l accroissement des volumes de donn es rend l application manuelle de ces raisonnements plus difficile D un point de vue architectural une telle volution doit tre correctement r percut e dans les trois composants logiques que l on peut isoler dans un syst me de description documentaire C1 Langage de description On doit pouvoir sp cifier pour les descriptions un voca bulaire de concepts et de relations qui d finit ses composantes l aide de connaissances exploitables en vue d une application donn
297. iat Cepen dant si l ontologie n est pas de taille impressionnante et n a pas t r ellement utilis e elle a constitu un terrain d exercice dont l apport est non n gligeable pour le d veloppement de notre savoir faire en mati re de conceptualisation Qui plus est elle a autoris via la comparaison du r sultat d une conception guid e par les propositions de Bruno Bachimont avec celui d autres m thodes de conception une certaine forme de validation qualitative Elle aura galement permis de pr ciser le rapport de notre outil de construction d ontologies avec les autres solutions pr sentes dans la communaut puis de tester la viabilit de notre positionnement Et le r sultat de 185 Chapitre 5 Exp rimentations et discussions ce test fut positif puisque finalement nous avons prouv la faisabilit du seul mode d interaction qui nous int ressait vraiment 4 savoir l export de nos ontologies vers d autres environnements de conception Finalement l exp rimentation r alis e dans le domaine m dical en collaboration avec Ra pha l Troncy aura t utile selon bien des angles Tout d abord il faut noter qu elle s efforce de reprendre son compte les pr occupations qui ont t d gag es d OPALES et de l tude des usages documentaires de VINA ce qui en fait un cas d utilisation r aliste Ensuite elle a permis de tester la validit de nos hypoth ses en les appliquant l ai
298. ication envisag e certaines comme les points de vue retenus pour OPALES peuvent tr s bien ne comporter qu un patron D autres comme c est le cas dans le projet MENELAS ZC94 proposent une multitude de struc tures assimilables des patrons dans la mesure o nombre des concepts de l ontologie parmi les plus importants pour le domaine abord celui des pathologies coronariennes et des op rations chirurgicales aff rentes sont accompagn s d un graphe conceptuel introduit comme mod le de connaissances du concept Celui ci outre des informations que l on peut interpr ter comme d fi nitoires comporte des l ments qui sont plus de nature prescriptive et ins rent le concept dans un r seau relationnel complexe Par exemple le concept d tre humain cf code 3 1 est associ un graphe qui num re certaines des caract ristiques essentielles d une personne comme le fait d avoir un ge qui est caract ris par une quantit attach e une unit temporelle mais aussi certains attributs optionnels Ainsi l ge pourra tre associ une interpr tation qualitative ou 105i on utilise le vocabulaire des graphes il s agit des n uds qui sont rattach s directement celui de la notion consid r e 101 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques bien la personne pourra jouer un r le propre au domaine comme patient ou m decin ou tre impliqu e activement
299. ie doit donc remplir deux r les compl mentaires l un est d apporter des signifi cations compr hensibles pour des humains l autre de fournir une sp cification exploitable par les ordinateurs la seconde devant tre conforme ce qui est affirm dans les premi res C est cette dualit multipliant les champs d application possibles des ontologies qui a particip leur succ s 53 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV Une ontologie consiste tout d abord en la donn e d un vocabulaire conceptuel Elle devra par cons quent comprendre un ensemble de concepts tiquet s par des symboles qui peuvent tre des mots de la langue ou des symboles totalement arbitraires Quelques ontologies ont pu se conten ter de l nonc de tels symboles en leur adjoignant quelquefois des d finitions informelles En tiquetant les primitives par des termes en faisant r f rence la langue naturelle et au vocabu laire qu elle utilise dans le domaine d application on esp re ainsi transposer une interpr tation linguistique dans le contexte du SBC N anmoins notre tude des syst mes documentaires a montr que ce genre de solution est imparfait surtout dans un cadre d indexation exigeant Non seulement il faut se tourner vers des paradigmes de repr sentation riches mais il faut prescrire pour le vocabulaire employ une signification pr cise prescription qui est en mesure d assu
300. if Pour b n ficier via le patron noyau de la l gitimit apport e par le patron de conception de haut niveau il faut faire en sorte que le patron applicatif soit rattach par sp cialisation logique au dit patron noyau qu il en d rive logiquement comme le patron noyau d rive du patron de conception cf figure 4 8 Mais cela ne doit absolument pas remettre en cause les structures et les notions du patron applicatif garantes de la pertinence de l ensemble du processus par rapport l utilisation finale de l ontologie Sp cialisation des notions Le patron d utilisation applicatif doit sp cialiser le patron d utilisation noyau cela est n ces saire tant pour clarifier l engagement ontologique qui caract rise le PUA que pour b n ficier des connaissances formelles apport es par le patron de conception On sait quel est le niveau du patron d utilisation applicatif ce qui est valable pour le patron d indexation qui est un cas particulier de patron applicatif est g n ralisable Au chapitre 3 en effet on a vu que les patrons d indexation taient donn s au niveau structurant pour l application Cela reste videmment valable pour des cas qui ne rel veraient pas forc ment de l indexation une application va toujours avec des notions qui structurent de mani re privil gi e la conception que l on peut s en faire et les pratiques que l on y rencontre On y trouvera donc des notions conceptuelles ou relation
301. ignificative Lors de cette exp rimentation nous nous sommes int ress 4 la fagon dont DOE pouvait changer des donn es avec les environnements Prot g 2000 version 1 8 OilEd version 3 5 et OntoEdit version 2 6 libre comptant parmi les plus importants du domaine En ce qui 311 est noter que l expressivit de DOE nous a permis de repr senter une relation ternaire isDistantFrom qui tait utile pour exprimer de mani re quantitative la distance entre deux entit s spatiales comme un a roport et un h tel 2Cette exp rimentation ayant eu lieu au d but de notre th se ces outils ont consid rablement volu entre temps Nous rappelons qu une br ve pr sentation de cet outil est pr sente dans ce manuscrit dans la section 4 3 2 page 128 183 Chapitre 5 Exp rimentations et discussions concerne le moyen d changer des ressources ontologiques avec ces environnements notre choix a t d tudier les possibilit s offertes par les exports et imports RDFS puis OWL Ces standards taient effectivement pris en compte par la majorit des environnements de conception retenus et par DOE lui m me RDFS comme langage d change En ce qui concerne l export des informations de DOE vers les autres environnements nos essais ont t plut t concluants Si RDFS ne permet videmment pas d encoder de mani re explicite les principes diff rentiels il est possible de les exporter au tomatiquement dan
302. igning Upper Level Lexical Re sources In Proceedings of the First International Conference on Language Resources and Evaluation Granada Spain 1998 GUARINO N et WELTY C A formal ontology of properties In DIENG R et CORBY O diteurs Knowledge Engineering and Knowledge Management Methods Models and Tools 12th International Conference EKAW2000 Springer Verlag 2000 GWo0b G Wo1 GW02 Gza00 HHO1 HMO3 HNM02 Hor98 HP04 GUARINO N et WELTY C Identity unity and individuality towards a formal toolkit for ontological analysis In Werner H diteur Proceedings of ECAI 2000 the European Conference on Artificial Intelligence Berlin Germany 2000 IOS Press GUARINO N et WELTY C Identity and subsumption In GREEN R BEAN C A et HYON MYAENG S diteurs The Semantics of Relationships An Interdisciplinary Perspective Kluwer 2001 GUARINO N et WELTY C Evaluating Ontological Decisions with OntoClean Com munications of the ACM 2 45 2002 GZARA L Les patterns pour les syst mes d information produit Th se de doctorat Institut National Polytechnique de Grenoble 2000 HEFLIN J et HENDLER J A Portrait of the Semantic Web in Action IEEE Intelligent Systems 16 2 2001 HAARSLEV V et M LLER R Racer A Core Inference Engine for the Semantic Web In 2nd International Workshop on Evaluation of Ontology based Tools EON2003 at ISWC2008 Sanibel Isla
303. il ne les r utilise pas directement comme mat riau de son travail Cette hypoth se tr s artificielle y compris pour OPALES puisque V ronique Malais doctorante CIFRE VINA a conduit un travail tr s important d extraction de concepts et de relations partir de textes li s aux applications est utilis e pour se concentrer sur ce qui est cens tre le c ur de toute activit de mod lisation de connaissances ontologiques comment l on fixe une conceptualisation appropri e une application et comment on la traduit en un artefact op rationnel Il y a dans ce domaine une grande quantit de recommandations quant au contenu formel de l ontologie Depuis BMP 91 jusqu RDH 04 les diff rents langages de repr sentation d ontologies ont fait l objet de r flexions sur leur usage sur la mani re de cr er les meilleures ontologies au moyen des primitives qu ils offrent Mais ces tudes sont trop pr s des langages impl ment s eux m mes pour justifier l ontologie du point de vue d une application pr cise et de ses utilisateurs ce qui comme on l a vu est l objectif de toute conception d ontologie MSDOO0 On a besoin de s abstraire d un niveau somme toute proche du niveau symbolique et d aller plus vers les connaissances exprim es dans les domaines De fait ces deux facettes du d velop pement des ontologies sont videmment compl mentaires et il va falloir proposer une r flexion m thodolo
304. ilisant ces ontologies avec celles des syst mes exploitant les objets a priori proches que sont les thesauri Et nous illustrerons notre propos d exemples tir s en particulier d OPALES qui utilise le formalisme de repr sentation et de raisonnement des graphes conceptuels Nous survolerons ensuite la mise en uvre de ces principes dans des syst mes exp rimentaux depuis les pr curseurs en mati re d annotation s mantique ceux qui se concentrent sur le document audiovisuel Nous verrons alors quels sont les obstacles lever si on veut passer du stade de solutions de recherche pure complexes mettre en uvre celui de syst mes prenant mieux en compte les besoins rencontr s dans les usages r els 2 2 IC et expressivit descriptive 2 2 1 IA et langages structur s La repr sentation des connaissances et des raisonnements humains depuis les travaux fon dateurs inspir s par les math matiques comme pour Fre71 la s miotique notamment par les travaux de Peirce ou la psychologie cognitive Qui68 s oriente vers la cr ation de formalismes de repr sentation labor s En n allant pas tout de m me jusqu a la complexit offerte par la langue les tenants de la repr sentation de faits et de concepts 4 un niveau formel proposent des paradigmes expressifs riches o les entit s abstraites de l observation du monde sont li es les unes aux autres ces liens pouvant tr s souvent tre consid r s comme de
305. ilisation des connaissances jamais atteint auparavant 201 existe en effet de nombreuses propositions d outils permettant d extraire les concepts et les relations partir de textes issus du domaine vis par l ontologie ou pour cr er de nouvelles ontologies partir d ontologies d j existantes Pour un aper u de ces plate formes on se reportera respectivement BACO04b et Kno04 128 4 3 Prescrire une mani re de construire les notions ontologiques Mais de nouvelles plate formes sont apparues mettant plus l accent sur la sp cification des ontologies via des interfaces graphiques adapt es en minimisant la partie exprim e en langage formel comme on l a voqu dans la section 3 2 Il faut videmment citer Prot g NFMO0 d velopp par le smi de Stanford Prot g est construit autour d un mod le de connaissances inspir par le paradigme des frames classes slots attributs et facets contraintes sur les attributs sont les primitives de mod lisation propos es Ce mod le autorise une libert de conception importante puisque le contenu des formulaires de sp cification des classes peut tre modifi suivant les besoins via un syst me de m ta classes qui constituent des sortes de lt patrons pour les classes du mod le du domaine L interface tr s compl te illustr e dans la figure 3 4 de la page 85 ainsi que l architecture logicielle ouverte permettant l insertion de pluggins
306. imple compos d un nombre restreint de concepts cf figure 3 13 Repr sent Est Repr sent Par ObjetAV Repr sentant contientAV oF eh SDS Interpr tation lieninterpr tatif TraitSaillant Repr sentation Comme P P Fic 3 13 Le patron d indexation du point de vue applicatif eau et audiovisuel Ces concepts sont n anmoins li s par des relations qui en plus de structurer l index de fa on complexe introduisent une certaine forme de r cursivit Les objets audiovisuels images s quences introduits peuvent en effet faire l objet d une d composition tout comme les l ments qui ont t retenus comme int ressants du point de vue de l analyse de l image les traits saillants peuvent leur tour tre caract ris s par certains sous l ments tout aussi int res sants mais d un grain plus fin Enfin les interpr tations induites par l emploi de ces l ments peuvent elles m me tre ins r es dans un r seau qui les situe les unes par rapport aux autres re lation d opposition de clarification A l arriv e les indexeurs se sont tonn s de la complexit que leurs index atteignaient alors qu ils n avaient pas l impression de s tre cart s du sch ma qui leur tait propos La figure 3 14 donne un exemple caract ristique de la complexit que l on peut ainsi atteindre par l application d une quantit relativement limit e
307. implicit qui ne pourra tre encore une fois d termin qu au cas par cas en fonction du contexte applicatif de l indexation et notamment des besoins en termes de richesse des notions et des situations d crire Un d compte des ressources que nous avons collect es au cours de notre travail fait tat de cent cinquante de ces grilles de la Coupe de France de basket aux accidents de centrales nucl aires en passant par la vente du muguet le 1 mai Mais ce chiffre est inf rieur la r alit puisque nous n avons eu acc s qu une partie de ces grilles et que d autre part ce processus de collection s inscrit dans le cadre d un effort de capitalisation des connaissances des documentalistes qui est assez r cent et toujours en cours 102 8 8 Assister la formulation des descriptions Se pose ensuite la question de la sp cificit des notions mobilis es dans un patron plus concr tement quel niveau se place t on dans la hi rarchie des concepts ou des relations d une ontologie La encore il n y a pas de r ponse g n rale la typicit par rapport l application voqu e dans notre d finition restant tr s subjective Mais on peut donner quelques r flexions r sultant de nos observations Tout d abord il vident que les patrons ne sont pas donn s au niveau le plus haut qui soit disponible dans l ontologie et qui valide les contraintes qui y sont sp cifi es Dans une ontologie compl te
308. incipe de diff rence avec le p re DWP appara t souvent comme la somme de la sp cification de l axe commun aux fr res sws et de celle de la diff rence avec les fr res DWS En effet on se donne d abord le moyen de cr er une diff rence que l on concr tise ensuite pour achever la d finition du concept Ainsi pour les actions dont nous venons de parler la diff rence avec le concept englobant d Action provient bien du fait que l on s est concentr sur l axe de la motivation et que l on ait effectivement situ chacune des sp cialisation sur cet axe via les valeurs sp cifiques motiv e socialement et motiv e par une cause personnelle L diteur propose donc de construire lui m me la diff rence avec le p re DWP en concat nant simplement les nonc s des principes DWS et SWS Mais ici il ne doit pas y avoir de contrainte d finitive l utilisateur a tout loisir de changer ce qui ne reste qu une simple suggestion de l outil Enfin il faut signaler que les principes sont souvent consid r s par l utilisateur dans le m me ordre savoir SWP SWS DWS et DWP On commence effectivement par pr ciser que la notion dit e est bien subsum e par une autre On affirme ensuite ce qui fonde son originalit choisir le fils plut t que le p re c est insister sur une caract ristique donn e SWS et en indiquer une actuellement donner la possibilit de mettre en correspondance des termes et
309. indexation qui autorise les utilisateurs employer certaines formes d conomie conceptuelle pertinentes pour l applica tion il ne faut pas que cela se passe au d triment de la coh rence des sp cifications formelles pr cises que l on attribuerait aux notions introduites dans l ontologie On ne doit pas perdre de vue que les ontologies ont vocation tablir une certaine forme de consensus aussi n cessaire leur partage au sein d une communaut que leur pertinence par rapport un syst me donn Au cours de ce chapitre nous allons donc discuter de principes de conception qui ont pour objectif d obtenir des ressources ontologiques concepts relations sp cifications formelles de raisonnement patrons d indexation qui soient tout la fois compl tes on veut cr er des sp cifications formelles pr cises qui autorisent les raisonne ment riches requis par l application 3Dans la cadre du web s mantique notamment l introduction de m ta langages de repr sentation complexes comme OWL a accompagn la reconnaissance du besoin des raisonnements dans les applications qui d passent le statut de jouets Et l on peut noter une mont e en puissance des efforts de recherche visant la mod lisation de connaissances de raisonnement toujours plus complexes HPB 04 et la r utilisation d approches et d outils relevant d une longue tradition de raisonnement logique en intelligence artificielle
310. induisent d j un niveau de complexit important Appliqu es sur des bases de connaissances importantes en conjonction avec des connaissances d alignement avec les structures et notions de haut niveau elles pourraient tout bonnement rendre le syst me non op rationnel 47Voir par exemple la campagne d valuation d alignements ontologiques sur le site http oaei inrialpes fr ou bien V atelier Integrating Ontologies de la conf rence K CAP 2005 48Dans cette approche il s agit d introduire des repr sentations interm diaires entre l utilisateur et la connais sance exprim e formellement ce qui rapproche ces travaux de ce que nous avons propos En particulier par rapport ce que les outils standard du web s mantique peuvent proposer 197 Chapitre 5 Exp rimentations et discussions Si nous m mes consid rons que les patrons et leur articulation avec des connaissances plus abstraites font bien partie de la sp cification d une conceptualisation situ e nous ne devons ce pendant pas n gliger ce probl me de l op rationnalisation des connaissances de raisonnement A un travail qui a valid une hypoth se relative l utilisation des ontologies les patrons d in dexation puis d taill des l ments de conception et d exploitation de ces connaissances le couplage entre patron de conception et d utilisation il conviendrait d ajouter des tests op ra tionnels plus grande chel
311. ine pr cis L implication entre index et requ te n a donc pas tre prouv e ex nihilo partir des seuls axiomes de la logique un processus de d monstration pourra utiliser des connaissances du domaine En des termes logiques un index pourra r pondre une requ te si on parvient d montrer que l implication entre la repr sentation logique de l index et celle de la requ te est valide pour toutes les interpr tations logiques satisfaisant les lois du domaine d application On doit avoir T i q o T est un ensemble de formules une th orie logique traduisant lesdites lois du domaine C est justement cette th orie que les ontologies sont amen es contenir Elles ont en effet parmi leurs buts celui de contr ler les utilisations qui sont faites du vocabulaire qu elles intro duisent utilisation dont font videmment partie les traitements de recherche Elles sont ce titre charg es d apporter des sp cifications du vocabulaire de description m me de garantir un ni veau satisfaisant de coh rence interpr tative Si on consid re que cette coh rence doit concerner le fonctionnement du SBC on doit donc s int resser une interpr tation op rationnelle On a d j voqu que des sp cifications formelles taient n cessaires une interpr tation correcte de la part d un syst me informatique base de connaissances On l a vu dans les exemples pr sent s l im portance du paradigme log
312. insi si nous avons d fini avec soin les domaines et co domaines des relations notre ontologie du voyage ne comporte pas de connaissances de raisonnement formelles comme c tait le cas de certaines des ontologies r alis es pour EON 2002 Ultime cons quence du fait que cette ontologie ne soit qu un exercice de mod lisation certes riche en enseignements voir le contenu de la section suivante elle ne pr sente pas de patron explicite qui mobiliserait ses entit s en vue de la cr ation d assertions privil gi es dans un cadre applicatif pr cis Interop rabilit de DOE avec les autres diteurs d ontologies Depuis le d but de nos travaux relatifs la mise en uvre des principes m thodologiques repris dans cette th se nous n avons pas plac notre outil de conception d ontologies en concur rence avec les principaux environnements de d veloppement propos s dans la communaut de l ing nierie des connaissances Il se concentre en effet sur la normalisation s mantique alors que les autres visent tout particuli rement la formalisation et l op rationnalisation m me s ils s ef forcent par le biais d interfaces graphiques labor es cachant la complexit des m ta langages sous jacents de rendre ces op rations plus intuitives pour le concepteur Un tel positionnement pour DOE n cessite cependant une articulation soigneuse avec ces autres environnements Il faut pouvoir le cas ch ant compl ter le travail fa
313. ion de sch mas notion g n rique notion sp cifique Methontology L quipe du LIA de Madrid a propos un processus complet de gestion du cycle de vie des ontologies gestion du projet d veloppement de l ontologie support FGJ97 BFGG98 Une telle approche rejoint nos consid rations sur l importance du niveau structurant pour une ontologie de domaine cf section 3 3 2 UK95 cite les travaux de Lakoff Lak87 comme r f rence suivre pour la cat gorisation les notions du niveau basique sont celles qui sont primaires du point de vue de la perception de l organisation des connaissances ou encore de l expression langagi re En particulier dans le fonctionnement cognitif d un individu ces notions sont plus utilis es inconsciemment imm diatement que con ues intellectuel lement L article reprend l exemple de la notion basique de chien qui se g n ralise en animal et se sp cialise en retriever 116 4 2 Des propositions pour rationaliser la conception des ontologies Nous ne nous int ressons ici qu au c ur de la d marche le d veloppement d ontologies Celui ci est divis en six t ches sp cification d terminer l utilisation future de l ontologie conceptualisation obtenir un mod le du domaine au niveau des connaissances formalisation transformation du mod le conceptuel en mod le formel 1 2 3 4 int gration r utilisation d autres ontologies
314. ion sont organis es de mani re s inter d finir Un proc d classique pour obtenir un tel r seau de significations est de construire un r seau mettant les primitives en relation les unes avec les autres par des liens organisationnels que l on sait interpr ter hors de tout domaine De fait les langages de repr sentation de connaissances vont tr s souvent avec un certain nombre de constructeurs de nature pist mique on peut alors parler de m ta langages puisque ces constructeurs visent la cr ation des langages de repr sentation de connaissances factuelles Ces constructeurs sont r partis en primitives permettant de d clarer le type des primitives de repr sentation types de concepts types de relations concepts r les ou bien encore classes attributs pour mentionner les choix faits dans les paradigmes les plus courants les liens pist miques mettant en relation les primitives d clar es au moyen de ces types On retrouve l une d marche semblable ce qui se fait dans les thesaurus deux diff rences fondamentales pr s puisqu on est dans des paradigmes complexes on dispose de plus de constructeurs la fois pour les types pist miques et pour les liens possibles entre ces types sous l influence de l intelligence artificielle et de sa tradition formaliste les constructeurs sont munis d une s mantique non ambigu la plupart du temps formalis e 13Pour rester h
315. ion des ontologies se fait en tant r ellement conscient de l usage des primitives en cours de d finition et r ciproquement l utilisation de ces ontologies pendant l indexation et la recherche se veut exploiter au mieux les connaissances qui ont t sp cifi es lors de la conception Ces r sultats semblent en conformit avec ce que l on attend g n ralement d une convention CIFRE Car si pr sent on peut relier les pr occupations scientifiques des applications pratiques en observant comment on a pu limiter la complexit induite par le choix de techniques labor es on sait aussi comment directement b n ficier de certains des efforts les plus th oriques comme les ontologies de haut niveau ou les patrons de conception pour am liorer la qualit intrins que des ressources construites pour ces applications Par exemple le recours des connaissances de raisonnement formelles peut tout d abord tre 201 Conclusion interpr t en termes de l gitimit m tier En compensant les variations descriptives autoris es autour du contenu de r f rence du graphe patron d indexation les connaissances de raison nement permettent de prendre en compte la variabilit inter ou intra indexeurs cf page 35 dans les processus de recherche assist e En termes de performances de syst me de recherche d informations cela permet de gagner en rappel sans perdre en pr cision puisque la strat gie d larg
316. ion qui contient une s quence o un professeur t moigne dans son bureau sur la maladie bleue une maladie cardio vasculaire et o une animation explique ce qu est une st nose et comment le fonctionnement anormal du c ur est la cause de la maladie bleue En supposant que l on dispose dans un thesaurus des notions ad quates de fait de nombreux termes parmi ceux qui vont suivre peuvent tre trouv s dans le thesaurus de PINA l index cr contiendra les notions mission s quence t moignage professeur bureau maladie bleue animation st nose fonctionnement coeur Un tel index non structur pose on vient de le voir gr ce un exemple similaire des probl mes d interpr tation en exag rant peine on peut imaginer qu un tel index pourra r pondre une requ te sur le fonctionnement des bureaux De plus ce qui est particuli rement important dans une application traitant de documents audiovisuels on ne distingue pas les proc d s de construction ou de mise en forme audiovisuelle des th mes que ces documents abordent ou des personnes des lieux et des actions qu ils montrent Afin de rem dier cela on peut structurer leur tour les champs d indexation en sous champs plus sp cifiques chacun rendant compte d un aspect du document audiovisuel Ceci implique de construire une grille de description un formulaire qui sera utilis e pour chaque index Cette grille peut tre inspir e de gril
317. ionnels Le code 4 1 repr sente en OWL la propri t de partition disjointe introduite pr c demment On note d ailleurs l occasion que OWL ne pr sente pas de constructeur permettant de construire une telle disjonction directement il faut l exprimer par extensionnel elle implique effectivement pour les deux concepts consid r s que l extension de l un est incluse dans celle de l autre 18Nous en avons voqu quelques uns au chapitre 2 GFC04 en dresse un inventaire complet et r cent Il existe aussi des travaux qui essaient de comparer explicitement leur diff rentes fonctionnalit s comme BCKNO1 19Cet exemple a l int r t d illustrer l emploi de la syntaxe XML de OWL diff rente de la syntaxe abstraite utilis e dans le chapitre 2 126 4 3 Prescrire une mani re de construire les notions ontologiques le biais de plusieurs lois d exclusion lt xml version 1 0 encoding IS0 8859 1 standalone no gt lt rdf RDF gt lt owl Ontology gt lt owl Ontology gt Bema lt owl Class rdf about Personne gt lt owl unionOf rdf parseType Collection gt lt owl Class rdf about PersonnelEpreuve gt lt owl Class rdf about PersonnelEquipe gt lt owl Class rdf about Spectateur gt lt owl unionOf gt lt owl Class gt lt owl Class rdf about PersonnelEpreuve gt lt owl disjointWith rdf resource PersonnelEquipe gt lt owl disjointWith rdf resource
318. ions d crites et celles relevant de connaissances essentielles les descriptions valables pour toute situation envisageable dans l application comme la relation de sp cialisation tenant entre la notion d interview et celle de s quence dans un contexte audiovisuel Et finalement on doit se poser la question des interpr tations et des traitements qui sont possibles en dehors de toute s mantique formelle On peut videmment exploiter des m thodes de recherche utilisant des algorithmes de traitement de graphes C est d ailleurs ce qui a motiv en partie des approches comme les r seaux s mantiques o l on recherchait plus exploiter la proximit entre les notions repr sent es dans le r seau qu raisonner sur une ventuelle interpr tation objective Mais ces algorithmes peuvent tre d une complexit trop importante et leur application ad hoc ne garantit pas obligatoirement le passage pour les informations manipul es du statut de simple donn e celui de connaissance Et ceci vaut autant pour des syst mes qui auraient pour ambition de simuler des raisonnements que pour les utilisateurs eux m mes dont l interpr tation des l ments rencontr s doit tre guid e si l on veut qu ils exploitent correctement les informations fournies par un SBC 4La relation d instanciation parfois d sign e en RC par l expression est_un rattache un individu d une description factuelle une notion plus
319. ions et engagement ontologique La confusion originelle quant la d finition des ontologies en IA a engendr une tr s grande vari t des produits ainsi d sign s L enjeu le plus clairement identifiable de la cr ation de ces artefacts tant la cr ation d un vocabulaire permettant de d crire des connaissances toute liste de symboles plus ou moins structur e est susceptible de se voir parfois tr s abusivement r pertori e comme une ontologie Un thesaurus par exemple est un vocabulaire de description qui a fait l objet d une d finition et d une structuration recherchant explicitement le consensus et la r duction des ambiguit s dans l application informationnelle vis e Il peut galement tre utilis tel quel dans un syst me d information capable d exploiter la hi rarchie de notions qu il contient Certains seront donc tent s de l avancer comme une ontologie Nous avons cependant montr que les thesaurus s ils peuvent satisfaire les besoins de certaines applications pr sentent des insuffisances majeures en termes de pr cision et de coh rence ce qui 50 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche emp che les notions qu ils apportent de fonctionner comme des connaissances exploitables par un syst me d information sans perte de pr cision Pour nous il faut que les r f rentiels de sens que vont constituer les ontologies soient plus co
320. iptions point M1 Qui plus est cette conception avec comme objectif explicite l obtention des structures qui faciliteront la cr ation des descrip tions point M2 ainsi que la cr ation d une forme de raisonnement qui soit pertinente pour le fonctionnement du SBC Il va nous falloir pr sent refaire un bilan complet de ces propositions d passant celui qui a t fait par exemple dans notre article IBLO5 qui ne concernait que le volet des patrons d utilisation et de conception et surtout montrer qu elles sont applicables Nous allons pour cela faire une synth se des exp rimentations qui ont t men es au cours de cette th se et dont sont issus la majorit des exemples que l on a vus dans ce manuscrit Comment a t on pu appliquer nos solutions dans ces cas d utilisation concrets Dans quelle mesure ces exp rimentations valident elles la justesse de ces propositions Quels sont les probl mes qui restent traiter 48 Que cette organisation repose sur l emploi de la relation fondamentale de subsomption ou sur des agencements privil gi s entre concepts et relations conceptuelles 154 Chapitre 5 Exp rimentations et discussions 5 1 R capitulatif des apports m thodologiques de cette th se La premi re des contributions de ce manuscrit est une r flexion sur les besoins concrets que posent les syst mes d indexation et de recherche audiovisuelle Nous avons en effet constat qu indexer est une t che
321. ique dans les travaux d intelligence artificielle fait que les d finitions ainsi construites sont interpr t es pr cis ment selon une approche ensembliste rapprochable de celle de la logique classique Dans un tel cadre il est possible d utiliser les sp cifications ontologiques dans des processus logiques de d monstration appliqu s la recherche des index On consid re que ces sp cifications sont des axiomes du domaine des assertions toujours valides qui pr cisent pour un syst me de raisonnement logique le sens des concepts qu il aura manipuler Par exemple les sp cifications donn es dans les codes 2 10 2 11 et 2 12 peuvent tre appliqu s pour augmenter ce qui est impliqu par les assertions donn es en code 2 6 D apr s la s mantique des logiques de description et les informations contenues dans les sp cifications terminologiques on peut en effet d duire que prof_1 joue un r le de professeur par application de la d finition de Professeur prof_1 joue un r le d expert par g n ralisation de RoleProfesseur et donc que prof_1 est une instance d Expert emission_d crite contient une instance d InterviewExpert par application de la d fi nition de ce concept l assertion du code 2 6 On pourra donc r pondre une recherche d interview d expert alors m me que l in formation n tait pas explicitement pr sente dans la description Les connaissances formelles 18Le sen
322. iquement l Ontologie est une discipline de la philosophie dont l objet est l tude sys t matique de la nature et de l organisation de l tre Le terme a t r utilis dans une acception distincte moins ambitieuse en intelligence artificielle o l tre est plus facile appr hender puisqu il s agit de ce que l on choisit de repr senter dans un syst me Les ontologies y d signent des artefacts au sens de construction artificielle labor s lors de la mod lisation conceptuelle 8Pour plus de d tails le lecteur pourra se tourner vers les contributions r centes de Cha03 et Bac04a Bruno Bachimont dans Bac96 d finit un mod le de connaissance comme un syst me de connaissances permettant de raisonner propos d une r alit et d en anticiper l volution sous un certain point de vue 46 2 2 IC et expressivit descriptive et dont l objectif est de jouer le r le de r f rentiels conceptuels pour les SBC Cela fait un certain temps que l intelligence artificielle a d gag le besoin de cr er des mo d les r sultant d un effort d abstraction du monde de l application On veut rendre compte de compr hensions partag es que ce soit pour am liorer l interop rabilit des SBC pour augmenter le potentiel de r utilisation des l ments sp cificiant iceux ou plus simplement pour faciliter de mani re g n rale l acc s et la cr ation des connaissances qui y so
323. iquent les candidats concepts et relations de l ontologie construite Si une question comme Qui est le pr sident de l entreprise Y est susceptible d tre pos e un SBC ontologique particulier on pourra tout moment exhiber cette question comme justification dans l ontologie de l existence des concepts Pr sident et Entreprise ainsi que d une relation d appartenance valable entre pr sidents et entreprises 117 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique Cependant on ne peut pas dire que l utilisation de telles solutions de conceptualisation soit satisfaisante En fait si on sugg re au concepteur des pistes pour isoler les notions de l ontologie ou leur assigner des significations informelles aucune de ces propositions ne fournit un cadre d assistance explicite et concret La phase de conceptualisation proprement dite celle o les concepts de l ontologie sont d gag s d finis par certaines propri t s et organis s entre eux gagnerait tre guid e de mani re plus pr cise qu elle ne l est dans ces r flexions Par exemple METHONTOLOGY propose un certain nombre de repr sentations interm diaires afin de mieux conduire le processus de construction des ontologies au niveau de la connaissance mais d s que l on passe au niveau plus fin du contenu de l ontologie ses pr conisations se font plus vagues Ainsi ses arbres de classification de concepts ne font p
324. isant des thesauri facettes sont souvent consid r s comme trop lourds employer aux regards des am liorations qu ils apportent concr tement A VINA afin d exprimer explicitement des relations entre descripteurs on utilise parfois des pr cisions d indexation Pic96 Il s agit au sein d un index d tablir un lien entre deux termes Ces pr cisions sont le plus souvent utilis es pour expliciter le sens d un mot outil trop g n ral sinon v rification contr le technique pour indiquer apr s le descripteur adapt le nom propre d un lieu d une entreprise ou d une institution mus e Orsay d une manifestation artisitique ou non pi ce de th tre Andromaque ou d une autre entit logiciel Word De cette fa on on peut cr er au niveau des index des relations entre les composants de ces index semblables aux relations que l on pouvait trouver dans le thesaurus ainsi la relation d instanciation entre un descripteur et un nom propre se rapproche de la relation hi rarchique N anmoins le probl me qui se posait dans le cas du thesaurus r appara t ici On met bien en relation deux descripteurs mais on ne peut pas utiliser de notion sp cialis e adapt e une application pour d crire cette relation Plus int ressante est la possibilit de se servir d une pr cision d indexation pour exprimer un lien entre deux ou plusieurs entit s comme dans accord Isra l Palestine ou bien ligne
325. isation s mantique On peut 1Ces langages sont prioritairement int ress s par l encodage d une description structurelle et fonctionnelle d un document la description du contenu th matique employant un langage documentaire contr l suivant l acception qui t la n tre jusqu pr sent ne venant qu ensuite 158 5 2 Exp rimentations ontologiques se rendre compte 4 travers les exemples de la section 3 2 2 page 89 et 4 3 3 page 131 de la mani re dont cette op ration a t men e dans cette ontologie Il faut remarquer que pour rendre les niveaux les plus lev s de nos hi rarchies plus coh rents que ce que les d finitions m tier permettent d obtenir nous avons r utilis la hi rarchie de concepts de haut niveau introduite dans l ontologie utilis e dans le projet MENELAS Cette hi rarchie a t construite en suivant la m thodologie ARCHONTE BBCZ95 ce qui nous a permis de b n ficier imm diatement du travail de conceptualisation abstrait accompli alors Un tel effort de rattachement permet comme cela a t d j voqu auparavant propos de la r utilisation des concepts de haut niveau de patrons de conception de clarifier l engagement ontologique tout en augmentant le potentiel de r utilisation de notions initialement con ues pour une application pr cise En ce qui concerne les relations nous sommes partis de la typologie propos e dans les travaux du laboratoire LaLICC Des8
326. ises par les moteurs d inf rence qui les exploitent Il faut d s lors que les sp cifications formelles soient clairement orient es vers l utilisateur que les raisonnements qu elles permettent soient effectivement pertinents pour les usages retenus Si l gitimer le recours aux SBC est tout fait faisable encore faut il fournir des l ments qui facilitent l application pratique des approches voqu es au long de ce chapitre Que ce soit pour la ma trise d une expressivit d sormais plus importante pour la conception et l appr hension de r f rentiels de signification qui sont tr s pr cis et dont certains des aspects formels ne sont pas imm diatement accessibles pour le non expert ou encore en ce qui concerne la proposition et la mise en uvre de connais sances de raisonnement effectivement pertinentes il faut des consid rations m thodologiques m me de guider le travail des concepteurs et des utilisateurs du syst me 73 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV 74 Deuxi me partie Prendre en compte l usage dans Vimpl mentation de solutions d indexation ontologique 75 Chapitre 3 Faciliter la conception et l acc s aux index s mantiques dans un syst me documentaire 3 1 Introduction vers une prise en compte des usages dans les solutions existantes Recourir 4 une approche s mantique employant des ontologies complexifie le processus d in dexa
327. issement de l ensemble des r sultats positifs correspond une connaissance dont on est s r de la pertinence Ensuite ce m me recours des connaissances de raisonnement permet en articulant les structures construites dans le cadre de l application avec des constructions de haut niveau les patrons de conception de l gitimer celles ci d un point de vue th orique Ceci augmente leur potentiel de partageabilit et m me si dans cette th se cela n est pas notre objectif imm diat leur r utilisabilit dans d autres contextes applicatifs On peut consid rer que ces connaissances permettent de compenser une variabilit inter applications ce qui est utile pour atteindre les objectifs jusque l nonc s de fa on plut t th orique d initiatives de partage de connaissances grande chelle Il faut noter que ce genre de consid rations rapproche en un certain sens nos vues de celles de l initiative du web s mantique Cette initiative au lieu de proposer des paradigmes en rupture totale avec les solutions techniques ou m thodologiques pr c dentes vise en effet davantage un am nagement de celles ci pour des contextes d application bien particuliers On pourra faire remarquer que nous n avons pas instrument nous m mes l int gralit de la cha ne de conception d ontologies puis d indexation et de recherche de documents audiovisuels que nous proposions Certains outils sont en effet d j disponibles ou
328. it des index produits au regard des contraintes formul es au moyens de langages qui ont une signification op rationnelle adapt e Les logiques de description apportent par exemple des m canismes de satisfiabilit qui v rifient la coh rence de la base d assertions par rapport ce qui est introduit dans la base terminologique de la T Boz Les sp cifications qui sont entr es dans les ontologies formalis es permettent alors au syst me documentaire de contr ler lui m me la continuit s mantique des index tant au niveau de la substance des descriptions qu celui de leur forme Le passage une interpr tation formelle permet donc d obtenir une plus grande coh rence en ce qui concerne l utilisation des descripteurs composant les index cette formalisation a des cons quences plus g n rales en termes d exploitation Si on reprend par exemple la classification des contextes d usage propos e par F r04 une ontologie contenant des d finitions et des axiomes formalis s peut tre en effet tre utilis e fins de validation et d inf rence De fait une fois munis de sp cifications formelles les syst mes peuvent op rer des calculs qui au del de la v ri fication et du contr le s mantiques peuvent tre utilis s pour am liorer l exploitation des index dans le syst me documentaire Il s agit alors d une application plus active des connaissances formelles dans le but de produire de nouvelles assertio
329. it les patrons d indexation sont utiliser en conjonction avec des connaissances de raisonnement formelles qui permettent justement de faire la jonction avec les diff rentes d clinaisons de son contenu que ces d clinaisons soient pr sentes dans les requ tes ou les index On a alors r duit doublement la charge cognitive reposant sur l indexeur on lui propose une structure canonique pertinente et il dispose d une marge de manceuvre significative pour encoder ses propres interpr tations sans pour autant les rendre inaccessibles pour les autres utilisateurs Il faut noter qu on est alors dans la port e du point M2 L application des connaissances de raisonnements a pr sent une l gitimation imm diate vis vis des processus de description dont elle assouplit les contraintes ditoriales ou formelles et de recherche cet assouplissement va de pair avec des capacit s de recherche qui ne sont aucunement amoindries Elle n est plus un obstacle la compr hension des SBC d indexation et donc leur acceptation par des utilisateurs non experts en repr sentation des connaissances De fait les propositions de ce chapitre ont des r percussions importantes sur la mani re dont les ressources ontologiques devront tre con ues Par exemple les patrons d indexation doivent tre pris en compte avec soin au moment de la sp cification du vocabulaire ontologique et des connaissances de raisonnement aff rentes Ils p
330. it d un support de graphes conceptuels en CGXML Ce support joue un r le fondamental par rapport au langage de repr sentation que constitue le formalisme des Gc Tout d abord concepts et relations y sont en effet pr sent s sous la forme de hi rarchies de sp cialisation qui organisent les notions des plus g n rales aux plus particuli res nous verrons plus en d tails la signification de cette hi rarchisation 4 la fois semblable et diff rente de celle pr sente dans les thesaurus Ensuite les m canismes de construction de graphes valides ne permettent pas d introduire de nouveaux types de concepts ou de relations lors de ce processus On peut donc bien affirmer que le formalisme de GC se donne les moyens de d finir de fa on explicite les primitives non logiques propres une application Et qu en ce qui concerne l encodage d index sous forme de graphes conceptuels comme dans OPALES on commence entrevoir une sorte d engagement ontologique on se donne les moyens de cr er et d utiliser un vocabulaire de description propre au domaine concern Pour chaque application on pourra introduire un nouveau support susceptible d apporter les notions n cessaires la repr sentation de connaissances structur es dans ce cadre Le code 2 1 montre comment on peut utiliser un langage concret ou plut t un m ta langage de repr sentation de connaissance pour sp cifier 10Par la suite et sauf cas contraire mentionn
331. it dans notre di teur dans les outils qui permettent une formalisation et une op rationnalisation compl tes selon les crit res d finis par les langages standards de repr sentation d ontologies Il serait galement souhaitable de pouvoir r cup rer des ontologies d j d finies mais qui ne suivent pas les prin cipes m thodologiques avanc s par Bruno Bachimont pour pouvoir les re travailler selon cette approche Pour cela nous avons utilis la technologie de transformation XSLT XSL99 le format de sauvegarde de notre diteur utilise la syntaxe XML il est donc possible de proc der relativement a des transformations syntaxiques de ce format en un autre format en particulier si ce dernier utilise lui aussi cette syntaxe ce qui est le cas des principaux langage d encodage d ontologies Cette solution si elle a contre elle le niveau auquel elle se place on n essaie pas vraiment d interpr ter la s mantique des objets manipul s au moment de la transformation et sa pi tre efficacit en termes d utilisation des ressources machine a l avantage de l adaptabilit En effet si la sp cification d un langage est modifi e ou si un nouveau langage int ressant appara t ce qui peut arriver dans un domaine de recherche ou rien n est fix de fa on d finitive il suffit de modifier la feuille de style correspondante ou bien en ajouter une autre sans avoir 4 modifier le code de l outil de mani re s
332. itecture Sesame BKv02 Pour l instant celle ci utilise RDFS comme langage de repr sentation d ontologies et offre des services de raisonnement conformes aux sp cifications de la th orie des mod les RDF Ceci autorise des inf rences basiques comme l utilisation des liens de subsomption pour les concepts et les relations Dans notre exemple il est ainsi possible de trouver l interview d crite dans les r sultats d une recherche de s quences expliquant la maladie bleue puisque dans Vontologie de l AV Interview sp cialise Sequence Cependant cela n est pas suffisant pour l exploitation que nous d sirons pr cise et utilisant la fois les propri t s des concepts et des relations pr sents dans les index Nous nous pla ons en effet toujours dans un cadre comme celui d OPALES o nous avions jug pertinent d utili ser en plus des fonctionnalit s des supports basiques des graphes conceptuels celles de r gles de raisonnement plus complexes Dans le contexte du web s mantique l opportunit d utiliser les possibilit s des langages OWL ou au moins celles du sous ensemble d cidable OWL DL semble en particulier s duisante Avec OWL on peut pr ciser qu une ExpertInterview est exac tement d finie comme une interview o au moins un participant joue un r le d expert Le concept ExpertRole sera lui d fini par le biais d une quivalence de classes num rant les r les du do maine qui peuven
333. itre 2 Ontologies et SBC pour la description conceptuelle de documents AV A cette pr occupation l initiative du web s mantique peut apporter une r ponse R cemment l un des initiateurs du Web Tim Berners Lee a d velopp avec d autres chercheurs la vision d une extension du web actuel o l information serait pourvue d une signification plus pr cise que celle d aujourd hui qui demeure peu ou prou inaccessible aux syst mes informatiques Les contenus des documents seraient con us comme autant de ressources disponibles pour un r seau d agents logiciels changeant des services les uns avec les autres afin de permettre un meilleur acc s l information pour les utilisateurs humains BHLO1 Il faut pour cela tendre les formats actuels de contenu destin s une lecture humaine par une couche s mantique apportant des m ta donn es ou des annotations interpr tables par un syst me en vue de la conduite de raisonnements automatiques Il faut galement per mettre l tablissement de liens entre les ressources s mantiques possiblement h t rog nes pour mieux les changer et les int grer On doit d abord r soudre un probl me d interop rabilit syn taxique les donn es doivent tre encod es dans un format compr hensible par tous les agents XML XML04 et le langage g n rique de description de ressources RDF RDF04al tous deux d velopp s par le W3C fournissent un cadre expressif standard et
334. ives em ploy es dans les assertions ont bien t introduites auparavant dans la terminologie Dans le cas des LD c est la T box qui joue le r le comparable celui d une ontologie du domaine applicatif On a donc en RC des m canismes qui permettent de construire des bases de connaissances s appuyant explicitement sur des vocabulaires d di s des applications particuli res Si on adapte au cas de l indexation ce genre de d marche on est donc m me de traiter le probl me de la substance des expressions repr sentant le contenu des documents Dans la mesure o l on choisit un formalisme de repr sentation de connaissances laissant les concepteurs du SBC libres de sp cifier le vocabulaire de description on peut donc esp rer que celui ci pourra tre pertinent pour le cadre applicatif retenu Cependant on a vu dans le chapitre 1 que la cr ation d un langage de description documen taire exigeait plus que la simple donn e d un vocabulaire f t il aussi sp cialis que l application le demande De fait une approche aussi simple serait en retrait par rapport aux d finitions vo qu es pour les ontologies Ces d finitions parlant de conceptualisation de repr sentation ou encore de s mantique se placent clairement du c t d un engagement quant au sens des primitives cr es Ce probl me rejoint tout naturellement celui de la continuit s mantique Il faut que ce langage fournisse des solutions
335. jours une valeur fonctionnelle mais qui rel ve du domaine mod lis avant d introduire les concepts plus concrets qui seront r ellement employ s dans les descriptions 38Un groupe de travail du w3c relatif aux bonnes pratiques du web s mantiques les consid re d ailleurs comme l une de ses pistes de recherche principales Voir http www w3 org 2001 sw BestPractices pour plus d informations 141 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique g 0 2 a requisite Inflammation parameter requisite Inflammation parameter part of modality target Inflammation path modality target for Inflammation role Leomponent ot ot ot sntiammation Parameter a 0 KZ RFI tLoomponent requisite for Inflammeation role Li requisite for Inflammation path played by sequences setting for seting tor 0 ee ee Siola gical Pracess gat setting for participant 1 Biological object location Region part Biological process location of 07 0 part Region Biological Object A participant in 1 Biological process location Region part Biological object setting FIG 4 5 Sp cialisation du patron D amp S pour le domaine de l inflammation extrait de GCB04 L emploi de concepts gris s marque la diff rence entre les concepts g n raux du domaine et le niveau m tier plus concret 142 4 4
336. l expressivit formelle de OWL est consid rablement plus importante que celle autoris e par DOE De fait toutes les possibilit s formelles de notre diteur sp cification de la relation de sp cialisation d finition des domaines et co domaines des relations sont incluses dans celles de OWL alors que la plupart des possibilit s d finitions complexes ensemblistes axiomes relationnels simples de ce langage issu des logiques de description ne sont pas prises en compte dans notre mod le Cela n est en principe pas g nant si on se contente d exporter des ontologies construites avec DOE vers d autres diteurs mais on peut perdre quantit d informations si on importe dans DOE des ontologies formellement d taill es Plus grave encore est la possibilit de perdre les informations d finies pour l ontologie diff rentielle les langages de repr sentation d ontologies ne sont pas forc ment con us pour exprimer les informations linguistiques que l on assigne aux notions de cette ontologie Or ces informations doivent tre export es si on veut conserver les significations normalis es dans l ontologie diff rentielle et m me si on ne peut le faire que pour les concepts et relations introduits d s l tape de normalisation Il a donc fallu trouver des solutions de remplacement telles que l inscription des principes diff rentiels dans les commentaires habituellement non structur s des langages
337. l on appellera un support C est ce support qui renferme les liens structurant le domaine lui m me comme l information selon laquelle le type Interview sp cialise le type S quence et qui sert de sp cification pour les raisonnements possibles comme nous le verrons dans les sections 2 2 2 2 3 1 et 2 3 2 5 3 m gi r gt En principe ces arcs sont num rot s pour ordonner les arguments d une relation mais dans le cas le plus fr quent celui d une arit relationnelle gale 2 on pr f re une notation employant des fl ches 43 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV Cette s paration entre connaissances du domaine d application et connaissances li es aux cas particuliers repr sent s est partag e par une approche plus tourn e vers la logique celle des logiques de descriptions LD BCM 03 Celles ci d rivent directement de travaux comme ceux de Brachman Bra79 BMPT91 qui ont distingu par exemple les liens pist miques appartenant au niveau de l organisation formelle de la connaissance des liens conceptuels et linguistiques plus sp cifiques de domaines ou de t ches particuli res Les LD sont inspir es par le paradigmes des frames et des r seaux s mantiques mais elles reprennent la s mantique ensembliste formelle d finie par la logique du premier ordre Elles introduisent n anmoins une certaine quantit de constructeurs sp cifiques le nombre e
338. l d une approche de repr sentation de connaissances On mod lise ainsi la connaissance sous forme d objets complexes renvoyant des entit s du domaine dont la caract risation s op re par l emploi d attributs slots dont les valeurs sont contraintes par des propri t s facets On pourra ainsi dire que l on repr sente une mission comme une frame qui poss de un attribut contient qui prendra ses valeurs possiblement multiples parmi les entit s ayant pour type s quence ou l une de ses sp cialisations Cette approche peut se rapprocher d une approche ant rieure de repr sentation qui partait des m mes pr occupations d ad quation cognitive des utilisateurs humains et au fonctionne ment suppos de leur m moire les r seaux s mantiques Qui68 Ceux ci se concentrent sur la repr sentation des relations entre l ments conceptuels de mani re graphique Les connaissances sont en effet repr sent es sous forme de r seaux dont les n uds sont des concepts associables des entit s individuelles pr dicats unaires ou objets et les arcs des relations entre concepts associables des pr dicats binaires On peut ainsi repr senter notre index par le r seau de 3En g n ral on interpr te la signification de la co occurrence de notions dans un index comme une conjonction des significations respectives de ces notions un index t moignage professeur renverra vaguement un th me complexe abor
339. l du niveau du domaine Le niveau fonctionnel regroupe les connaissances abstraites qui fondent les th ories auxquelles sont rattach es chacune des couches On peut ainsi retrouver une th orie de la couverture d un espace qui va introduire des concepts et des relations fonctionnels zones relations entre ces zones ainsi qu un certain nombre de contraintes partition compl tude ou incompl tude de la couverture d un espace continuit et d op rations calcul de voisinage agr gation de zones qui peuvent tre activ s pour cette th orie De fait lors du passage du niveau fonctionnel celui du domaine la repr sentation du cadastre ou le d coupage zones de couverture hospitali res on va non seulement sp cialiser les notions de la th orie fonctionnelle les parcelles sont des zones mais aussi choisir de s lectionner ou non les op rations et les contraintes en fonction du domaine Par exemple dans le domaine du d coupage hospitalier les zones devront r aliser une couverture totale de l espace et on devra conna tre pour chaque zone l ensemble de ses voisines Les niveaux fonctionnels contiennent une quantit tr s restreinte de notions mais celles ci sont li es d un niveau l autre les zones d une th orie de la couverture spatiale sont d un certain point de vue assimilables aux n uds d un r seau ce qui permettra par exemple d appliquer la relation d accessibilit entre zone des contraintes issue
340. le et les objectifs qu ils 23 C est dire demandant une forme d interpr tation qui va au del de l analyse des composantes physiques d une image 69 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV imposent dans le cadre technique et m thodologique offert par les approches de repr sentation de connaissances ontologiques Le cas d OPALES C est effectivement une approche tout fait orient e vers les usages qui a t adopt e par OPALES Il s agit en effet en premier lieu de trouver une solution au probl me d une indexation dont les termes et les enjeux varient suivant le point de vue applicatif retenu les deux exp rimentations qui se sont d roul es lors du projet concernaient la petite enfance point de vue m lant des consid rations sociologiques ethnologiques et psychologiques et l analyse p dagogique de documentaires g ographiques pour mettre en lumi re l articulation entre proc d s audiovisuels et pr sentation du discours scientifique Pour cela la plate forme d indexation doit proposer la cr ation d un vocabulaire sp cifique chaque point de vue et des modes de cr ation et d exploitation des index qui r pondent ce que l on attend dans chaque application Les outils r alis s permettent donc la conception d ontologies dont la partie formelle est exprim e sous la forme de supports de graphes conceptuels cf section 4 3 3 format dont cer
341. le Ces tests pourraient ensuite d boucher sur des strat gies adapt es d impl mentation comme le choix de saturer une base de connaissances lorsqu on y ajoute de nouvelles informations pour soulager le travail du moteur d inf rence lors de la recherche vers des biblioth ques de patrons et d utilisation Les d marches d utilisation de patron de conception s inspirent des solutions de design patterns de l ing nierie logicielle GHJV95 Comme eux ils s attachent proposer des structures qui constituent des solutions des probl mes pr cis en l occurrence des difficult s de mod lisation Mais ces approches la n tre y compris gagneraient peut tre s inspirer plus encore que cela n est fait pr sent de certaines propositions m thodologiques de ce domaine En particulier partant du principe que les syst mes construire r pondent des probl mes complexes certains chercheurs proposent de constituer des catalogues de design patterns o ceux ci sont li s les uns aux autres Cela permet de mieux cerner les solutions existantes lors de la recherche d un patron ou de mieux justifier la cr ation d un nouveau patron en faisant explicitement r f rence ceux qu il adapte en vue de r soudre un probl me que l on juge nouveau Si l on tait en mesure d adapter convenablement de telles approches au cas ontologique o les connaissances sont aussi difficiles appr hender mettre en relation
342. le fran aise diffus e sur les cha nes de radio et de t l vision r seaux hertziens c ble et satellite et d organiser la conservation de ce patrimoine et sa mise disposition en direction d un public s lectionn Cette double mission impose l Institut la r solution de nombreux probl mes En effet les fonds dont il a la garde sont gigantesques si l on consid re l ensemble des documents des deux d partements mentionn s on se retrouve face deux millions d heures de programmes un nombre qui augmente videmment chaque ann e du fait de la cr ation et de la diffusion de nouvelles missions L importance de ce volume pose bien s r de gros probl mes de collecte de stockage et de conservation beaucoup d archives tant encore sur support analogique unique et p rissable Mais g rer l acc s une telle quantit de documents ne va pas non plus sans difficult sans possibilit de retrouver efficacement ce qui est archiv l archivage perd de sa pertinence Lorsqu on entre l Institut l une des premi res choses que l on apprend est que nombre d entre elles sont en fait menac es par les atteintes du temps et ses outrages physiques quand elles ne se sont pas envol es en fum e avant que la main bienveillante d un agent du Plan de Sauvegarde et de Num risation n ait pu les sauver d une mort annonc e Introduction Comment livrer celui qui effectue une recherche dans un fon
343. le syst me jugera notre documentaire pertinent pour une requ te telle que trouver un programme qui explique une maladie et offre une repr sentation visuelle d une de ses causes Quelles sont donc les possibilit s offertes en la mati re par le web s mantique Quels raison nements pouvons nous rendre possibles en fonction du langage de repr sentation des index mais aussi de celui de sp cification d ontologies Nous ne pouvions pas videmment tester toutes les solutions offertes Par contre en pr sence d un mouvement certain de standardisation des lan gages de repr sentation de connaissances sur le web encourag par le w3c nous avons trouv pertinent de nous attacher aux propositions les plus matures RDF pour la repr sentation des faits relationnels qui constituent les index puis RDFS et OWL pour la repr sentation des connaissances ontologiques Shttp www w3c org 172 5 2 Exp rimentations ontologiques ae repre Fa haSAVFeature represo ii Sents Program Lh enfantsCardiaques iy Animated Oty animation Se Expertinterview sqceEntretien Parent Expert prof1 Stenosis PulmonaryArtery stenoseAP arterePulmonaire1 CVDisease maladieBleue ExpertRole profRole1 Fic 5 8 Index compl t avec des connaissances inf r es En premi re approche il faut retenir qu
344. lenl var gt bcPrgm lt ruleml var gt lt surlx classAtom gt lt swrlx classAtom gt lt owlx Class owlx name BroadcastCourseUfEvents gt lt rulenl var gt bcCOE lt ruleml var gt lt surlx classAtom gt lt swrlx classAtom gt lt owlx Class owlx name BroadcastTime gt lt ruleml var gt bcTime lt rulem1 var gt lt surlx classAtom gt lt swrlx classAtom gt lt owlx Class owlx name Date gt lt ruleml var gt date lt ruleml var gt lt surlx classAtom gt lt swrlx individualPropertyAtom swrlx property amp dolce plays gt lt rulenl var gt pregm lt ruleml var gt lt ruleml var gt bcPrgm lt ruleml var gt lt surlx individualPropertyAtom gt lt swrlx individualPropertyAtom swrlx property amp dolce modality for gt lt rulenl var gt bcPrgm lt ruleml var gt lt rulenl var gt bcCOE lt ruleml var gt lt surlx individualPropertyAtom gt lt swrlx individualPropertyAtom swrlx property amp dolce has for requisite gt lt rulenl var gt bcCOE lt rulem1 var gt lt ruleml var gt bcTime lt ruleml var gt lt surlx individualPropertyAtom gt lt swrlx individualPropertyAtom swrlx property amp dolce valued by gt lt ruleml var gt bcTime lt ruleml var gt lt rulenl var gt date lt ruleml var gt lt surlx individualPropertyAtom gt lt ruleml _body gt lt ruleml _head gt lt swrlx individualPropertyAtom swrlx property wasBroadcastedAt gt lt ruleml var gt prgm lt ruleml1 var gt lt rulenl va
345. les syst mes d indexation automatique puissent produire autre chose que des descripteurs de tr s bas niveau du contenu des documents couleurs formes mouvements etc Contrairement ce qui est souvent avanc cette d tection de contenu renvoie plus aux caract ristiques basiques de ce qui est montr dans le document qu une v ritable analyse de ce que renferme le docu ment ce qu est l indexation Il est donc improbable que de tels moyens garantissent autres chose qu un acc s limit aux documents puisque les informations qu ils produisent sont tr s loign es du niveau auquel sont habituellement formul es les requ tes Les sp cialistes de ce domaine re connaissent l existence d un foss s mantique ES03 entre les traitements que les ordinateurs peuvent produire et ce que les utilisateurs attendent des syst mes documentaires Certains outils peuvent tre n anmoins utiles pour assister le processus d indexation seg mentation automatique en plans reconnaissance du langage parl reconnaissance de visages et de grosseurs de plan ou celui de recherche recherche d images par similarit graphique De plus en plus nombreux sont les chercheurs qui proposent m me pour des applications pr cises d extraire des documents des caract ristiques s mantiques de plus haut niveau pourvu qu ils puissent utiliser des connaissances a priori Car00 Ven02 Mais aucun ne peut encore tre en mesure de rivaliser
346. les d analyse standard documentaire un champ pour ce qui se passe Quoi un champ pour les personnes qui interviennent Qui un pour les lieux OU etc A VINA dans le cadre d une exploitation dite th matis e o des corpus de documents ou s quences sont constitu s afin de traiter d un sujet d un v nement ou d une personne particuli re on a essay de complexifier la structure des index traditionnels en introduisant des types de descripteurs qui en tant accol s des descripteurs dont il pr cisent la cat gorie permettent en quelque sorte de structurer les champs d index en sous champs DET pour les th mes du segment documentaire DEL pour les lieux o se d roule l action DEI pour des descripteurs relatifs 4 la construction des images DSO pour les descripteurs li s 4 la bande sonore Ainsi notre exemple pourrait tre d crit par les descripteurs pr sent s dans le tableau 1 5 On peut par cons quent commencer raffiner les requ tes en se focalisant sur un aspect particulier tout en tant stir que les descriptions contraintes par le formulaire seront correcte 29 Chapitre 1 La description des documents audiovisuels dans les processus documentaires DET maladie bleue DET st nose DET c ur DEL bureau DEI animation DSO interview TAB 1 5 Structuration d un ensemble de descripteurs ment utilis es par le syst mel On a donc une s
347. lopping a Re Usable Ontology for Medecine IEEE Transactions on Information Technology in BioMedecine 4 2 1999 218 SAA T99 SCHREIBER G AKKERMANS H ANJEWIERDEN A DE HOOG R SHADBOLT N VAN DE VELDE W et WIELINGA B Knowledge Engineering and Management The CommonKADS Methodology MIT Press Cambridge Massachusetts 1999 Sal97 SALVAT E Raisonner avec des op rations de graphes Graphes conceptuels et r gles d inf rences Th se de doctorat Universit Montpellier II 1997 SBC 02 SCHREIBER A T BLOK I CARLIER D VAN GENT W HOKSTAM J et Roos U A Mini Experiment in Semantic Annotation In International Semantic Web Conference ISWC 2002 Sardinia Italia 2002 SCB 04 SAGGION H CUNNINGHAM H BONTCHEVA K MAYNARD D HAMZA O et WILKS Y Multimedia indexing through multi source and multi language infor mation extraction the MUMIS project Data and Knowledge Engineering 48 2 2004 SCC03 STOCKINGER P CHALLULAU H et COUROUNET P Evaluation de l environnement OPALES Rapport technique Rapport WP5 du projet OPALES Maison des Sciences de VHomme 2003 SDWW01 SCHREIBER A TH DUBBELDAM B WIELEMAKER J et WIELINGA B Ontology Based Photo Annotation IEEE Intelligent Systems 16 3 2001 SEA 02 SURE Y ERDMANN M ANGELE J STAAB S STUDER R et WENKE D On toEdit Collaborative Ontology Development for the Semantic Web In International Semantic Web Conference
348. lowing ones planes trains cars ferries motorbikes and ships There are no other kinds of transport In fact customers are usually interested in the kind of planes that they will fly on Is it a Boeing or is it an Airbus Furthermore they are even interested in the specific model of the plane in which they will fly a Boeing 717 or a Boeing 777 Concerning hotels the agency recommends in all the cities hotels and Bed and Breakfasts Hotels rank from 1 star hotels to 5 star hotels and each hotel belongs to one of these five categories For all of them the agency knows their facilities address telephone number URL capacity number of rooms available rooms descriptions dogs allowed distance to the beach distance to skiing etc The agency also knows the facilities of the rooms number of beds rates TV available Internet connection etc Fic 5 9 Extraits du texte donn pour la sp cification des ontologies EON En l occurrence le texte pr sentant les besoins de l application est en fait assez court mais peut donner lieu un travail de conceptualisation suffisamment riche pour tester les possibilit s des diteurs en mati re de repr sentation ontologique Des entit s comme Reservation ou Means Of Transport admettent de nombreuses sp cialisations ou impliquent l existence de multiples liens entre les individus du domaine mod lis Avec V ronique Malais nous avons pu constater comment la structuration ind
349. m canismes pour rapprocher les index des requ tes chaque fois que cela est possible Ceci implique de pouvoir sp cifier un maximum de connaissances de raisonnement pertinentes pour le domaine cibl par l application 37 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV Dans un cadre informatique l intelligence artificielle apporte des techniques de repr senta tion des connaissances RC permettant la cr ation de langages formels appliqu s 4 des domaines d application pr cis Articul s des processus d acquisition des connaissances coh rents ALR96 ils permettent d obtenir des syst mes base de connaissances SBC intelligibles dont le compor tement on va le voir r pond aux fonctionnalit s que nous avons d gag es Depuis assez longtemps une partie des travaux de l intelligence artificielle reprenant les termes introduits par Newell dans New82 repose en effet sur la distinction entre le niveau symbolique qui est celui de l impl mentation formelle des programmes et celui des connaissances manipul es par des agents rationnels Selon ces approches on se reportera SAAT99 pour un exemple complet il est possible et souhaitable de caract riser les syst mes comportements observables entit s repr sent es en termes des connaissances manipul es par les experts de leur domaine d application Le vocabulaire les m canismes de traitement des donn es etc sont d
350. mme on l a vu dans le chapitre 2 comprennent la sp cification des types de 3 Voir par exemple l ensemble des exp rimentations r alis es dans le cadre du mill sime 2003 de l atelier EON Evaluation of Ontology Tools http CEUR WS org Vo1 87 134 4 3 Prescrire une mani re de construire les notions ontologiques concepts et de relations des liens de subsomption entre ces types des domaines et co domaines des relations ainsi que des marqueurs individuels instanciant les types de concepts Toutes ces possibilit s font partie des fonctionnalit s de DOE comme nous l avons vu Et un export des sp cifications de l ontologie formelle en CGXML comme illustr par le code 2 1 de la page 48 permettait d obtenir facilement les ontologies computationnelles recherch es Cependant il est apparu tr s rapidement que pour une exploitation correcte des index conceptuels il fallait tenir compte de connaissances de raisonnement qui correspondaient une extension du mod le minimal des GC les r gles de raisonnement Sal97 Il aurait donc fallu cr er une interface de saisie de telles r gles L existence d un outil comme TooCom nous d livre d un tel fardeau puisqu il permet d importer notre ontologie en CGXML et de la compl ter l aide des r gles pertinentes pour nos applications DOE g re l export de ses ontologies r f rentielles dans les m ta langages de repr sentation les plus couramment rencontr s d
351. mple le flux de diffusion produit par une cha ne peut tre vu comme un type de discours parfois publicitaire que le public vis doit tre en mesure de comprendre ou au moins d assimiler Viennent ensuite l archivage et la r utilisation comment conserver les documents Comment les r utiliser de mani re pertinente L INA de par les missions qui lui ont t donn es doit consid rer ces probl mes d un point de vue archivistique ce qui impose une r flexion sur le sens de la conservation du document En plus de r gler la d licate question du stockage mat riel il faut en effet organiser l acc s aux documents stock s que ce soit en consid rant leur valeur intrins que de documents t moins ou leur possible commercialisation en tant qu l ments ins rer dans de Par contexte applicatif nous d signons l ensemble parfois tr s vague des pratiques utilisateurs et outils que l on rencontre autour d une application r elle 11 Chapitre 1 La description des documents audiovisuels dans les processus documentaires nouveaux programmes Contrairement ce qu on pourrait penser cette complexit qu on reconna t l analyse du document audiovisuel n est pas propre la mission de PINA qui doit g rer de larges fonds avec le double objectif d une exploitation commerciale fine et de l ex cution d une mission de service public d finie par un cadre l gal pr cis D p t
352. mplets et que les significations des primitives soient plus explicites et mieux int gr es dans le SBC Pour cela on doit d abord savoir ce qu il faut introduire dans les ontologies pour qu elles fonctionnent comme des sp cifications convenables Peut on clarifier ces notions d abstraction de conceptualisation de sp cification en accord avec les besoins que nous avons d gag s Comme le signale Nicola Guarino dans GG95 ou Gua98a le premier des probl mes est qu il existe au moins deux d finitions d une conceptualisation qui si elles sont antagonistes restent toutes deux utilisables dans l nonc de Gruber Le premier sens du terme renvoie pour un domaine donn l ensemble des objets concepts et autres entit s dont on affirme l existence dans un un cadre donn ainsi que des relations qui existent entre eux En d autres termes une conceptualisation est une vue abstraite et simplifi e du monde que nous voulons repr senter pour un but donn Ces citations extraites de Gru95 montrent que l on se pr occupe bien ici de mod lisation mais d une mod lisation du monde en tant que configuration particuli re d objets et non de celle d un domaine suppos e s appliquer toutes les configurations possibles Le probl me vient du fait que la d finition nonc e par Gruber ne se pr occupe que d extension elle consid re directement les objets du monde auxquels elle attribue des propri
353. n Nous avons montr qu il tait envisageable de trouver une solution aux trois probl mes fonc tionnels d gag s dans le chapitre pr c dent On peut effectivement cr er des syst mes documen taires o les index et les traitements qui leur sont appliqu s seront sp cifi s au niveau de la connaissance De fait les techniques de repr sentation des connaissances permettent de cr er des descriptions structur es des langages de repr sentation mobilisant la fois concepts et relations sont utilis s pour rendre compte de la complexit du contenu documentaire Comme dans les syst mes documentaires classiques il est possible et m me souhaitable de munir de tels langages de repr sentation d un vocabulaire d di l application que l on envisage Dans le cadre des SBC on a vu que ces vocabulaires sont cr s dans ce que l on appelle des ontologies A la mani re des thesauri celles ci introduisent les notions servant la description tout en guidant leur inter pr tation On peut alors envisager l instauration d une continuit s mantique dans les processus documentaires et cela deux titres Tout d abord nous avons constat que les ontologies sont des sp cifications plus contraintes que ne le sont les thesauri Les m ta langages qui permettent leur cr ation utilisent en effet des http cogitant sourceforge net 70 2 5 Conclusion OPALES 2 6 040617 Session ouverte pour eau point de vue au
354. n nement qui distingue le plus notre cadre applicatif de ceux que l on rencontre traditionnellement surtout dans le domaine du web s mantique De nombreuses applications concentr es sur la seule cr ation des descriptions conceptuelles et l acc s leur contenu sans plus de formalit s peuvent ne pas demander de raisonnement du tout Et beaucoup d autres pr f rant faire le choix de la simplicit mais aussi des performances de leurs syst mes et n utiliseront que des formes l mentaires d inf rence comme celle du raisonnement hi rarchique que l on peut d j trouver dans certains syst mes base de thesauri Cependant la situation volue relativement rapide ment et avec la popularisation de langages suffisamment expressifs comme OWL la communaut red couvre les joies du raisonnement formel complexe comme l ment fondamental d un syst me base de connaissances Et d montre que les solutions actuelles du web s mantique ne sont pas suffisamment compl tes en particulier parce qu elles n autorisent pas assez de fonctionnalit s de raisonnement exploitant correctement les relations D ot l engouement actuel pour les langages et outils de repr sentations de r gles plus g n riques Bien que l indexation du document audiovisuel ait fourni le cadre de r f rence de nos tra vaux on peut donc envisager de r utiliser nos propositions dans d autres contextes I semble tout d abord extr mement n
355. n BECHHOFER Describing and Classifying Multimedia using the Description Logic GRAIL In SPIE Conference on Storage and Retrieval of Still Image and Video IV San Jose 1996 211 Bibliographie GHJV95 GAMMA E HELM R JOHNSON R et VLISSIDES J Design Patterns Elements of Reusable Object Oriented Software Addison Wesley 1995 GHVD03 Grosor B N Horrocks I VOLZ R et DECKER S Description Logic Pro G104 GLO2 Gom99 GM03 IGMV99 GPS99 Gru93 Gru95 GS93 GS98 Gua92 Gua95 Gua98a Gua98bl GW00a 212 grams Combining Logic Programs with Description Logic In Twelfth International World Wide Web Conference WWW2003 Budapest Hungary 2003 GOLBREICH C et IMAI A Combining SWRL rules and OWL ontologies with Prot g OWL Plugin Jess and Racer In 7th International Prot g Conference Bethesda Maryland 2004 GRAVES A et LALMAS M Video Retrieval using an MPEG 7 Based Inference Network In ACM SIGIR Conference on Research and Development in Information Retrieval Tampere Finland 2002 GOMEZ PEREZ A D veloppements r cents en mati re de conception de maintenance et d utilisation des ontologies Terminologies Nouvelles 19 1999 GANGEMI A et MIKA P Understanding the Semantic Web through Descriptions and Situations In International Conference on Ontologies Databases and Applications of Semantics ODBASE 03 Catania Italy 2003
356. n hypoth tique contenu objectif l indexation s int resse la signification de ce contenu dans un cadre applicatif pr cis L indexation se d compose de mani re traditionnelle en analyse et reformulation L indexeur doit tout d abord isoler les l ments pertinents du contenu du document puis condenser ces informations sous la forme d une description adapt e au syst me documentaire Dans le cas des syst mes textuels l usage le plus courant est le recours aux mots clefs les aspects du document reconnus comme int ressants sont alors identifi s par une liste de mots issus du langage naturel Leur choix toujours d licat d pend troitement du savoir faire documentaire de celui qui indexe ainsi que de sa connaissance de l exploitation future de l index et du document auquel il se rapporte Les indexations des documents audiovisuels Dans le cas des documents audiovisuels de VINA la cr ation des index ob it des mod les de description issus de l observation experte des besoins exprim s par les clients utilisateurs et de l anticipation des requ tes auxquelles pourraient r pondre les documents Pic96 Ces besoins d gag s on l a d j voqu concernent tout d abord le contenu proprement dit du document ce dont il traite L indexation de contenu est cens e r pondre aux interrogations classiques structu rant l analyse documentaire Wal99 Qui Quoi OU Quand Pourquoi Pour un but relativemen
357. n ne seront donc pas n cessairement expliciter pour notre application Par exemple savoir qu un document donn joue le r le de programme diffus dans une s quence d v nements de diffusion est relativement inutile pour nous On pr f rera plut t des propri t s simples permettant de relier directement le programme sa date de diffusion sa mesure d audience etc Le patron sp cialis ne correspond donc pas ce qui est effectivement demand pour l indexation Qui plus est cette lacune est surtout visible au niveau relationnel puisque d une part les chemins relationnels qui sont propos s sont plus longs que ceux dont on a besoin et d autre part le niveau lui m me auquel sont donn es ces relations est tr s abstrait On risque donc de complexifier la t che des futurs utilisateurs et ce sur le point m me qui rendait les solutions ontologiques int ressantes par rapport aux solutions d indexation classiques broadcastRelation hasBroadcaster Channel Live thematicRelation rome rein hasTheme shows Entities refersTo Productor productionRelation Zoom hasAuthor hasFilmingFeature Sequence isPartOf Fic 4 7 Patron de description d un document audiovisuel On peut en fait se demander si les consid rations qui guident les patrons ontologiques en se concentrant sur la coh rence au service de la r utilisabilit ne sont pas biais es par importance trop grande qu elles
358. n peut indiquer qu Interview sp cialise Sequence comme le montre le code CGXML 2 2 qui utilise les balises order Par la suite un sommet conceptuel de type inter view et de marqueur donn sera consid r comme une sp cialisation d un sommet de marqueur 97 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV lt conceptTypes gt Eiss lt ctype id id 101240791089724631510498354554 label Sequence gt lt ctype id id 101240791089724631510498312578 label Interview gt lt ctype id id 101240791089724631510348203210 label Personne gt lt ctype id id 101240791089724631510498354554 label Sequence gt lt ctype id id 101240791089724631510498398264 label 0bjetAV gt Feed lt order idi id 101240791089724631510498312578 id2 id 1012407910897 24631510498354554 gt lt order idi id 101240791089724631510498354554 id2 id 1012407910897 24631510498398264 gt lt conceptTypes gt lt relationTypes gt Cost lt rtype id id 101240791089645147127985121078 label relationDescriptionContenu gt lt rtype id id 101240791089645150322641047820 label represente gt lt rtype id id 101240791089645150322641047820 label participe idSignature id 101240791089724631510348203210 id 101240791089724631510498398264 gt aes lt order idi id 101240791089645150322641047820 id2 id 101240791089645147127985121078 gt lt relationTypes gt CODE 2 2 Sp cifications formelles dans
359. nalit et son archivage impose une grille d interpr tation particuli re en fonction de l usage de l archive F1G 1 2 Une s quence la signification obscure Un corollaire ce probl me est celui de la d termination d une unit signifiante l mentaire quelle est la partie de l objet audiovisuel que l on juge int ressante L image anim e propose bien des unit s documentaires r sultant de son d coupage temporel mais elle n en prescrit pas une particuli re comme vecteur de sens autonome Telle analyse pr f rera se concentrer sur le plan unit la plus objective Tur98 telle autre privil giera la sc ne Il est tr s d licat d effectuer en toute g n ralit un traitement documentaire un niveau de granularit plus fin que celui du document dans son ensemble Il faut nouveau prendre en compte le contexte de production par exemple le genre du document et d utilisation quelles sont les unit s qui sont couramment recherch es et ou r utilis es par ceux qui acc dent au fonds documentaire afin de localiser les unit s dont la signification nous int resse 31 s agit ici d un contexte interpr tatif normatif compos par le r seau des similarit s et des diff rences de sens que pr sentent les unit s lexicales signifiantes C est un tel contexte qui fait d faut aux l ments signifiants de l audiovisuel N anmoins dans le cas de l audiovisuel comme d autres formes documentaires
360. nception de ressources conceptuelles d ontologies apportant le vocabulaire d un lan gage d indexation formalis l utilisation de ces ressources pour la cr ation d index formant une base de connaissances l exploitation des index pour les recherches les l ments du vocabulaire doivent tre as soci s des connaissances de raisonnement utilisables par des outils d inf rences pour am liorer les performances du syst me 3 D roulement de la th se 3 1 Cheminement de notre recherche Le projet OPALES Pour parvenir accorder les nouvelles techniques avec les usages existants ou pressentis PINA m ne une r flexion s appuyant la fois sur sa connaissance des pratiques documentaires sur des travaux fondamentaux ainsi que sur des projets exp rimentaux L un de ceux ci OPALES a eu pour objectif la construction d outils informatiques pour l indexation et la recherche docu mentaires de contenus audiovisuels dans le cadre de communaut s de pratiques extr mement pr cises En l occurrence pour son valuation il a t retenu deux points de vue l exploitation des documents scientifiques con us dans le contexte de l ethnologie en par ticulier ceux qui concernent la petite enfance gt On verra dans le chapitre 2 une d finition pr cise de ces objets SOPALES Outils pour des Portails AudiovisueLs Educatifs et Scientifiques est un projet PRIAMM Autour de VINA qui en a assur la c
361. ncepts par conditions n ces saires et suffisantes avec des combinaisons bool ennes ou encore par l expression de contraintes relationnelles n est en effet pas propos e D autres outils comme Prot g ou OilEd pouvant assurer le support de telles fonctionnalit s nous pr f rons recourir des m canismes d exports adapt s plut t que de refaire ce qui est tr s bien pris en compte ailleurs I en va de m me pour les axiomes qui s appliquent aux relations qu ils soient simples sym trie r flexivit ou plus complexes r gles de composition Pour cela on peut utiliser un outil comme TooCom d velopp par Fr d ric F rst Fiir04 Cet outil en plus de permettre l dition intuitive des r gles exprimables dans le formalisme des GC permet les diff rents types d op rationnalisation que nous avons pr sent s en page 127 Ce genre de co op ration entre outils d dition s inscrit tout fait dans l optique du web S mantique chacun s effor ant de r aliser correctement ce qu il fait de mieux et de le communiquer du mieux possible aux outils les plus pertinents pour ce qu il ne sait pas faire Une telle opportunit aurait d ailleurs pu arriver dans le cadre du projet OPALES lorsque le projet a t lanc il tait convenu que notre diteur permettrait l dition d ontologies dont le niveau d expressivit correspondrait celui des supports classiques de GC En l occurrence ces supports co
362. ncrets des objets temporels des propri t s etc 164 5 2 Exp rimentations ontologiques Differential Ontology Editor Petite Enfance File Edit Metadata Language Differential Ontology Referential Ontology Tree Browser Concept Relation AnyConcept Substance ObjetAbstrait Q ObjetConcret ObjetSpatial C Objetindenombrable Q ObjetDenombrable EntiteSpatiale g ObjetNonAnime Q Entit Vivante Entit Animale CollectionAnimal M GroupeHumain GroupeAnimal Q Animalindividuel Personne Q PersonneDefParAge Nouveau n B h PetitEnfant Enfant Adolescent Adulte PersonneAgee PersonneDefParSexe AnimalNonHumain Entit v g tale ObjetSpatialPartie Individu Q Collection Collectifinanime M CollectionAnimal Collectionvegetal OhjetTemporel Activit Action C Pratique ElementDescription Personne Underlying Differential Notion Parent Entities Animalindnduel Protagoniste Instance List Fic 5 3 Hi rarchie de concepts issue de l ontologie petite enfance L tiquette M sur un concept indique un cas d h ritage multiple 165 Chapitre 5 Exp rimentations et discussions Il faut noter tout de m me que ceci r sulte moins de crit res de construction ontologique rigoureux que d un choix caract ristique de conception en fonction de l a
363. nctionnement dans le cadre d une indexation demandant une certaine forme de contr le ditorial implique de savoir comment utiliser le vocabulaire ontologique pour cr er des index Les patrons d indexation apportent une r ponse tangible cette premi re question de comp tence en compl ment de l ontologie ils 105 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques prescrivent une mani re de produire facilement des indexations pertinentes et coh rentes 3 3 3 Utilisation des patrons d indexation et raisonnement L int r t des patrons va cependant au del de la simple cr ation des index Dans un SBC d indexation et de recherche en effet on utilise des m canismes d inf rence formelle dont l objectif est de r pondre une deuxi me question de comp tence comment trouver des r sultats pour les requ tes pos es aux syst mes On a vu au chapitre 2 que l enjeu est alors de rapprocher les requ tes des connaissances dont on dispose dans la BC c est dire des index Le point pr cis que nous voulons souligner ici est que les connaissances de raisonnement proches des patrons d indexation sont particuli rement importantes dans ce cadre L emploi de ces patrons est en effet li une certaine forme de standardisation de l indexa tion standardisation qui s inscrit bien dans le cadre d j abord de la continuit s mantique puisqu en rapprochant les index d un mod le per
364. ncy et nous m mes IT04 illustrent un tel agencement Q HomogeneousProgram ShortProgram InterProgram PromotionTrailer Interlude RegularProgramming ShortinformationProgram ShortEntertainmentProgram Q LongProgram EducationalProgram Q Fiction Q SingleFiction ShortFiction C LongFiction Seriallnstallment Shortinstallment InstallmentsithAnimatedCharacter Q InstallmentvVithRealCharacter Sitcom Soap Q Longlnstallment RecurrentTelefilm SeveralPartsFiction Q SimplelnformationProgram Q Documentary Q Retrospective Portrait Narrative S CinernaNews Fic 2 7 Hi rarchie de concepts issue d une ontologie pour l audiovisuel extrait de IT04 P Cependant dans le cadre de langages de RC formels l interpr tation de ces liens de sp cia MPlus de d tails seront donn s en section 5 2 3 59 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV contentDescriptionRelation R hasTopic represents Q showsInScene_denote R showsinScreen R showsinAudioFrame referentes showsOffScreen_sound F showsSilent Q representsOff8cene R pseudoRepresentsByDiegeticRecreation R representsByAbstraction R representsBySymbol R representsByRepresentation R representsByExemple R hasTextualSummary R hasRepresentedLocation R diegeticRelation Fic 2 8 Hi rarchie de relations conceptuelles issues d une ontologie
365. nd Florida 2003 Hou C S J Noy N F et MUSEN M A A Template Based Approach Toward Acquisition of Logical Sentences In Intelligent Information Processing 2002 World Computer Congress Montr al Canada 2002 Horrocks I Using an Expressive Description Logic FaCT or Fiction In 6th International Conference on Principles of Knowledge Representation and Reasoning KR 98 Trento Italy 1998 Horrocks I et PATEL SCHNEIDER P F A Proposal for an OWL Rules Lan guage In Proceedings of the Thirteenth International World Wide Web Conference WWW2004 New York City 2004 ACM Press HPB 04 Horrocks I PATEL SCHNEIDER P F BOLEY H TABET S GROSOF B et DEAN HPv03 HS03a HS03b HSV04 M SWRL A Semantic Web Rule Language Combining OWL and RuleML online may 2004 HORROCKS I PATEL SCHNEIDER P F et VAN HARMELEN F From SHIQ and RDF to OWL The Making of a Web Ontology Language Journal of Web Semantics 1 1 2003 HANDSCHUH S et STAAB S Annotation of the Shallow and the Deep Web In HANDSCHUH S et STAAB S diteurs Annotation for the Semantic Web IOS Press Amsterdam 2003 Hu B et SHADBOLT N Visualising a DL Knowledge Base with DeLogViz In Poster Session of the 2003 International Workshop on Description Logics DL 2008 Rome Italy 2003 HYV NEN E SAARELA S et VILJANEN K Application of Ontology Techniques to View Based Semantic Search and Browsing In Proceedings o
366. ne peut garantir la pertinence des r sultats obtenus en termes d intelligibilit dans des cas applicatifs pr cis Pour des terminologies li es un domaine pr cis SNOMED dans le cas de CM01 l int r t est plus vident mais la donn e de tous ces termes ne prescrit une interpr tation pr cise que si celui qui acc de une telle ontologie ma trise d j le r f rentiel terminologique utilis CorpusPE pr sente des a Jeczema 2 Soyons clair la peau de votre enfant sauf si ue z H z hy 495 plaques d elle pr sente des plaques d urticaire eczema est hyperonyme de ne Zn a besoin que est hyperonyme de est paradigme de Les Whiting ont tabli l Universit de Nairobi PRE CorpusPE messes S BER 2 au Kenya un mstitut de recherche devenu FS 647 educational e of educational research BER quia jesthyperonymede oe Z permis de former une quantit de chercheurs fuu z roK aussi bien aficains qu am ncams Co uPE n cessitent une inter a Tous ces cas n cessitent une approche fu z 5 a 726 approche Les qi et de psychologe inter est hyperonyme de 7 ethnologique et de Z culturelle fuu z roK C est cette poque que s enracine dans l uz CorpusPE 927 a cae la individu la morale du bien faire faire ce que la Festhyperonyme de FS mre veut voire du trop bien faire si la pression TE TOK Z ental est trop forte En l occurence les femmes
367. nelles d inspiration m tier On conna t galement le niveau auquel sont donn s les concepts et les relations du patron de conception Celui ci vise en effet la conceptualisation d un usage relativement pr cis mais ind pendamment d un domaine concret On trouvera donc des notions issues d une ontologie de haut niveau marqu es par une connotation fonctionnelle qui renvoie aux raisons de la pr sence des notions dans le patron qui les a s lectionn es 146 4 4 Ing nierie ontologique et patrons d indexation Parameter e Course of Events Perdurant PATRON DE CONCEPTION age a AVParameter AVRole AVCourseOfEvents Des Endurant AVAction PATRON D UTILISATION NOYAU Channel Live Daily Theme related Entities ae TS PATRON D UTILISATION APPLICATIF Productor Zoom EX sn Fic 4 8 Encha nement des patrons ontologiques 147 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique Le patron noyau lui r sulte d un passage au domaine par rapport au PC Cependant il ne doit y avoir gu re plus que cela puisqu on reste au niveau de l ontologie noyau du domaine Concepts et relations ont donc toujours un parfum fonctionnel m me s ils sont dor navant ancr s dans le domaine Si on reprend l exemple de la petite enfance du chapitre 3 on a vu que le patron d indexation u
368. nieParFonction Diff ren vec le rer rere paren fa Fic 3 6 Utilisation de l diteur d ontologies pour la cr ation d un GC index dans OPALES 90 8 8 Assister la formulation des descriptions introduits par l ontologie Celle ci fait d sormais sens dans toutes les acceptions de cette expres sion 3 3 Assister la formulation des descriptions Et pourtant acc der 4 une signification intelligible des l ments de la description ne suffit pas garantir une indexation qui r ponde tous nos crit res de pertinence Nous avons en effet pour assurer la continuit s mantique besoin d une certaine coh rence des index la fois entre eux et avec les besoins applicatifs Or si elle donne un contexte d interpr tation satisfaisant pour les notions de l ontologie l ontologie diff rentielle ne suffit pas recr er un contexte d emploi suffisamment pr cis En d autres termes elle permet de contr ler l interpr tation des index mais elle ne prescrit pas d utilisation particuli re en mati re de conception de connaissances structu r es Cela peut se r v ler g nant pour le cr ateur des index d autant plus qu ici la reformulation des contenus doit aboutir un r sultat plus complexe que celui d une indexation classique Indirectement pourtant les ontologies ont une incidence sur la forme des index r alis s via les sp cifications formelles qui permettent de contr ler la structure
369. ns formul es en des termes m tiers d ing nierie logicielle dans un cadre ontologique Par exemple on peut supposer que la relation d affinage entre un patron ontolo 198 5 4 Conclusion gique A et un patron ontologique B correspondrait une sp cialisation entre A et B le patron le plus raffin sp cialisant celui qui l est le moins Ensuite il faudrait voir si de nouvelles relations possiblement sp cifiques au cadre ontologique peuvent tre introduites Si la relation d affinage peut se traduire par une implication logique entre deux patrons cette implication peut de son c t correspondre un lien plus g n ral ainsi la relation d utilisation semble galement pouvoir s exprimer en termes d implication puisqu elle induit l inclusion d un patron dans un autre Il resterait donc d terminer ce quoi peut correspondre exactement la relation de sp cialisation entre patrons ontologiques Enfin il serait int ressant de proposer des outils per mettant d assister la gestion de telles biblioth ques en particulier pour l utilisateur qui cherche cr er de nouveaux patrons interfaces formats de publication m canismes de partage 5 4 Conclusion Ce chapitre vient donc de restituer leur contexte exp rimental aux multiples exemples dont nous avons maill le d but de cette th se En effet les r flexions m thodogiques que nous avons pr sent es dans les chapitres pr
370. ns dans la base de faits constitu e par les index Nous allons voir pr sent comment l utilisation de telles capacit s de raisonnement est tout fait pertinente pour un SBC vocation documentaire 2 3 2 Inf rence continuit s mantique et pertinence d un SBC Un cadre formel pour une assistance plus pr cise et plus riche la recherche d in formation On a vu dans le chapitre 1 qu un syst me documentaire devait proposer des fonctionnalit s de manipulation des index permettant l assistance la recherche des informations ou des segments documentaires pertinents notre item F3 de la page 35 En particulier il serait int ressant que le syst me prenne en charge une partie des reformulations dont on a vu dans ce m me chapitre 1 qu elles taient souvent n cessaires la recherche des index Les indexeurs ne peuvent en effet anticiper tous les besoins venir et cr ent des index qui parfois ne contiennent qu implicitement les informations n cessaires au traitement correct des requ tes Ceux qui effectuent les recherches sont alors oblig s de reformuler les requ tes pour tenir compte de ces lacunes On peut faire remarquer que ces traitements peuvent tre consid r s comme s inscrivant dans le cadre de la 16Guizzardi dans une classification comparable utilise les termes de consolidation et de d rivation pour ca ract riser les r gles de raisonnement introduites dans une ontologie suivant que ces r gles
371. nsion au moins se pr occupe t on de degr s de d finition plus abstraits que celui de l num ration d objets Pour Guarino une conceptualisation associe un vocabulaire de description un ensemble de mondes possibles de configurations Et sp cifier une conceptualisation c est donner un ensemble d axiomes permettant de contraindre l utilisation du vocabulaire pour une conceptualisation donn e on va exclure les descriptions incoh rentes et par cons quent les mondes impossibles en tout cas du point de vue de l application informatique consid r e Apparait alors une autre difficult En effet si pour Guarino une ontologie doit rendre compte de la mani re dont l utilisation d un vocabulaire peut tre en accord avec une conceptualisation on parle alors d engagement ontologique il indique aussi que cela n est pas enti rement possible En effet il montre dans Gua98a 1 qu une conceptualisation ne peut tre appr hend e que partiellement via l interpr tation 51 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV des contraintes qui ne sont pas des d finitions qu elle exerce sur les diff rentes structures valides du monde de l application structures auxquelles Guarino fait r f rence en tant que mod les 1 repr sentables en utilisant un vocabulaire donn 2 qu une ontologie qui pour Guarino consiste en la donn e d une th orie logique finie sa
372. nt Un utilisateur doit lire un document trouver de quoi il parle et voir en quoi il peut tre utile pour son application 13 Chapitre 1 La description des documents audiovisuels dans les processus documentaires Toute la difficult dans la situation de l audiovisuel vient du fait que le document audiovisuel ne repose pas sur un syst me d assignation arbitraire de sens comme le texte Les l ments signifiants d une image ou d une piste sonore l exception des l ments pr sentant du texte crit ou oral n ont pas de rapport pr d termin a leur signification Bruno Bachimont affirme que d un point de vue s miotique l image est un signe qui montre quelque chose et non un signe qui signifie quelque chose Bac98 Il s agit plus d une relation analogique avec la r alit on a affaire des formes perceptives qui sont susceptibles de recevoir toutes les significations que pourra leur donner l exp rience humaine et non des formes symboliques qui comme les mots ont un ou plusieurs sens propos s et articul s dans un syst me puis ren goci s en contexte Par exemple l o un lecteur verra dans la s quence illustr e en figure 1 2 une s quence longue et creuse pr sentant un fauteuil vide plut t quelconque un autre pourra lire une allusion perfide la vacance du pouvoir Tout d pend en fait du contexte de la lecture de l image sa production et sa diffusion lui donnent une premi re fi
373. nt celles qui re l vent de la description du contenu surtout si celle ci se pr sentant alors comme une indexation est effectu e en fonction des besoins d gag s par la communaut qui utilise les documents Num risation audiovisuel et indexation automatique Ce survol de l activit d indexation des documents audiovisuels montre bien qu il s agit d un processus qui requiert une interpr tation fine s appuyant sur une lecture approfondie des dits documents Par cons quent les moyens mis en uvre doivent tre cons quents tant en ce qui concerne leur qualit que leur quantit Indexer un niveau correct revient cher et de nombreuses personnes se demandent s il n est pas possible l heure o de plus en plus de t ches semblent 19 Chapitre 1 La description des documents audiovisuels dans les processus documentaires pouvoir tre automatis es de faire accomplir tout ou partie du processus d indexation par des logiciels Dans le cadre de la convergence num rique savoir celui de l insertion des moyens informa tiques dans toutes les t ches de la cha ne documentaire de la production l archivage on esp re lever bien des probl mes en faisant manipuler le document audiovisuel par les ordinateurs Cela n est cependant pas encore applicable au probl me sp cifique de l indexation En l tat actuel des connaissances et des syst mes il est en effet extr mement difficile de faire en sorte que
374. nt repr sent es Mais si les chercheurs en ing nierie des connaissances semblaient d accord pour adopter en la mati re une d finition et des objectifs compatibles avec l activit de construction de SBC encore fallait il trouver un consensus Apr s quelques h sitations une formule d finitoire a fini par tre largement utilis e il s agit de celle nonc e par Thomas Gruber dans Gru93 et Gru95 une ontologie est une sp cification explicite d une conceptualisation Cet nonc reste cependant probl matique il faut en particulier savoir ce que l on entend exactement par conceptualisation et comme on le verra en section 2 3 1 cela ne se fait pas sans difficult Si la d finition de Gruber a t facilement reprise c est avant tout parce qu elle reste vague Pour pr ciser le sens de la notion d ontologie de mani re pratique Bruno Bachimont propose de repartir des besoins r els des syst mes de RC Comme pour les syst mes documentaires classiques on a effectivement besoin d un langage formel de repr sentation d di l application Dans le cas d un SBC il s agit de pr senter les concepts et relations permettant de d crire les cas de cr er une base de connaissances qui contient des assertions exploitables Ces langages on l a d j vu utilisent deux sortes de primitives les primitives logiques qui ont une signification fix e par une s mantique formelle ce sont les symb
375. ntenu s mantique lui m me Ce contenu s mantique on l a vu est pour les utilisateurs de Vontologie beaucoup plus li la mani re dont il est exprim dans le domaine qu sa formali sation A fortiori si cette formalisation s applique un niveau plus abstrait encore que celui de la sp cification traditionnelle des axiomes logiques traduisant les comportements et propri t s des objets du domaine Il faut donc toujours trouver un guide m thodologique capable d assister l utilisateur pour obtenir une organisation et une signification des primitives de connaissances qui correspondent l usage que l on veut en faire Nos exp rimentations montrent d ailleurs que l emploi de la m thode de Guarino est for tement d pendant de ce stade ant rieur de sp cification Nous avons en effet appliqu cette m thode deux des ontologies r alis es PINA pendant notre th se celle du cyclisme et de la petite enfance Ces ontologies tant d j con ues en accord avec les principes de mod lisa tion rigoureux que nous avons voqu s en section 3 2 2 et dont nous reparlerons par la suite elles n ont pas n cessit de corrections significatives en tout cas au regard des efforts engag s Mais cela tait justement d la rigueur de la normalisation s mantique dont elles b n ficiaient 10Les s quences d un programme ayant par exemple en commun d avoir fait l objet d un choix de montage guid par une motivation g
376. nts adapt s l application documentaire vis e Il en va de m me en RC Pour obtenir le statut de connaissance que de nombreuses d finitions introduisent comme celui d une information laquelle s ajoute un savoir relatif son utilisation dans un contexte pr cis les donn es doivent utiliser un vocabulaire un sch ma si l on veut faire une analogie avec les syst mes de gestion de bases de donn es relationnelles appropri En effet les SBC fonctionnent sur le principe que les donn es qu il manipulent et les traitements qu ils effectuent sont fid les une repr sentation th orique du domaine Cette repr sentation d finit un contexte qui permet d abstraire de l observation des situations rencontr es dans ce domaine des cas mod lis s exploitables par un syst me informatique La cerner le plus correctement possible puis la transposer en un ensemble de sp cifications utilisables pour conduire des calculs sont donc deux activit s importantes Elles constituent le c ur de ce que l on appelle l ing nierie des connaissances discipline qui mobilise tour tour comme on le verra dans les chapitres venir la linguistique la logique l informatique ou m me la philosophie afin de construire des SBC efficaces dans leur contexte applicatif Elle se concentre en particulier sur la conception des ontologies que nous avons d j plusieurs fois voqu es Les ontologies inspiration et objectifs Histor
377. nu du domaine d application Les som mets de nature relationnelle tiquet s par des relations permettent de faire le lien via les arcs du graphe entre ces individus comme les pr dicats d arit multiple rapprochent plusieurs objets en logique du premier ordre Par exemple un index de notre mission cf page 29 pourra tre le graphe repr sent en figure 2 4 oe ae Se ET oS Le TK Emission ns Se aPourTrait N z te F nate F contient Interview DessinAnim repr sente emission_decrite Se y Saillant 7 7 ao Y if Be ik aPour N ar A N a Participant 3 C voque 9 explique St nose v v Bog a AN cme Lleeeratale Miel ee lt cause F4 Fonctionnement Se Su Lo abe Y objet l Coeur Fic 2 4 Repr sentation d un index sous forme de graphe conceptuel Le marqueur d note un individu ind termin rapprochable des variables introduites en logique du premier ordre par le quantificateur existentiel 3 Un graphe conceptuel stricto sensu est tourn vers la description de cas particuliers observ s dans le monde applicatif et non vers la d finition des notions g n rales qui sont employ es pour d crire ces cas Les diff rents types de concepts et les relations disponibles pour la cr ation d un graphe ainsi que l ensemble des marqueurs individuels apparaissent part dans ce que
378. o s es refl ter les formes universelles que la pens e peut attribuer ses objets En d autres termes il s agit de recenser un certain nombre de m ta propri t s fondamentales pour notre compr hension des choses En s appuyant sur des consid rations philosophiques relatives aux modalit s d existence des entit s du monde on construit ainsi une typologie des propri t s r les types cf GWO00a qui peuvent appara tre dans une ontologie et d noncer des r gles s appliquant la relation de subsomption entre les instances de ces classes de propri t s C est la donn e pour une ontologie en cours de construction des relations d instanciation entre propri t s les concepts de l ontologie et m ta propri t s qui va permettre de v rifier que les r gles de subsomption ne sont pas viol es et de corriger ventuellement la hi rarchie tablie pr c demment Par exemple Guarino a recours la notion de rigidit une propri t est essentielle pour une de ses instances si et seulement si elle est applicable cette instance dans toutes les situations possibles et une propri t est rigide si et seulement si elle est essentielle pour toutes ses instances Une propri t est par contre anti rigide si et seulement si elle n est n cessaire pour aucune de ses instances son attribution n est que possible Guarino pr sente les exemples de la propri t Personne qui est rigide et de la propri
379. odalit s interpr tatives non formelles rencontr es dans le domaine m tier Une fois encore nous pouvons utiliser les solutions propos es par Bruno Bachimont On a vu dans le chapitre 3 page 88 qu il tait possible de normaliser la signification des notions au moyen du langage de fa on ce que ces notions s inscrivent dans un r seau interpr table de mani re la fois pr cise et naturelle Cette solution peut tre reprise dans un cadre m tho dologique plus vaste compatible avec d autres propositions BIT02 Bac04a Nous rappellerons tout d abord quels sont les enjeux de cette m thode de l licitation de candidats concepts Vobtention d ontologies op rationnelles Nous expliquerons ensuite comment le parcours des so lutions techniques existantes nous a convaincu pour OPALES d impl menter cette m thodologie par la r alisation d un outil adapt compl mentaires des autres environnements de conception ontologiques DOE 123 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique 4 3 1 ARCHONTE un processus de conception d ontologies r gionales Pour concilier les deux aspects souvent exclusifs de la conception des ontologies le formel et le naturel Bruno Bachimont a th oris leur int gration au sein d un m me cycle de d veloppement qui puisse les articuler de fa on coh rente Bac96 Bac00 Bac01 Ce cycle comporte trois tapes illustr es en figure 4 1
380. odulators abs var3 vars lt human_being_or_social_body gt lt action_name gt lt property_ gt lt event_ gt lt action_name gt var4 var lt physical_location gt vars Be Present Somewhere 95 Chapitre 3 Faciliter la conception et l acc s aux index s mantiques de mani re tr s forte il s agit presque d une d finition qui serait donn e l implicitement la notion qu elle repr sente De plus si on a une prescription syntaxique claire on n a pas v ritablement d indication compl te pour le contenu les attributs des v nements pr sent s dans les formulaires ont des valeurs contraintes mais ces contraintes et c est normal font r f rence aux concepts les plus g n raux du r pertoire ontologique autoris s pour les champs concern s On a donc une structure de description qui se comporte plus comme un r capitulatif des contraintes ontologiques que comme une prescription d un contenu pertinent un niveau imm diatement compr hensible par l utilisateur Celui ci se retrouve en effet confront dans sa t che l ensemble de la hi rarchie des concepts alors que comme on le verra plus tard la donn e d un concept typique de l application restreint la recherche au voisinage de celui ci MIA tool file my documontz zwi miniproioct picterez windcorl8 ipg 0 x 1_Fumiture_descriptio E ital led FIG 3 8 La saisie de m ta donn es
381. oigne on ne devrait pas pouvoir rencontrer dans un index l expression t moignage st nose indiquant qu un t moignage a pour objet une st nose Le risque est finalement de retomber dans les travers de l utilisation du langage naturel la richesse expressive en moins C est pourquoi ces pr cisions d indexation sont assez rarement rencontr es les documentalistes pr f rant utiliser les champs textuels classiques La structuration des index est donc encore un probl me pratiquement ouvert Les solutions de type formulaires apportent suffisamment de contr le et d expressivit pour pouvoir tre employ es dans les approches peu exigeantes mais elles sont trop rigides pour pouvoir tre adapt es toutes les applications surtout celles qui requi rent des descriptions d objets aussi complexes que les documents audiovisuels L imp ratif de structurer des relations transversales entre descripteurs en particulier est une difficult majeure pour ces approches De l autre c t une approche de l6Relation entre une cat gorie et un individu classifi dans cette cat gorie 32 1 4 Conclusion mise en relation ad hoc de descripteurs l int rieur des index n est pas facilement adoptable sans perdre la continuit interpr tative que nous souhaitions Il semble qu un paradigme pertinent d indexation relationnelle soit toujours introduire dans l approche documentaire 1 4 Conclusion L enjeu majeur d
382. oirement relever d un environnement interpr tatif donn qui n est pas forc ment celui retenu pour l exploitation des documents audiovisuels Bruno Bachimont rappelle dans Bac04a que ce que la d tection automatique produit ce sont des descripteurs physiques directement li s la perception du contenu documentaire Alors que l indexation vise l obtention de descripteurs s mantiques associ s une interpr tation De fait il n y a pas forc ment de lien entre les deux types de donn es puisqu on peut modifier un aspect physique du document changement de grosseur de plan variation de couleur encadrement et logos sans changer n cessairement la signification de ce document ce en quoi la partie modif e tait int ressante 20 1 2 Le probl me de l acc s l information pour les documents audiovisuels 1 2 3 Am liorer la qualit de l indexation dans son contexte de production et d usage L indexation telle que nous la concevons restitue donc l interpr tation qu a fait un op rateur humain de ce qu il a lu On doit consid rer en tout cas c est ce qui est fait PINA qu elle est ce qui rend le mieux compte des particularit s de chaque document en le pla ant dans son contexte d utilisation Dans un tel cadre il est tout de m me permis de rechercher des am liorations pour ce processus m me si on ne peut pas tout automatiser Quels sont les facteurs qui permettent de g
383. oit pas incluse dans la liste des r ponses donn es une requ te parce qu elle ne contient pas les bons mots alors que son contenu est pertinent On observe alors un ph nom ne de silence Dans le cas inverse celui du bruit une description non pertinente sera retourn e parce qu elle contenait les mots recherch s mais avec un sens diff rent Les variations sont encore plus grandes lorsqu il s agit de cr er des descriptions textuelles rendant compte de contenus riches articul s ce qui est souvent le cas des documents audiovisuels Comment tre s r qu une requ te exprim e sous une forme telle que plans de sc nes de rue Alger puisse trouver une r ponse si on consid re qu il est tout fait possible et l gitime qu un indexeur ait pu d crire de tels plans dans un reportage traitant de la vie alg rienne avec l expression images d un march alg rois Les modalit s d expression ainsi que la mati re du contenu de l objet audiovisuel peuvent tre chaque fois d crites par un tr s grand nombre de variantes Ces possibilit s sont si nombreuses que m me la coh rence de l indexation n est pas garantie diff rents index pourront tre produits pour un m me document par deux indexeurs diff rents ou par le m me indexeur deux moments diff rents Ces ph nom nes sont de nature diminuer l efficacit de l utilisation des index lors de la recherche Si l on veut conserver un processus de
384. ojets n abordent pas de th me semblable celui qui a motiv cette th se celui de la produc 22On verra en section 5 2 3 un exemple d utilisation de ce langage 68 2 4 Utilisations concr tes d ontologies par des syst mes de recherche d information tion d index riches dans le cadre de documents av index dont on esp re retirer le plus possible pendant le fonctionnement du syst me de recherche En ce qui concerne l aspect audiovisuel certains projets visant l am lioration de l acc s ou de l exploitation de documents multimedia apportent des contributions int ressantes Par exemple GHB96 s il ne se place pas dans un cadre m thodologique global proc de une analyse des besoins en mati re d expressivit et de raisonnement qui se rapproche de notre point de vue KHPG02 MAH03 DDH 04 proposent eux des solutions techniques adapt es l annotation de documents en tenant compte de leurs sp cificit s s lection de r gions spatiales gestion de la dimension temporelle mais ils n offrent pas de cadre de recherche exploitant de mani re satisfai sante les possibilit s de raisonnement offertes par des ontologies complexes LH04 pr sente une mani re originale de cr er des connaissances de raisonnement riches et utiles pour l exploitation de donn es dans un cadre applicatif concret la reconnaissance automatique de concepts visuels de haut niveau 3 mais les outils propos s ne sortent
385. oles des connecteurs logiques du calcul des pr dicats par exemple les primitives non logiques ce sont celles propres au domaine qui sont issues du processus de mod lisation conceptuelle les symboles de pr dicats par exemple Le probl me est que les primitives non logiques n ont pas de signification d finie a priori dans un langage artificiel de RC Les concepteurs de SBC utilisent souvent des symboles qui sont des termes de la langue naturelle appartenant au champ lexical du domaine consid r en esp rant qu une interpr tation correcte les associera directement ce qu ils ont imagin On sp cifiera ainsi qu on peut utiliser les termes d interview et de s quence comme symboles pour les primitives de repr sentation Mais il faut rappeler que le sens des termes de la langue est fortement variable et que par cons quent la signification de telles primitives reste floue Une autre sp cification aurait pu retenir la d nomination d entretien proche d interview Il faut donc un moyen de guider l interpr tation des symboles utilis s de donner un sens aux primitives non logiques du langage c est le besoin auquel sont cens es r pondre les ontologies Bac00 propose la formulation suivante D finir une ontologie pour la repr sentation des connaissances c est d finir pour un domaine et un probl me donn s la signature fonctionnelle et relationnelle d un langage formel de repr senta
386. omm qui est une interview Il 40 2 2 IC et expressivit descriptive est important de noter que cette relation d inclusion entre l mission et l interview est d sormais formul e de mani re explicite et comme le reste des assertions exploitable dans un syst me de raisonnement ou par un humain initi aux r gles d interpr tation des constructions parfois com plexes que constituent ces formules Les pr dicats unaires sont en effet interpr t s formellement comme des ensembles dont les variables et constantes qui les instancient d notent des l ments Ce cadre purement logique apporte donc une rigueur formelle int ressante on sait pr sent que l on se place en employant de telles formules dans un domaine d interpr tation un ensemble d individus r gis par des contraintes qui d rivent de la signification des constructeurs du langage Cette approche constitue un cadre repr sentationnel bien plus riche que celui des langages do cumentaires classiques avec un thesaurus il n est pas envisageable de se r f rer explicitement des relations entre individus On en reste au stade de la composition des notions composition dont le sens m me n est pas toujours sp cifi Dans la perspective de la conception et de l exploitation de syst mes base de connaissances cette logique n est cependant pas jug e satisfaisante Les processus de d monstration ne sont pas d cidables et les performances d
387. ommun toutes les applications base de connaissances le besoin d infor mations qui sp cifient r ellement pour lhumain qui les manipule le sens des primitives utilis es Les ontologies ce niveau ne doivent pas n cessairement tre crites l aide d un langage formel l important est la compr hension de ce qui est exprim C est pourquoi beaucoup de sp cifications sont donn es de mani re informelle voire superficielle dans ce cas on cherche seulement pr senter les termes d une conceptualisation du domaine d application Certaines vont plus loin en organisant et en d taillant quelque peu l information livr e pour pr ciser dans le d tail la signification des l ments du vocabulaire Le recours la formalisation des ontologies est n anmoins indispensable si on veut les utiliser dans des SBC qui op rent des traitements d finis au niveau de la connaissance Il faut alors alors pr ciser une interpr tation des diff rentes primitives de repr sentation en utilisant des langages impl ment s de repr sentation des connaissances qui sont adapt s l expression de significations formelles Comme nous avons commenc le voir il en existe de nombreux chacun d entre eux a des capacit s expressives sp cifiques et correspond donc un besoin pr cis en termes de manipulations informatiques Le vocable ontologie a donc servi d signer des constructions de complexit tr s variable allant
388. omog nes avec nos propres choix nous privil gierons l opposition concepts relations 54 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche B nficiant de plus de possibilit s expressives et d une pr cision bien plus grande quant l inter pr tation des liens pist miques organisant le r seau de notions on a donc les moyens d viter les faiblesses des sp cifications th saurales Ainsi il est toujours souhaitable de cr er pour les primitives conceptuelles simples ou rela tionnelles des hi rarchies de sp cialisation on d finit une notion en r f rence a celle qui plus g n rale qu elle lui fournit un contexte s mantique Ces hi rarchies apparues tr s t t dans la philosophie antique grecque avec Aristote puis Porphyre constituent en effet un moyen naturel d organiser le vocabulaire d un domaine et de faciliter sa compr hension On autorise une compa raison imm diate facilit e le cas ch ant par une repr sentation graphique arborescente entre une notion et ses voisines ce qui facilite l mergence d environnements d interpr tation locaux Par g n ralisation des comparaisons en suivant les liens de sp cialisation g n ralisation on ob tient ainsi l chelle du domaine un ensemble de significations inter d pendantes Bac96 Les arborescences des figures 2 7 et 2 8 issues d une ontologie pour l audiovisuel con ue par Rapha l Tro
389. omposent On se place alors dans ce qu on appelle un cadre formel de recherche d infor mation par opposition par exemple aux approches textuelles utilisant des comparaisons entre les contenus d index et de requ tes textuelles aux approches num riques d analyse et de recherche d image reposant sur l extraction et le calcul de similarit s entre caract ristiques visuelles ou sonores du document AV ou m me encore aux approches th saurales qui ne reposent pas sur une interpr tation et des calculs formels Ontologies et syst mes logiques de recherche d information Diff rents mod les formels existent qui sont employ s pour fonder les processus de recherche d information notamment les approches num riques telles que les calculs probabilistes de 1TDe telles g n ralisations peuvent tre appliqu es de deux mani res La premi re vise compl ter les index par les descripteurs qui g n ralisent ceux qui ont t entr s par l indexeur et comparer l ensemble avec la question pos e La seconde consiste compl ter les descripteurs d une requ te par les descripteurs les sp cialisant et comparer le r sultat avec l ensemble des index Ces deux approches sont en th orie quivalentes quant aux r sultats qu elles permettent d obtenir mais en pratique les performances des syst mes sont souvent diff rentes suivant les connaissances th saurales que l on consid re la structure et la taille des inde
390. on Artificial Intelligence AAAI 94 Seattle 1994 Morgan Kaufmann GDGB03 GOLBREICH C DAMERON O GIBAUD B et BURGUN A Comment repr senter Gen00 GF95 GFC04 GFP02 GG95 les ontologies pour un Web S mantique M dical In Journ es Francophones de la Toile JF T 2003 Tours France 2003 GENEST D Extension du formalisme des graphes conceptuels pour la recherche d information Th se de doctorat Universit Montpellier II 2000 GRUNINGER M et Fox M Methodology for the Design and Evaluation of Ontologies In IJCAI 95 Workshop on Basic Ontological Issues in Knowledge Sharing Montr al 1995 GOMEZ PEREZ A FERNANDEZ LOPEZ M et CORCHO O Ontological Engineering Springer Verlag London 2004 GUIZZARDI G FALBO R A et PEREIRA FILHO J G Using objects and Patterns to implement domain ontologies Journal of Brazilian Computer Society JBCS Special Issue on Software Engineering 8 1 2002 GUARINO N et GIARETTA P Ontologies and Knowledge Bases Towards a Termi nological Clarification In MARS N diteur Towards Very Large Knowledge Bases Knowledge Building and Knowledge Sharing IOS Press Amsterdam 1995 GGM 02 GANGEMI A GUARINO N MASOLO C OLTRAMARI A et SCHNEIDER L Swee GHB96 tening Ontologies with DOLCE In 18th International Conference on Knowledge En gineering and Knowledge Management EKAW 2002 Siguenza Spain 2002 Carole GOBLE C HAUL et Sea
391. on comparable aux thesauri semblent dans un premier temps apporter des solutions similaires Cependant leurs concepts et leurs relations b n ficient d un engagement ontologique diff rent favorable une plus grande pr cision des syst mes de manipulation des descriptions Et assez rapidement les solutions ontologiques apparaissent comme les seules pouvant autoriser des strat gies fines de recherche utilisant les liens sp cifiques du domaine Il devient possible de cr er des sp cifications relationnelles plus riches que celles des thesauri ainsi que d exploiter ces sp cifications de mani re pertinente pour rapprocher le travail de l indexeur de celui du chercheur dans le cadre d une interpr tation s mantique partag e du vocabulaire d indexation Le syst me prend alors en charge lui m me une partie des efforts n cessaires 4 la conservation de la continuit s mantique Cela est valable tant au niveau du contr le de cette continuit lors de la cr ation des index que lors de Vapplication de processus d inf rence qui utilisent les sp cification ontologiques pour rapprocher les index cr s des requ tes adress es au syst me Si certaines des connaissances ainsi explicit es peuvent sembler triviales il ne faut pas ou blier que ce sont probablement celles ci qui sont jug es int ressantes par l utilisateur puisqu il n a plus op rer les traitements de reformulation les plus vidents Par exemple dans un cadr
392. on d un contexte d interpr tation tel que le r seau propos par un thesaurus forme de la description dans la perspective de descriptions orient es par des applications pr cises il est naturel d envisager la mise en place de processus de contr le de la forme finale de ces descriptions Chaque application vient avec des exigences de coh rence si on veut obtenir des expressions descriptives pertinentes il faudra le plus souvent guider voire restreindre la mani re dont les termes du vocabulaire sont articul s les uns avec les autres En somme il s agit de mettre en place pour nos index ce que l on peut assimiler un contr le ditorial qui limitera la variabilit des index produits F3 Manipulation des descriptions Dans le cas des syst mes documentaires tradition nels l int r t du contr le s mantique r side aussi dans les fonctions d assistance que les proc d s d indexation rationnelle autorisent D s lors qu une description voit son sens pr cis norm par un contexte d interpr tation et d exploitation on peut mettre en place des traitements automa tiques qui prennent en charge une partie des t ches l mentaires qui incombent traditionnellement au documentaliste Dans un syst me th saural on peut utiliser les relations s mantiques entre notions pour reformuler les requ tes Dans un cadre encore plus pr cis o les index seraient explicitement structur s et comprendraient des notions d
393. on sont directement li s aux objets via des attributs de production ou de diffusion les activit s et s quences d v nements ne sont plus pr sents dans le patron d utilisation Les deux premiers points correspondent des conomies de repr sentation classiques que com battent justement les chercheurs qui ont introduit des crit res de mod lisation comme ceux l uvre dans DOLCE Cependant force est de reconna tre que cette fa on de faire se doit d tre prise en compte si l on veut exprimer correctement la conceptualisation du domaine audiovisuel qui nous int resse De plus nous avons vu qu il est tout fait envisageable de faire co exister les deux points de vue de mani re coh rente dans un m me SBC pourvu que l on y incorpore des connaissances de raisonnement adapt es Le dernier point est semblable mais il se distingue par le fait que les choix de repr sentation qu il implique sont directement reli s un choix applicatif pr cis En effet si la repr sentation des v nements de production et de diffusion qui cr ent le document audiovisuel est n glig e dans notre application de description documentaire c est que de notre point de vue leur r sultat importe plus que leur d roulement Ainsi lorsqu on voudra exprimer qu une s quence est tourn e en gros plan on pr f rera l exprimer de cette fa on m me tel que c est le cas dans le patron d utilisation Il est plus naturel de dire qu une
394. onceptualisation vis e par l ontologie Reste qu on ne sait toujours pas pr cis ment comment obtenir le contenu de ces structures en particulier les taxonomies de concepts METHONTOLOGY permet de r aliser un pas appr ciable vers plus de rigueur et donc de meilleures ontologies mais il reste du chemin parcourir pour guider la conception d ontologies dont l organisation serait guid e et justifi e par des principes nonc s sp cifiquement pour ce probl me On To Knowledge Dans le cadre du projet europ en ON TO KNOWLEDGE l quipe de l AIFB de l universit de Karlsruhe a mis au point un cycle de d veloppement et d valuation d ontolo gies dans le cadre de projets appliqu s de gestion de connaissances Le processus contient cinq tapes g n riques tude de faisabilit lancement du d veloppement raffinement valuation et maintenance Les phases de d veloppement et de raffinement sont celles qui nous int ressent le plus puisque ce sont celles au cours desquelles les concepts et relations sont licit s organis s puis formalis s L encore peu de d tails sont donn s sur la mani re de d finir les notions de l ontologie et de les organiser les unes par rapport aux autres Les auteurs ont eux aussi recours aux questions de comp tence mais sans lier ces questions les unes aux autres comme dans UG96 Par contre ils fournissent plus de d tails sur la fa on dont les termes issus de ces questions ind
395. onna lit s strictement documentaires ext rieures au syst me de raisonnement lui m me Le segment 1 pourra selon toute logique r pondre une recherche de s quences repr sentant un accident caus par une anomalie sanguine Il est cependant important de mentionner que pour cela il faut que le syst me le lie correctement sa repr sentation dans son index m me Ceci ne se passera que si on se place dans un cadre tel que celui propos dans la th se de Rapha l Troncy Tro04 que nous avons repris dans notre exp rimentation commune pr sent e en section 5 2 3 En l occurrence il faut cr er une repr sentation des documents l aide d un langage documentaire comme MPEG 7 MPEG 701 qui permettra d introduire par exemple un d coupage du document index en s quences Le syst me de repr sentation des connaissances devra ensuite contenir des instances de concepts tels que le concept Sequence de l ontologie de l audiovisuel qui seront explicitement reli s aux repr sentations purement documentaires que l on vient d voquer Il faut noter que bien que le point de vue eau d OPALES utilise de tels concepts documentaires il ne permet trait pas un tel fonctionnement puisque les index ne sont pas mis en commun et qu il n existe pas dans le syst me de lien explicite entre un segment d un document et sa repr sentation dans le SBC recherche documentaire volu e On peut cependant vouloir des syst mes de re
396. ons une signification formelle permettant de fixer la r f rence de ces notions qui pourra tre traduite ensuite dans un langage compr hensible par un SBC La premi re op ration de cette tape consiste r cup rer les deux taxinomies tablies pour Vontologie diff rentielle Aucune des informations apport es dans l ontologie r f rentielle ne peut en effet remettre en cause la hi rarchie de subsomption les deux arbres de concepts et de relations construits pr c demment r apparaissent donc tels quels dans DOE L utilisateur peut ensuite ajouter des concepts ou des relations qui ne pr senteront plus les informations s mantiques des notions diff rentielles L h ritage multiple tant possible l diteur tient jour pour chaque entit la liste de ses parents et permet d en ajouter ou d en retirer Nous avons choisi d s le d but de diff rencier ces relations des concepts correspondant aux entit s du domaine Cela a une r percussion au niveau de l ontologie r f rentielle La description de la r f rence des relations est effectivement sp cifique pour une relation donn e il faut pouvoir pr ciser son arit ainsi que ses domaines L diteur propose de rentrer ces informations et le choix des domaines se fait parmi la liste des concepts d j entr s dans l ontologie DOE prend galement en charge des v rifications basiques en fonction des relations de sp cialisation entre relations l arit quand ell
397. ontr l et montrera que les techniques de sp cification de vocabulaire de description les plus avanc es l heure actuelle les thesauri sont loin de r pondre tous les besoins Adapt s un certain style de description et d acc s des bases documentaires ils peuvent en effet p cher par manque de pr cision ou de rigueur pour certaines des applications documentaires qui mergent actuellement Ensuite notre th se propose une pr sentation clarifi e et cironstanci e des solutions que peut apporter la discipline de l ing nierie des connaissances aux probl mes de l indexation do cumentaire C est l objectif de notre chapitre 2 qui introduit les notions de syst mes base de connaissances pour cr er et exploiter des index structur s et d ontologies pour d finir les lan gages de repr sentation et les connaissances de raisonnement qui constitueront la partie variable des sp cifications de ces syst mes celle qui fera qu ils seront adapt s des applications et des domaines particuliers Les propositions concr tes de notre travail sont pr sent es dans les chapitre 3 et 4 de ce manuscrit dans lesquels nous nous sommes en effet attach l obtention d une m thodologie 6 3 D roulement de la th se globale de conception et d utilisation des ontologies Nous allons d abord pr senter comment on peut guider le travail des utilisateurs devant utiliser une ontologie donn e pour cr er des index
398. onymie o l on utilise une entit pour d signer une autre laquelle elle est li e En l occurrence l objet administratif est bien plus structurant pour le sens commun pour d signer le lieu g ographique Cela est d autant plus valable pour le monde des courses cyclistes qui joue toujours sur la contextualisation nationale des coureurs ou des quipes Le fait est que cette figure de style est devenue fondamentale pour la conceptualisation de l application qui ne s attache plus le moins du monde aux subtilit s administratives sociales ou historiques qui motivent le d coupage g ographique qui a cr le lieu travers pour notre application le pays est essentiellement rattach sa couverture g ographique Il s agit d une sorte de changement de typet mais ce glissement parce que l on se restreint un monde bien particulier est pr sent consid r comme primordial pour la conceptualisation propos e Differential Ontology Editor Ontologie du Cyclisme 5 x File Edit Metadata Language Help Differential Ontology R ial C Tree Browser 4 Est d fini lors de la nomenclature des etAbstrait Similarity localisations spatiales etConcret ObjetConcretTemporel ObjetConcretSpatial i Objetindividuel h Indique si l objet existe ind pendamment ObjetBiologique Similarity de l activit administrative ou s il est li ObjetGeographique with Siblings Celle ci
399. oordination le projet regroupait le LIRMM de l Universit Montpellier II quipes IHM et GC et l entreprise CS Syst mes d Information pour la plate forme technique la Maison des Sciences de l Homme le CNRS le Centre National de la Documentation P dagogique CNDP et La Cinqui me BPs pour la s lection et l indexation de contenus vid os http opales ina fr 4 3 D roulement de la th se l analyse de documents p dagogiques dominante g ographique abordant sp cifiquement le th me de l eau Pour chacun de ces points de vue il a fallu cr er un langage d indexation dont le vocabulaire est fourni par une ontologie Les index sont ensuite exploit s de fa on adapt e au point de vue dont il rel vent par un m canisme d inf rence qui assiste la recherche d information dans la base ainsi cr e Dans ce projet nous avons tout d abord particip l laboration de la partie technique en cr ant un outil de conception d ontologies DOE int gr au syst me g n ral Ceci nous a permis de voir quels peuvent tre les enjeux d une plate forme informatique d indexation formelle Nous avons ensuite collabor tr s activement la conception des ontologies li es aux deux th matiques retenues en accord avec les besoins des experts Finalement nous avons t impliqu dans les s ances d valuation du projet cr ation d index et tests qualificatifs en compagnie des dits experts Cela n
400. ou r utiliser on pourrait am liorer les d marches de cr ation de nouveaux patrons de conception ontologiques en r f rence des patrons de conception existants de cr ation de nouveaux patrons d utilisation ontologiques en r f rence des patrons d uti lisation existants de s lection de patrons de conception ontologiques pour la cr ation des patrons d utilisation ontologiques Dans le domaine des patrons logiciels des travaux comme ceux de RGSF99 cit par Gza00 font la distinction entre quatre relations particuli res alternative Un patron A est une alternative d un patron B si A a le m me probl me que B mais propose une solution diff rente raffine Un patron A raffine un patron B si le probl me r solu par A est une sp cialisation un cas particulier de celui r solu par B B peut r soudre les probl mes r solus par A On dit aussi que B tend A requiert Un patron A requiert un patron B si application de B est un pr requis de l application de A utilise Un patron A utilise un patron B si une partie des probl mes pos s par A peut tre r solue en partie ou compl tement par B Ainsi la solution d marche de A est exprim e en utilisant le patron B Un programme de recherche en mati re de constitution de biblioth ques de patrons de concep tion et d utilisation ontologiques impliquerait tout d abord d tudier la signification que peuvent prendre de telles relatio
401. our les thesauri Le premier r flexe est le recours aux tiquettes d essence linguistique Comme dans les the sauri les concepts et les relations d une ontologie sont g n ralement exprim s l aide des termes du domaine vis comme dans les figures 2 7 et 2 8 des pages 55 et 56 Cela appara t de mani re vidente dans le cas des projets qui s int ressent la repr sentation des connaissances multi 80 3 2 Aider la compr hension de la substance des descriptions lingue comme RCP02 Ici concepts et termes sont distingu s mais explicitement reli s les uns aux autres Les relations d finies au niveau conceptuel par leur signature sont elles aussi reli es des intitul s linguistiques On obtient donc une intelligibilit minimale pour les concepts et les relations d une ontologie Mais il ne s agit l que d une bonne pratique dont le r sultat n est pas acquis En dernier ressort tout d pend de la capacit du concepteur de l ontologie choisir des symboles linguistiques appropri s ce qui est loin d tre vident en l absence de cadre m thodologique pr cis comme c est la plupart des fois le cas Pour gagner en cr dibilit des outils CMO1 KV03 par exemple essaient de relier les concepts d une ontologie des terminologies reconnues telles que WORDNET Fel98 Mais si ces terminologies ne sont pas obligatoirement con ues avec un besoin sp cifique en ligne de mire on
402. ous a permis d avoir des avis de premi re fra cheur sur la pertinence des solutions techniques mais aussi sur celle des ressources ontologiques que nous avions con ues Et bien videmment cela a contribu nourrir les r flexions m thodologiques qui avaient pr sid la conception de ces outils et ressources Liens avec la recherche sur les ontologies VINA La participation de notre Institut au projet OPALES a de fait t l occasion de prolonger un effort d j ancien portant sur la conception et l utilisation d ontologies pour la description des contenus audiovisuels dans la lign e des travaux de Bruno Bachimont Bac00 De fait celui ci a r uni une quipe de jeunes chercheurs dont les travaux de th se sont compl mentaires Tout d abord Karine Lespinasse a abord le th me de l enrichissement de thesaurus par acquisition ter minologique g n rique Les02 Les travaux de V ronique Malais utilisent des moyens similaires mais se concentrent d avantage sur leur application des corpus sp cialis s en vue d obtenir des d finitions plus pr cises mieux structur es m me d initier convenablement le processus de conception ontologique Mal05 Estelle Le Roux a galement utilis des outils d analyse lin guistique mais cette fois ci en vue de la cr ation d index structur s base de connaissances et non de celle du langage conceptuel utilis pour repr senter ces index Le 03 Rapha l Troncy e
403. p rimentation chirurgie cardiaque 168 5 2 4 Exp rimentation EON 179 5 2 9 R capitulatif m sue eae eos RON GE Ee ee ed A 185 5 3 Discussions m thodologiques 186 5 3 1 Utilisation d ontologies pour indexer des vid os 186 5 3 2 Faciliter la conception des ontologies 191 pide Conclusions gases St dti te bd ba hele Bee eee 4 2aaJ ba 199 Conclusion 201 Bibliographie 207 Table des mati res vi 1 1 1 2 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 2 10 2 11 2 12 2 13 2 14 2 15 3 1 3 2 3 3 3 4 3 9 3 6 3 7 3 8 3 9 3 10 3 11 3 12 3 13 3 14 3 15 Table des figures Exemples de requ tes adress es au D partement des Archives de VINA 13 Une s quence la signification obscure 14 Les ontologies au sein des SBC 39 Formules de la logique du 1 ordre repr sentant un extrait d index 40 R seau s mantique repr sentant un extrait d index 42 Repr sentation d un index sous forme de graphe conceptuel 43 Extrait d A box de logique de description simple repr sentant un extrait d index 44 Extrait d A box de logique de description volu e repr sentant un extrait d index 45 Hi rarchie de concepts issue d une ontologie pour l audiovisuel extrait de IT04 55 Hi
404. pas de ce domaine applicatif pr cis Les projets MUSEUMFINLAND HSV04 et MIA SDWW01 SBC 02 HSWW03 se placent eux dans un contexte qui est beaucoup plus proche Ils cherchent en effet cr er et exploiter des descriptions utilisant des descripteurs issus de thesauri d di s des domaines multiples dans des syst mes reposant sur les solutions du web s mantique r ellement adaptables a des applications pr cises et visant la description et la recherche de contenus th matiques qui peuvent tre ceux de documents visuels Par exemple HSV04 propose des r gles de recommandation qui constituent de v ritables connaissances de raisonnement permettant de relier des objets entre eux et d am liorer la recherche dans des bases documentaires volumineuses Malheureusement ce travail souffre du point de vue de l expressivit de la limitation engendr e par le contexte th saural initial en dehors des sch mas de descriptions utilis s de mani re standard dans les mus es il est tr s difficile d obtenir des structures relationnelles aussi pr cises que celles que nous d sirons Nous verrons plus en d tails dans la section 3 3 1 p 3 3 1 les aspects qui nous s parent des travaux n erlandais Enfin il faut mentionner les travaux de Jane Hunter Hun03 et de Chrisa Tsinaraki TPCO04 qui si elles se concentrent surtout sur les probl mes d interop rabilit des descriptions parfois de bas niveau et non sur le raisonnement
405. peut rev tir un alignement correct m me si cela implique qu il soit manuel entre des connaissances applicatives et des connaissances de haut niveau probl mes de mise en uvre des connaissances d alignement En effet si les connais sances de raisonnement permettant l alignement entre les patrons de conception et les patrons d utilisation sont utiles du point de vue de la construction et de la compr hension des ontologies leur utilisation concr te dans un SBC peut entraver le bon fonctionnement de celui ci Des travaux partageant nos pr occupations RZS 99 font effectivement mention des pro bl mes de calculabilit et d expressivit relatifs de telles solutions Et les repr sentations in term diaires introduites ne sont pas g r es par les m canismes de raisonnement ontologique standards mais par des outils auxiliaires qui par exemple font des traitements sur les repr sentation avant de les introduire dans la base de connaissance Ce choix est en partie d la d cision fondamentale d exclure ces connaissances d encodage des ontologies on retrouve la la diff rence entre les deux classes de connaissances ontologiques que nous avons voqu e en page 192 mais aussi aux capacit s parfois restreintes des syst mes d inf rence utilis s Comme nous l avons galement indiqu dans cette section les connaissances de raisonnement dont nous recommandons l utilisation dans les SBC d indexation
406. plus cela doit se faire sans que l utilisateur ait de charge suppl mentaire Les ontologies devraient donc logiquement tre employ es dans un sc nario d inf rence et de validation implicites Cette tape ach ve donc le processus de sp cification d une conceptualisation Le passage des l ments d origine textuelle non contraints une ontologie diff rentielle qui prescrit une s mantique interpr tative puis la d finition d une s mantique formelle pour les primitives du langage de repr sentation et enfin l op rationnalisation de ces primitives en vue d une utilisation 127 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique par un SBC concret nous permet de disposer de structures qui permettent de rendre compte d une conceptualisation de mani re claire et coh rente que ce soit pour les utilisateurs du SBC pour ses concepteurs ou pour le syst me lui m me 4 3 2 Des outils pour faciliter la saisie des sp cifications formelles Apr s avoir d termin un cadre m thodologique coh rent il faut l instrumenter Pour le projet OPALES en effet PINA devait produire un environnement de construction d ontologies compatible avec le format des graphes conceptuels Nous nous sommes donc tourn vers les solutions existantes avec l esprit les contraintes particuli res impos es par la d marche de conception propos e par Bruno Bachimont Etait il possible de trouver un dite
407. pm es webODE 130 4 3 Prescrire une mani re de construire les notions ontologiques Cr ation d une ontologie diff rentielle dans DOE La mise en uvre de l tape de normalisation est ce qui a motiv en grande partie le d ve loppement de cet diteur Il attache donc un soin tout particulier la mod lisation des notions diff rentielles De fait m me si ce n est qu un outil de saisie les principes diff rentiels sont exprim s en langue nous avons essay d en faire un outil de saisie rationalis Tout d abord nous avons recens les diff rentes fonctionnalit s permettant la cr ation d une ontologie diff rentielle Pour r pondre ces besoins nous avons cr une interface cf figure 4 2 comprenant une vision arborescente des notions une pour chaque type de notion concepts ou relations ainsi qu un formulaire de saisie pr sentant dans des champs textuels les quatre principes diff rentiels anglicis s Similarity with parent SWP Similarity with siblings SWS Difference with siblings DWS Difference with parent DWP Differential Ontology Editor Ontologie du Cyclisme File Edit Metadata Language Differential Ontology rTree Browser Editor Concept Relation Differential Principles oncret i Era i jetConcretTemporel C est un individu humain jetConcretSpatial Similarity Objetindividuel with Parent SWE
408. pourront tre renvoy s De fait la plupart des syst mes utilisant des thesaurus exploitent les informations de sp cia lisation ou de g n ralisation pour am liorer leurs performances surtout en termes de rappel L exp rience montre que cela est efficace surtout dans le sens descendant on fait une recherche concernant des termes plus sp cialis s pour r pondre une requ te employant des termes plus g n riques L INA compte parmi ceux qui utilisent une telle fonctionnalit dans leur syst me de recherche Cependant il ne faut pas perdre de vue que la possibilit de perte en pr cision est importante Le champ audiovisuel contient des notions telles que publicit qui si les docu ments correspondants taient renvoy s pollueraient les r sultats d une requ te sur une technique audiovisuelle Certains auteurs d fendent aussi la pertinence de l utilisation des relations transversales d as sociation TAJO1 Si elles jouent un r le moins structurant pour les champs s mantiques elles rendent souvent compte de pratiques souvent utiles en ce qui concerne la recherche d informa tion dans le domaine concern Ainsi pour rester dans les limites de notre exemple un chercheur consultant le thesaurus pourra d cider de remplacer dans une requ te le terme animation par dessin anim ce qui semble naturel vu le lien fort d finitoire entre ces deux notions un dessin anim utilise forc ment une technique d animation
409. pplication retenue Il serait en effet tout fait envisageable de faire fusionner les trois branches en une seule mais nous avons jug que l int r t en termes d utilisabilit tait loin de justifier l effort requis D autant plus que si nous n avons pas respect nos principes au plus haut niveau nous nous sommes efforc de les appliquer dans les deux branches qui n cessitaient de tels efforts comme la figure 5 4 le montre partiellement 2 9 ObjetAVRepr sentant Repr sent Image Plan C Sequence El mentDeRepr sentation El mentContenant C El mentTournage C El mentMontage C El mentPostProduction Q El mentContenu C ComportementSpatial C AspectSonore C AspectChromatique C AspectLumineux C MiseEnScene Interpr tation C ValeurDeNormalit C Connotation C EffetRh torique C ValeurDeR alit Q ValeurScientifique Cautionn Scientifique NonCautionn Scientifique NonPertinent Anecdotique E Facilit DePerception TypeDiscours Repr sent Propri t DomaineEau EntiteDomaineEau t Entit Abstraite pec Entit TangibleSpatiale Te Entit TangibleCompl te Ensemble Ind nombrable Toutindividuel ConceptM ronymique Partie El ment o gt aiee re AcM Humaine Activit Domestique Activit DeLoisir Activit Professionnelle C Activit lndustrielle Activit Agricole Acti
410. pr tation les concepteurs d ontologies misent sur la structuration offerte par la relation de sp cialisation pour rendre le contenu de leur tra vail accessible l utilisateur final Les ontologies sont donc le plus souvent pr sent es comme des hi rarchies de concepts et de relations plut t que comme des listes plat comme illustr dans la figure 3 2 qui reprend les vues offertes par diff rents diteurs d ontologies ou syst mes d annotation Et pourtant de la m me mani re que cela peut ne pas r ussir pour les thesauri le recours la subsomption ne garantit pas une interpr tation correcte m me si cette subsomption est munie d une interpr tation formelle pr cise En effet on ne se place plus du tout du c t d une interpr tation naturelle si ce n est laisser celui qui acc de l ontologie interpr ter ce qu il voit d une mani re diff rente de l interpr tation formelle sous jacente Dans certains cas ceux o une application documentaire utilisant un thesaurus pr existait au SBC ontologique on peut vouloir importer la hi rarchie th saurale Ce calcul n est pas mauvais au premier abord On r cup re ainsi un objet qui con u pour r soudre des probl mes de description documentaire dans le cadre d une interpr tation non formelle b n ficie d j d une l gitimit certaine et est d un abord plus imm diat Cependant comme dans le cas des approches consistant rattacher les notions
411. propri t des notions qui y apparaissent Ainsi les concepts du patron ne correspondent pas aux domaines des relations qui les lient ces domaines relevant plut t du niveau noyau sont souvent plus g n raux Or les diteurs graphiques d ontologies non sans raisons ne prennent en compte que les domaines des relations dans leur rendu graphique ou non d ailleurs Ces outils devraient donc inclure de v ritables fonctionnalit s de gestion de patrons via la mise en avant explicite dans les diteurs d un niveau structurant et la possibilit de travailler partir de ce niveau et non plus seulement des niveaux g n riques En particulier il faudrait veiller introduire dans le mod le ontologique g r par l diteur des pr f rences applicatives comme la liste des concepts et relations pr sents dans le patron d utilisation applicatif cr er une interface de repr sentation de ce patron permettant un visionnage de celui ci en association avec les sp cifications ontologiques de facture classique l articulant avec les concepts et relations des deux autres patrons 45M me dans l approche de Gangemi et ses coll gues on peut se retrouver dans une situation o l ontologie de domaine a t cr e avant d tre rattach e au patron de conception de haut niveau ce qui n enl ve rien au b n fice de ce rattachement qui prend alors le nom d alignement MGOS04 4Prot g
412. ptions mais en g n ral on peine obtenir un compromis satisfaisant entre la possibilit de cr er des indexations riches et celle de les utiliser de mani re coh rente et efficace A l heure o la num risation et la mise en r seau des contenus s acc l re et que par cons quent l utilisateur qui acc de aux descriptions dudit contenu est de plus en plus loign de leur cr ateur ce probl me 17Cet loignement est la fois physique puisque l on peut acc der des bases documentaires distantes du lieu d o on les consulte et conceptuel puisque l on n est plus n cessairement en contact intellectuel avec le contexte interpr tatif qui motive la cr ation des descriptions ces deux aspects s ajouter un troisi me celui de l loignement technique le sch ma classique utilisateur syst me de donn es devient plus compliqu un syst me pouvant son tour faire appel d autres syst mes afin de b n ficier de leurs services Pour cela il est n cessaire d obtenir des conditions d interop rabilit entre syst mes et de compr hension entre utilisateurs 33 Chapitre 1 La description des documents audiovisuels dans les processus documentaires est de plus en plus pr occupant Il convient alors de se tourner vers l informatique science de la manipulation de l information pour proposer des solutions techniques susceptibles d aider le d roulement de la description et de la re
413. ptuelles Celles ci sont galement d finies par une hi rarchie mais en ce qui les concerne cette hi rarchie est compl t e par la donn e d un ensemble de graphes canoniques Ces graphes mobilisent les types de concepts et de relations introduits dans le support pour cr er des graphes l mentaires compos s d une seule relation comme en figure 2 9 qui permettent de construire les seuls graphes valides pour le SBC En effet dans le formalisme des GC on construit les graphes d une base de faits en effectuant des op rations 4 partir de graphes existants restriction sp cialisation ou instanciation d un concept ou d une relation en suivant les informations hi rarchiques donn es dans le support jointure r union de deux graphes avec fusion de leurs concepts et relations communs simplification suppression des relations redondantes entre concepts et copie Dans un tel cadre il faut des graphes pr existants servant de points de d part la conception de nouveaux graphes c est justement le r le de la base canonique qui constitue le troisi me l ment du support Dans le format CGXML ce sont les attributs idSignature de la balise rtype cf code 2 2 qui introduisent le graphe canonique associ la relation concern e Sequence aPour Personne Participant Fic 2 9 Le graphe canonique associ la relation aPourParticipant Ce graphe pr sente de fait les
414. qui forment le vocabulaire r f rentiel de compr hension de la substance de nos index Nous avons cependant vu qu en ce qui concerne la forme des index c est dire l utilisation effective des concepts et des relations au sein de structures d crivant le contenu des documents il tait souhaitable d adjoindre aux ontologies des patrons d indexation Or les r flexions que nous avons pr sent es jusqu ici ne s en sont pas pr occup es Alors qu il ne semble pas ill gitime de se poser la question du lien entre la conception de ces patrons et celle du contenu conceptuel et formel des ontologies auxquelles ils sont tant li s 4 4 Ing nierie ontologique et patrons d indexation Les patrons d indexation sont des patrons d utilisation effective de l ontologie ils formalisent la situation des notions de l ontologie dans un usage applicatif De fait ils constituent des r ponses aux questions de comp tence que l on a vues en section 4 2 1 puisqu ils indiquent les descriptions que les ontologies doivent autoriser dans le cadre du SBC Nous allons voir comment on peut les introduire d s l tape de conception de ces ontologies en amont de leur utilisation dans le SBC On va en particulier montrer comment on peut lier ces patrons des patrons de conception de sorte que la conception b n ficie la fois d une l gitimit th orique li e l adh sion des http opales ina fr public 136 4 4 Ing ni
415. qui l instancie Mais avec une d finition par condition n cessaire et suffisante il est possible pr sent de d finir explicitement ce qui permet d identifier la notion son essence Si on reste dans le cadre d une interpr tation formelle avec ce que tout cela peut impliquer de distance par rapport aux usages d une application il y a l une avanc e importante vers la saisie et l utilisation dans des syst mes de raisonnement de l intension des notions constituant le vocabulaire d un langage de RC Et partant des possibilit s bien plus grandes d tablir un contr le s mantique pr cis applicable la fois lors de la cr ation du traitement automatique ou de l acc s aux connaissances Le recours des formalismes de d finition riches permet donc d tendre consid rablement lef ficacit des syst mes en termes d interpr tation des descriptions base de connaissances consti tuant les index Les ontologies apportent en fait une r ponse cr dible aux besoins de contr le induits par l exigence de continuit s mantique Tout d abord le processus de d finition natu relle des concepts et relations se voit am lior par rapport ce que permettaient par exemple les thesauri associer par exemple une signification plus pr cise la relation hi rarchique per met de clarifier le positionnement d une notion par rapport son contexte d interpr tation et d aller plus loin dans le processus d
416. r ation des descriptions ou la formulation des requ tes Mais il faut faire attention ne pas trop restreindre l expressivit autoris e pour les index produits en particulier un langage d indexation doit tre suffisamment riche pour rendre compte des relations entre les l ments du contenu du document audiovisuel Et comprendre que ces relations et les structures qu elles induisent doivent tre prises en compte par le syst me documentaire de mani re la fois souple et contr l e afin de garantir un fonctionnement optimal pour celui qui cr e les descriptions et pour celui qui effectue une recherche parmi celles ci Tout au long de ces r flexions nous nous attacherons analyser l indexation telle qu elle existe actuellement PINA et comment elle s ins re dans le fonctionnement de la cha ne do cumentaire En nous appuyant sur des exemples provenant de contextes applicatifs existants ou exp rimentaux nous montrerons que les syst mes actuels peuvent tre perfectionn s et doivent l tre dans la mesure o les environnements technique et applicatif de l activit documentaire voluent 1 2 Le probl me de l acc s l information pour les documents audiovisuels 1 2 1 La n cessaire interpr tation des documents audiovisuels Les missions de INA lui imposent d assurer un acc s au document audiovisuel qui prenne en compte les deux aspects les plus importants de sa valeur informationnelle l objet de
417. r er des index qu un simple m canisme de contr le du contenu et de structure On peut d ailleurs remarquer que ces trois solutions prescription d interpr tation prescription d indexation contr le des index produits ne sont pas redondantes L emploi de pr conisations de contenu doit bien videm 50u s il le fait a n est qu indirectement et de mani re plut t fig e par l interm diaire de l num ration d une liste des valeurs possibles 93 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques ment s appuyer sur des significations claires donn es aux descripteurs qu elles mobilisent Et les m canismes de contr le sont n cessaires pour valider les ventuelles modifications qui seraient apport es l index pr conis Et de fait on observe dans les syst mes base de connaissances publi s des approches qui empruntent ce qui se fait dans le domaine documentaire et cherchent conjuguer ces diff rents aspects Des d marches d assistance la cr ation des index dans un cadre ontologique De mani re g n rale le probl me de la cr ation des assertions dans les SBC utilisant des r f rentiels ontologiques n a pas fait l objet de beaucoup de recherches en tout cas rares sont ceux qui en font explicitement mention et qui proposent des m canismes m me de compenser la complexit inh rente ces syst mes L accent est le plus souvent mis sur les inter
418. r existent l expression des connaissances dans une base de connaissances Nous consid rons en effet ici qu un langage de RC inclut tout ce qui est n cessaire la repr sentation de faits repr sentant des situations particuli res Cette acception du terme langage est diff rente de nombreuses approches pour lesquelles les langages de RC renvoient plut t des m ta langages dont la vocation est celle de cr er le vocabulaire permettant de repr senter les faits De tels langages ne contiennent que du vocabulaire d essence logique les constructeurs syntaxiques autorisant la composition d expressions et pist mique pr cisant les diff rents types de connaissances dont rel vent les l ments de vocabulaire introduits 39 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV des acteurs rencontr s logiciels ou humains Nous d finirons plus pr cis ment ces objets et d taillerons leur r le vis vis des langages de repr sentation Nous allons voir que les ontologies instaurent des contraintes interpr tatives propices l tablissement de la continuit s mantique que nous recherchons et que les sp cifications formelles qu elles apportent contribuent optimiser la manipulation des index par le syst me en g n ralisant le recours l inf rence s mantique Tout au long de cette d monstration nous ne manquerons pas de comparer les fonctionnalit s de syst mes ut
419. r sentent les concepts et les relations reconnus comme pertinents pour l application et une partie de l activit de sp cification ontologique devra chercher anticiper les variations dont il pourront faire l objet C est alors qu on devra cr er les connaissances de raisonnement qui tenteront de compenser ceux de ces carts qui seront reconnus comme l gitimes au regard des besoins applicatifs On doit donc se reposer la question d j voqu e dans la pr sentation des points m tho dologiques mentionn s ci dessus de la rationalisation du processus de conception d ontologies formalis es correspondants des besoins pr cis En d autres termes il faut repenser la concep tion d ontologies notre probl matique disciplinaire pour tenir compte des contraintes d usages notre probl matique m tier I va s agir en particulier d int grer ce processus deux l ments m thodologiques ontologie diff rentielle patrons d indexation qui sont n cessaires une si tuation correcte des artefacts construits dans les usages observ s dans l application vis e Et de voir comment cette int gration peut se faire de mani re favoriser la r utilisation d l ments d j existants le partage des l ments con us et ainsi que l interop rabilit avec d autres ontolo gies Ceci pourrait grandement faciliter et l gitimer le travail des sp cialistes en RC charg s de la conception des ontologies
420. r tation formelle exprimant la mani re dont un syst me peut exploiter ces l ments de connaissance L enjeu devient alors de choisir un formalisme de repr sentation pertinent et de sp cifier les ressources conceptuelles en d finissant le langage de description que le syst me pourra ma nipuler Cette derni re t che est l objet de l ing nierie des connaissances CZKB00 qui pour concilier le souci de mod lisation formelle et celui de l intelligibilit des ressources condition n cessaire l obtention de r elles connaissances d passe la notion de thesaurus et propose celle d ontologie 36 Chapitre 2 Ontologies et syst mes base de connaissances pour la description conceptuelle de documents audiovisuels 2 1 Introduction repr senter au niveau de la connaissance pour indexer Nous cherchons repr senter diff remment nos index afin que leur cr ation et leur manipula tion tiennent mieux compte du contexte dans lequel ils sont produits et exploit s Les utilisateurs dans un projet comme OPALES ont en effet besoin d une indexation tr s fine 4 m me d exprimer les relations entre les diff rents l ments du contenu des documents audiovisuel que ces l ments soient d essence documentaire ou th matique Ceci impose de pouvoir utiliser un langage d indexation labor dont le vocabulaire est adaptable en fonction du point de vue applicatif consid r Pour faciliter l acc s aux do
421. r exemple comment on peut sp cifier que la propri t hasSubSequence est transitive sp cification qui pourra tre utilis par un raison neur comme BOR Ceci est clairement utile mais on manque de possibilit s pour encoder des connaissances plus g n rales relatives en particulier la composition des relations Nous avons par exemple besoin de cr er des r gles repr sentant des formules comme 4 Vz y z hasSubSequence x y A represents y z represents x z On pourrait ainsi traiter une requ te semblable la pr c dente mais demandant en sus que l mission soit illustr e par des images montrant l objet concern par la pathologie Ces pr occupations sont reconnues dans la communaut du web s mantique et commencent se voir trait es par des langages et des outils appropri s Ainsi SWRL HPB 04 constitue un pas vers le rapprochement entre les langages OWL et les r gles logiques Quelques unes des ces propositions peuvent tre impl ment es via des cadres logiques d cidables comme OWL DLP GHVD03 qui restreint OWL DL tout en autorisant le recours certains des l ments des programmes logiques au nombre desquels figurent les r gles de raisonnement que nous avons qualifi es de relationnelles Perdre une partie de l expressivit OWL en particulier les restrictions existentielles dans les conditions n cessaires peut se r v ler g nant mais la richesse des r gles relationnelles possibles nous fai
422. r gt date lt ruleml var gt lt surlx individualPropertyAtom gt lt ruleml _head gt lt rulem1 imp gt CODE 4 2 Repr sentation en SWRL de la r gle de la figure 4 10 151 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique applicative Ou au contraire son lien de sp cialisation avec le patron de conception indique t il qu on l obtient apr s cette sp cialisation De fait il n y a pas de relation causale entre d une part les connaissances fondamentales et d autre part les connaissances ontologiques applicatives notions connaissances de raisonnement patrons applicatifs qui soit valable dans tous les cas de conception d ontologies On ne peut en effet dire que les connaissances que celle ci contient ne peuvent avoir t obtenues qu apr s consi d ration des ressources de haut niveau Dans l approche que nous avons retenue en l occurrence l obtention des notions structurantes issues des pratiques m tier du domaine peut pr c der leur normalisation et leur formalisation mais ce sont ces derni res qui ach vent d en faire des ressources exploitables pour un SBC De m me les patrons applicatifs pr existeront souvent leur rattachement aux patrons de conception Mais le fait que soit disponibles des ressources d j structur es et l gitim es pouvant servir de r f rentiel la mod lisation du domaine peut influencer leur cr ation m me si le lien est moins fo
423. ratiques qui ont marqu la recherche dans ce domaine lorsque la notion d ontologie s est vue adopt e de mani re relativement large Avec le temps cet engouement semble tre retomb en partie gr ce la meilleurs ma trise des processus de conception par les acteurs de la discipline mais aussi faute de consensus En ce qui concerne 113 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique la conception d ontologies il n existe pas en effet de solution unifi e on a plut t affaire un ensemble de solutions locales d ing nierie qu il faut s efforcer de recenser et de fonder th ori quement mais dont un utilisateur pourra toujours n extraire que ce qui concerne ses besoins particuliers Dans le cas de la construction des ontologies la traditionnelle dichotomie m thodes outils s ajoute une grille de lecture relative aux moyens concrets mis en uvre lors de ce processus On peut par exemple distinguer l extraction d ontologies partir de textes ces travaux utilisent des proc d s de fouille de textes afin d en extraire les informations permettant de construire des r seaux s mantiques refl tant des conceptualisations dans la langue On peut ainsi cr er des proto ontologies qui apr s une phase de compl tion et de pr cision plus ou moins importante de la part des ing nieurs des connaissances d boucheront sur des ontologies formalis es Pour un tat de l art et
424. re Tro04 17On remarquera au passage que pure coincidence nous retrouvons l un exemple extr mement proche de celui que nous avions utilis au chapitre 1 si l on fait abstraction des intitul s anglais des noms des concepts et des relations 170 5 2 Exp rimentations ontologiques SegmenTool III lol x 00 03 02 480 00 03 02 520 00 03 14 360 00 03 14 400 Segmentation Recherche Entretien Maladie a r Propri t s Segment Dur e fooco1iss D but 25 Annotation Animation Steno Explication Retre Dessin Retreciss EC_dessinStenose Animation CIV slo 1 gt Associer imagette 00 03 04 280 SSS o Ligne de Segmentation Le att Fic 5 5 Utilisation de l outil SegmentTool pour produire une structure documentaire thematicRelation shows hasSubSequence refersTo productionRelation hasFilmingValue hasEditingFeature ProductionSpecific Theme related Entity Sequence interpretationRelation examplifies explains Auxilliary Element Value Fic 5 6 Patron de description relationnel de l exp rimentation chirurgie cardiaque 171 Chapitre 5 Exp rimentations et discussions cette exp rience savoir celle li e strictement l audiovisuel AV et celles li es la m decine cardiaque Th me Program Animated enfantsCardiaques animation hasAVFeature Intervie
425. re peut se d duire de l usage futur de l ontologie selon qu elle soit destin e tre comprise par des tres humains ou par des syst mes informatiques Ce qui nous semble le plus important ici est la d termination des sc narios d usage et leur association des questions de comp tences informelles puis formelles Cette strat gie permet de d composer les objectifs qu est cens e atteindre la conception de l ontologie in fine les questions informelles les plus pr cises sont celles qui permettent d isoler les l ments du r pertoire ontolo gique concepts relations et les questions formelles permettent de leur attacher une s mantique en logique du premier ordre ces questions sont des formules logiques utilisant le langage d fini par l ontologie formules que les axiomes de la dite ontologie doivent impliquer Malheureuse ment ces questions sont videmment d terminer pour chaque domaine d application et la strat gie d analyse propos e reste vague peu d exemples sont exhib s De plus on ne sait pas si une telle approche par question de comp tence est propice ce qui fait le c ur de l activit de conceptualisation l organisation des concepts et des relations les uns par rapport aux autres en particulier via la relation de subsomption Il n est absolument pas s r que rattacher les notions des questions fussent elles organis es selon un sch ma objectif sous objectif aide l obtent
426. re tous ces outils que ce soit au niveau des mod les de repr sentation ou de l encodage des donn es L initiative du web s mantique a conduit une forte standardisation sur ces points ces derni res ann es N anmoins certaines fonctionnalit s correspondant pourtant 4 la d marche d fendue par les d fenseurs de cette initiative ne font pas encore l unanimit chez les utilisateurs comme la possiblit d diter collaborativement et distance les ontologies Le probl me est que cette standardisation ne semble pas aller dans notre sens Pour mettre en ceuvre les propositions m thodologiques retenues pour OPALES il faut plus que des interfaces de saisie correspondant des formalismes donn s fussent elles extr mement intuitives et d ta ch es en apparence de ces formalismes Pour la phase de formalisation cette assistance est utile puisqu elle a tendance rendre la conception ind pendante d un encodage particulier m me si on ne peut effacer le lien privil gi avec le paradigme de repr sentation qui a inspir l outil L op rationnalisation est galement grandement facilit e puisque les ontologies sont export es automatiquement dans les langages les plus couramment utilis s Cependant on ne voit pas comment mettre en uvre la phase de normalisation qui n cessite une gestion relativement fine d informations semi formelles ainsi qu une co ordination avec le reste du processus en par ticulier la phase
427. rection d autres supports Les observations qui suivent ne pr tendent pas au statut d tat de l art complet dans ce domaine Elles cherchent surtout rendre compte des probl mes rencontr s de la mani re dont ils ont pu tre abord s et en quoi les approches retenues peuvent r pondre nos pr occupations L int r t pour des techniques de repr sentation de connaissances structur es et sp cifi es pour am liorer les processus de description et de recherche est pr sent depuis que les chercheurs s ef forcent de trouver une alternative aux syst mes reposant sur la recherche textuelle Par exemple AS92 proposait d j de prendre en compte l importance des relations entre entit s dans un mod le de donn es graphique et un syst me de recherche reconnaissant les parcours possibles dans ces graphes pour r pondre des requ tes Mais le r f rentiel conceptuel employ tait re lativement limit quelques types seulement et non organis s entre eux Au fur et mesure des efforts de recherche ce r f rentiel s est progressivement toff Certains travaux d inspiration plus linguistique ont galement constat de leur c t l importance de la structuration relation nelle des donn es exploiter Le projet MENELAS ZC94 a recours des r f rentiels conceptuels et relationnels riches pour guider l extraction d information structur es partir de textes en faisant le pari que ces r f rentiels cr
428. rence explicitement plusieurs ontologies pour produire les descriptions est un point qui distingue l exp rimentation propos e ici de celle men e dans OPALES m me si pour l un des points de vues nous nous tions d j refus faire une fusion compl te A ce titre cette exp rimentation constitue bien une volution vers l utilisation de langages et d outils li s au web s mantique profitant ainsi des nombreux efforts de recherche men s dans ce domaine Indexation des documents AV Dans notre point de vue d crire un document AV implique de consid rer des aspects docu mentaires identifier les l ments et th matiques affirmer que ces l ments sont propos de quelque chose Distinguer l ontologie AV des autres ontologies th matiques nous permet de consid rer ces deux aspects L outil SegmenTool illustr en figure 5 5 nous a permis de segmenter les documents AV et de cr er les m ta donn es sp cifiques la description documentaire audiovisuelle en utilisant le langage MPEG 7 MPEG 701 Pour faciliter le processus de description et rendre ses r sultats plus coh rents nous avons videmment utilis un patron d indexation Dans le cadre de notre exp rimentation nous nous sommes encore une fois appuy s sur le point de vue eau du projet OPALES ainsi que sur les besoins d analyse documentaire de PINA dont une formalisation avait t propos e dans IT04 Comme voqu dans l
429. rer la continuit s mantique Les thesaurus constituent on l a vu une premi re approche pour r gler ce probl me de continuit Ils organisent les notions employ es dans le langage de description ce qui leur conf re un contexte d interpr tation intelligible Cette organisation peut m me tre exploit e au sein de syst mes assistant les recherches via des m canismes de reformulation de requ tes Mais on a vu que les sp cification th saurales sont par trop incompl tes et les index construits pas assez riches et pr cis Il faut donc aller plus loin ce qu autorisent justement les approches de repr sentation de connaissances En effet si on peut gr ce au recours des formalismes labor s repr senter des cas complexes on peut galement introduire les primitives des langages con us avec ces formalismes en faisant en sorte qu ils soient munis d une signification pr cise ind pendamment m me de leur emploi dans une base de faits organiser les connaissances Le premier moyen de d finir des primitives de repr sentation de connaissances est de recr er un contexte d interpr tation pour chacune d entre elle A l instar de ce qui se passe dans le cas de la langue naturelle il est possible de faire ceci au moyen du langage de repr sentation lui m me ind pendamment de tout syst me de r f rence indicielle au monde r el Il faut construire un v ritable syst me symbolique o les primitives de repr sentat
430. rer un message explicatif D un point de vue formel explique aurait donc comme domaine l union des concepts de Personne et d 0bjetAV 65 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV aPourTraitSaillant et explique ainsi que celle entre contient et explique Ainsi si l on tra duit ces r gles en un langage de repr sentation op rationnel un syst me pourra d duire de notre index l ensemble des assertions de la figure 2 14 repr sente aPourTraitSaillant represa Bae Emission Interview aPourTrait he NS i Es A oe DessinAnim repr sente emission_decrite Expert Saillant ot voque explique St nose Participant q pliq 3 8 Ce Ca exp 0 Sy Pliu e e locSpatiale Professeur Maladie CV j nie i Fonctionnement prof_1 maladieBleue Coeur joueRole RoleProfesseur Fic 2 14 Index compl t avec des connaissances inf r es y 7 SJ Les connaissances explicit es par le raisonnement sont repr sent es en gris Les ontologies permettent donc de mettre en ceuvre des traitements qui assistent les processus de recherche de fa on pertinente En ins rant les index dans un cadre d inf rence exploitant les connaissances de l application vis e dans le syst me on augmente le rappel du syst me de recherche d index tout en restant pr cis puisqu on applique des strat gies de recherche qui ne sont pas ind
431. ressivit autoris e pour les index les contenus documentaires sont complexes sp cia lement dans le cas des documents audiovisuels Il faut introduire un vocabulaire conceptuel riche et adapt l application envisag e Il faut aussi pouvoir cr er des index liant explici tement ces l ments conceptuels l aide de notions relationnelles qui soient sp cifiques l application concern e par l indexation le contr le le r f rentiel s mantique du langage doit tre d fini de mani re plus rigoureuse que dans les thesauri Cela impose deux efforts de sp cification l un en direction des utilisateurs dont les interpr tations intrins quement informelles et naturelles doivent tre guid es de fa on suffisamment pr cise et l autre formel et donc artificiel pour le syst me qui v rifiera la validit s mantique des index produits la manipulation des descriptions le syst me peut prendre en charge les t ches les plus simples de r interpr tation et de compl tion que les utilisateurs accomplissent lorsqu ils sont confront s aux index lors de leurs recherches 155 Chapitre 5 Exp rimentations et discussions Les solutions de repr sentation de connaissances et en particulier celles qui utilisent les on tologies peuvent tre adapt es au cas de l indexation Les ontologies fournissent les primitives de connaissances qui vont constituer un langage de repr sentation permettant de cr er
432. rg de leur manipulation que pour les utilisateurs humains qui vont les cr er et les visualiser Le sch ma de la figure 2 1 donne un aper u des rapports entre les diff rents aspects constituant l environnement et les l ments des SBC exprim Langage sic TRS Re on du domaine applicatif interpr t gt Interpr tation linguistique abstraction Mod le du cas exprim _ Repr sentation th orique intelligible selon du domaine rend e clarifie compte Q amp impl mentation Ontologie 2 formelle 5 i c PR fournit engagement sp cifie ontologique Base de exprim e Langage Vocabulaire connaissances selon de RC op rationnelle Fic 2 1 Les ontologies au sein des SBC On va voir que dans ce cadre il devient naturel d exprimer des connaissances complexes plus proches des besoins de l indexeur que les index construits avec les syst mes documentaires classiques En particulier il est possible de choisir un paradigme relationnel pour la description les index seront d clin s au niveau de la connaissance en des r seaux d instances de concepts structur s par des relations On vient d voquer que pour les SBC il tait n cessaire de recourir 4 des ontologies pour normer le vocabulaire utilis et lui donner une signification pr cise exploitable par l ensemble 2Ce sont les symboles utilis s par les langages de RC qui p
433. ri t s en v rifiant les contraintes 6 regarder s il manque des concepts dans la hi rarchie Le probl me est que cette m thode utilisant des notions relativement compliqu es est assez d licate mettre en uvre Elle l a pourtant t dans des cas concrets comme l analyse de l ontologie terminologique WORDNET OGGM02 Des travaux du laboratoire LARIA d Amiens BKMO3 dans la lign e de Kas99 ont galement appliqu cette m thode pour rationali ser la m thode de mod lisation COMMONK ADS appliqu e au param trage d algorithmes Et il faut remarquer que l int gration des principes d analyse formelle d OntoClean au sein de l en vironnement WebODE via le module ODECLEAN peut galement tre utile en soulageant le concepteur du travail fastidieux de d tection d inconsistance FG02 Cependant comme cette int gration et les travaux effectu s le rappellent cette m thode ne peut s appliquer que si une hi rarchie a d j t construite et que la signification des concepts est suffisamment claire pour attribuer les m ta propri t s de mani re certaine Elle ne donne au fonds pas de r elle prescription pour d terminer le contenu des notions ontologiques tourn e qu elle est vers l valuation et la correction formelles Le premier pas doit toujours tre r alis par le concepteur seul Il faut se rappeler que cette m thode vise plus le niveau de la forme absolue des notions que leur co
434. ription conceptuelle de documents AV du domaine Nous allons voir dans quelle mesure une telle approche peut tre r alis e et les possibilit s que cela induit en mati re de contr le et d assistance l utilisation d un SBC en vue d une indexation 2 3 1 Sp cifications ontologiques et respect de la continuit s mantique Nous avons vu dans le chapitre 1 qu une fonctionnalit indispensable d un syst me d in dexation est le besoin de contr le dans le sens de la continuit s mantique qu il s agisse de la cr ation des index ou bien de leur interpr tation Non seulement on a besoin d un vocabulaire adapt l application mais ce vocabulaire doit pouvoir fonctionner comme un r f rentiel de sens qui prescrit une interpr tation et un emploi pr cis pour les descripteurs propos s Ainsi il doit pouvoir contribuer la continuit s mantique qui doit tre v rifi e dans la cha ne documentaire En effet un syst me informatique d indexation et de recherche peut tr s bien tre un composant ind pendant du reste des processus li s l application qui lui sert de cadre Par exemple dans le cas de la r utilisation d l ments documentaires dans de nouvelles productions a n est pas lui qui va proc der au montage mais bien un op rateur humain qui doit avoir la certitude que les r sultats renvoy s par le syst me sont bien coh rents avec son interpr tation Cette fonctionnalit F2 s assure
435. rmation Par cons quent l effort de formalisation directe qui a lieu dans la plupart des approches alors qu elle prend acte de l imperfection des ressources dont elle dispose ne cherche r soudre ce probl me que dans son aspect formel La l gitimation des notions ontologiques par l usage permise par l extraction de ces notions de sources li es l application ne peut faire l conomie du travail de re construction rigoureuse du contexte d interpr tation n cessaire la bonne utilisation de l ontologie Avant de chercher obtenir des ressources formalis es exploitables par les m canismes d inf rence d un SBC il faut s assurer de la l gitimit ontologique de leur r f rentiel interpr tatif 4 3 Prescrire une mani re de construire les notions ontologiques Le probl me est qu aucune des contributions m thodologiques que nous venons d voquer ne force les concepteurs d ontologies expliciter clairement le sens qu ils attribuent aux notions de l ontologie En particulier il y a toujours besoin de fournir un guide m thodologique permettant de l gitimer ou de re l gitimer si on r utilise des hi rarchies existantes la construction des hi rarchies de sp cialisation si on recommande souvent de gloser les notions par le biais d une documentation ou de commentaires ce processus reste tr s informel Ce qui fait que l on ne clarifie pas forc ment assez son engagement ontologique dans les m
436. rt que dans le cas du patron noyau L tape de conception des ressources de haut niveau est donc logiquement ant rieure celle de concep tion des ressources m tier mais on ne peut faire d hypoth se sur la relation chronologique entre l instant o ces derni res sont d finies et celui o on les rattache aux premi res Ce flou dans l organisation du processus de sp cialisation des patrons ajout aux contraintes temporelles de notre th se nous ont emp ch d ajouter une contribution technique aux solutions m thodologiques que nous venons de discuter De surcro t les op rations l mentaires d adapta tion du patron au niveau des notions sp cialisation cr ation de connaissances de raisonnement sp cialis es sont g r es par les outils classiques de d veloppement d ontologies Ces m mes ou tils proposent d ailleurs des outils de visualisation d ontologies ou d extraits d ontologies qui seraient tout fait adapt s la manipulation graphique des patrons de conception des patrons noyaux les sp cialisant et des patrons applicatifs N anmoins il faut nuancer ce propos par l observation du fait que les patrons et notamment les patrons d utilisation applicatifs n ont pas forc ment de v ritable l gitimit ontologique au sens strict du terme Il sont en effet d finis un niveau dont la pertinence d essence pragma tique ne tient qu l application envisag e et non une quelconque
437. rtantes Mais la multiplicit des choix possibles en mati re de raisonnement pour la recherche d in formation peut ne pas remettre en cause les choix fondamentaux que nous avons faits S il existe videmment des travaux qui ignorent la dimension relationnelle lors des raisonnements ce n est 38 Alors que implication logique permet seulement de d cider qu un document est pertinent ou ne l est pas 189 Chapitre 5 Exp rimentations et discussions pas le cas de ceux que nous venons de citer Et l on peut envisager l adaptation de nos proposi tions de tels cadres non standard m me si celle ci n est pas vidente Par exemple la notion de patron d indexation peut tre maintenue quand bien m me ledit patron serait flou Et si le calcul de similarit dans un contexte non logique est une proposition essentiellement diff rente du recours des axiomes sp cifiant des cadres de d duction logique on peut faire observer que la premi re approche peut tr s bien r pondre elle aussi au probl me fondamental de compensation de la variabilit des index soulev par l exigence de continuit s mantique Faut il utiliser une ontologie par d faut pour l indexation audiovisuelle En fait pour d gager les types de raisonnements requis pour les syst mes d indexation cer tains des travaux d analyse que nous venons d voquer se basent sur une certaine classe de connaissances savoir celles qui sont li
438. s ou encore attribuer des propri t s alg briques une relation binaire r flexive transitive etc Il est ainsi possible de construire des expressions com plexes au moyen de primitives pist miques prenant en charge des besoins attest s dans nombre des applications de repr sentation de connaissances Les constructeurs utilis s d pendent en fait de la logique retenue Suivant les possibilit s de calculs et les imp ratifs de mod lisation on aura recours des logiques plus ou moins expressives de complexit algorithmique plus ou moins importante BCM 03 Parmi les constructeurs les plus fr quemment employ s on peut mentionner ceux qui ont t retenus pour le langage de repr sentation d ontologies OWL HPv03 OWL04 Et plus particu li rement son sous ensemble OWL DL qui s appuie sur la logique SHOTN D et comprend entre autres les primitives pist mologiques du tableau 2 1 D finition de classes D finition de propri t s D finition d individus Class ObjectProperty Individual subClassOf subProperty0f type equivalentClass equivalentProperty sameIndividualAs disjointWith domain differentFrom intersectionOf range AllDifferent union0f inverseUf complement Of SymmetricProperty oneOf FunctionalProperty someValuesFrom InverseFunctionalProperty allValuesFrom TransitiveProperty hasValue DatatypeProperty minCardinality maxCardinality cardinality TAB 2 1 Construc
439. s tels que discut s dans la section 4 2 2 ou pist miques de vraisemblance les notions de haut niveau utilis es reposent sur des travaux de concep tualisation de r f rence Ces travaux peuvent s appuyer eux m mes sur des principes phi losophiques prouv s ou tre adapt es de th ories abstraites largement adopt es comme les th ories math matiques On compte ainsi rendre plus explicite l engagement ontologique pla ant la conceptualisation de l application dans une vision propre du monde qui l environne CTPO0 par exemple pr sente la mani re dont on peut reprendre des th ories abstraites pour construire des ontologies d di es des domaines particuliers Ces th ories introduisent en effet des concepts des relations et des axiomes dont on peut faire h riter cette approche se place dans le cadre des frames des concepts et des relations plus sp cifiques mais aussi des axiomes qui r utilisent la structure et le contenu en les sp cialisant des axiomes g n riques Ainsi la th orie des graphes acycliques introduit des n uds des relations correspondant l existence d un arc ou l accessibilit d un n ud depuis un autre et des axiomes applicables ces entit s tel que celui qui permet le calcul de la relation d accessibilit partir des arcs Cette th orie peut tre sp cialis e en une th orie des graphes bloquables ou les n uds peuvent tre bloquants
440. s es vont vers ceux qui ont partag avec moi pauses caf et repas sur aire d autoroute ou en tente et aussi bien avant pendant ou apr s ce qu il sera convenu d appeler l Age d Or dont les anciens se souviennent les larmes aux yeux J r me Estelle Youn s Yohann Le Mortier Thomas R mi Jean Calude Matthieu Fabienne JPP Benedetta Steffen Claude Yann Avec une attention sp ciale pour V ronique et Rapha l pour tout ce qui a t partag dans le bureau des ontologues mais aussi au dehors Au del nombreux sont videmment ceux que je pourrais saluer qu ils soient de Paris Rouen ou Dieppe et oui Amis famille ceux d entre eux qui auraient ce manuscrit dans les mains pourront se reconna tre Le lecteur ext rieur ne trouvera pas ici de t moignage de gratitude envers un quelconque dieu sauf peut tre une allusion bien myst rieuse l esprit du Lama Dominant qui j esp re rester fid le Il ne trouvera pas non plus d autres pr noms except videmment celui de C cile qui je dois d sormais tant il Table des mati res Introduction 1 1 PINA endroit r v pour effectuer une th se CIFRE 1 2 Probl matique sN mase e Ames ek eA ARR LR OR a 2 2 3 D roulement de la th se 4 3 1 Cheminement de notre recherche 4 3 2 Retour sur ce qui a t fait dans la th se et plan du manuscrit 6 Partie I Introduire les ontolo
441. s et des relations du patron Par exemple l index de la figure 3 12 ne sp cialise plus le patron d indexation du point de vue dont il rel ve Pour rapprocher les deux on devra utiliser des connaissances de raisonnement tablissant des liens entre des structures de connaissance diff 106 8 8 Assister la formulation des descriptions rentes Dire par exemple que l on consid re pour notre application qu une action pratiqu e sur une partie d un objet ou d une personne l est sur cet objet ou cette personne Les r gles de rai sonnement s int ressant prioritairement la composition des relations conceptuelles s inscrivent souvent dans une telle optique Dans les exp riences que nous avons men es on trouve ainsi toute une s rie de connaissances de raisonnement dont l objectif est de ramener des connaissances for mul es de mani re non standard un format plus proche de celui qui sera utilis pour les index et surtout les requ tes La figure 3 15 montre des exemples de r gles relationnelles issues du domaine applicatif de la petite enfance et ayant cet objectif Outre celle du transfert de la relation de participation d une partie un tout on peut trouver une r gle sp cifiant qu une localisation peut tre attribu e une action si on conna t un rep rage spatial pour l un de ses participants D une configuration l g rement diff rente de celle du patron d indexation on peut ainsi d
442. s and real domain experiments we detail and discuss throughout this thesis English Title Building and Using Ontologies for Audiovisual Document Indexing
443. s cas rencontr s et les l ments d information reconnus pertinents l utilisateur peut en particulier 1 modifier les concepts et relations par sp cialisation ou g n ralisation 2 en ajouter d autres ou bien en retirer 3 r instancier les concepts par des individus nomm s Toutes ces modifications devront videmment tre en accord avec les contraintes formelles in troduites dans l ontologie en particulier celles qui sont induites par la donn e des domaines des relations Le graphe de la figure 3 11 pr sente un exemple d index r alis avec le patron d indexation de la figure 3 10 Dans le cas de cet index on a rajout une deuxi me action et les deux actions s inscrivent bien dans un m me cadre descriptif m me si la seconde la baln ation est d crite de mani re moins compl te que la seconde N anmoins cet index est toujours une sp cialisation du patron d indexation suivant la s mantique formelle des GC son interpr tation logique implique en effet celle du patron Mais il peut en tre tout autrement par exemple pour un segment montrant une m re rentrant le nombril de son nouveau n on trouvera l index de la figure 3 12 qui ne sp cialise pas le graphe patron Nouveau n ne sp cialise pas B b SoinAEnfant est une g n ralisation de SoinHygiene l indexeur n a s rement pas jug que l op ration montr e relevait des actes 99 Chapitre 3 Faciliter la conception et l a
444. s celle ci est extr mement proche de ce qui peut tre sp cifi pour les moteurs OWL Pour d autres exemples simplifi s on peut se reporter la page 65 25 Ces r gles peuvent d ailleurs remplacer partiellement les l ments perdus de OWL DL comme dans le cas des restrictions existentielles dans des d finitions par condition suffisante 176 5 2 Exp rimentations ontologiques lt owl Class rdf about ExpertInterview gt lt owl equivalentClass gt lt owl Class gt lt owl intersection0f rdf parseType Collection gt lt owl Class rdf about Interview gt lt owl Restriction gt lt owl onProperty rdf resource hasParticipant gt lt owl someValuesFrom gt lt owl Class gt lt owl intersection0f rdf parseType Collection gt lt owl Class rdf about Person gt lt owl Restriction gt lt owl onProperty rdf resource amp menelas role gt lt owl someValuesFrom rdf resource ExpertRole gt lt owl Restriction gt lt owl intersection0f gt lt owl Class gt lt owl someValuesFrom gt lt owl Restriction gt lt owl intersection0f gt lt owl Class gt lt owl equivalentClass gt lt owl Class gt lt owl Class rdf about ExpertRole gt lt owl equivalentClass gt lt owl Class gt lt owl intersectionOf rdf parseType Collection gt lt owl Class gt lt owl unionOf rdf parseType Collection gt lt owl Class rdf about amp menelas academic_role_function gt lt owl Class rdf
445. s d Ing nierie des Connaissances Rouen 2002 RDF04a RDF Ressource Description Framework Primer W3C Recommendation 2004 http www w3 org TR rdf primer RDF04b RDFS RDF Vocabulary Description Language RDF Schema W3C Recommen dation 2004 http www w3 org TR rdf schema RDH 04 RECTOR A DRUMOND N HORRIDGE J ROGERS J KNUBLAUCH H STEVENS R WANG H et WROE C OWL Pizzas Practical Experience of Teaching OWL DL Common Errors amp Common Patterns In 14th International Conference on Know ledge Engineering and Knowledge Management EKAW 2004 Northamptonshire UK 2004 Rec03 RECTOR A Modularisation of Domain Ontologies Implemented in Description Lo gics and related formalisms including OWL In Proceedings of the 2nd International Conference on Knowledge Capture K CAP 03 Sanibel Island Florida 2003 Rei99 REICH J R Ontological Design Patterns for the Integration of Molecular Biolo gical Information In German Conference on Bioinformatics GCB 99 Hannover Germany 1999 RGSF99 Rieu D GIRAUDIN J P SAINT MARCEL C et FRONT CONTE A Des op rations et des relations pour les patrons de conception In Congr s Inforsid 99 Toulon 1999 RZS 99 RECTOR A ZANSTRA P E SOLOMON W D ROGERS J E BAUD R CEUSTERS W CLAASSEN W KIRBY J RODRIGUES J M Rossi MORI A VAN DER HARING E J et WAGNER J Reconciling User s Needs and Formal Requirements Issues in deve
446. s d indexation Raisonnement Abstract Indexing audiovisual documents is a tedious work However it is needed if one wants to search efficiently for specific contents inside a large document base To reach its goal an indexing system has to ensure proper control and assistance with respect to the creation and the search for indices In this thesis we discuss the way knowledge based indexing systems ought to be designed We turn to the notions and tools introduced in the knowledge representation field and the Semantic Web initiative and try to adapt them to the practices found in INA as well as to the special needs of experimental projects such as OPALES We mainly focus on ontologies which are formalised conceptual models that can be used to specify the abilities of knowledge based systems regarding the control of descriptions and the reasoning processes We especially implement a method assisting ontology creation and insist on the use of ontological design patterns Central to our thoughts also lies the notion of indexing patterns Those relational structures mirror the typical indices that can be found in a given application and therefore help index creation Additionally they might be used to rationalise ontology conception especially regarding the design of the formal reasoning knowledge which specifies the inferences a knowledge based system can achieve Our methodological proposals have been applied in a range of concrete implementation
447. s de graphie FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS leclerc amp hypermarch FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS lecler amp magasin FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS lecler amp surface utilisation de notions conceptuellement proches de supermarch FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS landern FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS superm amp quimper introduction de crit res de localisation le premier magasin Leclerc a t ouvert Landerneau FIND lt IMAGO BASINA gt emission WHERE RDATDIF 01 01 1965 31 12 1965 AND ITOUSTEXT PH WORDS quimper introduction d une restriction de date peut tre pour avoir des images illustratives de la ville de Quimper l poque de l essor des magasins Leclerc TAB 1 2 Une s rie de reformulations de requ tes documentaires Cependant le monde documentaire pr f re employer des moyens plus formels et donc plus s rs de superviser la production des index Cela para t d autant plus souhaitable l heure o de nouveaux usages se profilent plus ouverts au monde ext rieur ce que laisse envisager la mise 23 Chapitre 1 La description des documents audiovisuels dans les processus documentaires disposition directe des fonds de l Inath que en direction des chercheurs depuis quelques ann es
448. s de l gitimation explicite et global De nombreux articles abordant ce th me ont propos s des principes de coh rence pour l gitimer une organisation des connaissances par rapport ses alternatives Un m me domaine d application pouvant tre mod lis de diff rentes fa ons il tait en effet pertinent de fournir des crit res permettant d tablir la sup riorit d une mod lisation sur une autre Gruber par exemple propose dans Gru95 cinq principes de conception respecter lors de la conceptualisation clart on veut que les d finitions contenues dans l ontologie ne d pendent pas d un contexte social ou computationnel particulier le recours au formalisme est encourag De plus une d finition compl te c est dire par condition n cessaire et suffisante est souhaitable d s que cela est possible coh rence les raisonnements que l on peut conduire l aide des axiomes d une ontologie ne doivent pas aboutir des contradictions extensibilit l ontologie doit tre con ue de mani re ce qu une extension cons cutive l mergence d un nouvel usage se fasse sans remettre en cause ce qui a t pr c demment con u biais d encodage minimum la sp cification de l ontologie doit tre aussi ind pendante que possible d un m ta langage de repr sentation particulier engagement ontologique minimal une ontologie devrait faire le moins d affirma
449. s de l implication recherch e peut varier suivant la logique et le syst me d inf rence retenus On peut se placer dans le cadre de la logique des pr dicats du premier ordre classique ou bien recourir une logique non classique comme la logique floue Et l int rieur m me d un cadre logique les proc dures de d duction validant l implication recherch e peuvent varier dans le cas de fragments de la logique du premier ordre graphes conceptuels et logiques de descriptions ont recours des strat gies de d duction diff rentes 64 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche permettent d augmenter ce qui est impliqu par l index on gagne en rappel par rapport un simple m canisme de recherche d occurrences de notions dans les index puisque plus d l ments sont en mesure de r pondre une requ te Et si les sp cifications sont correctes par rapport la signification du vocabulaire dans le domaine d application on conserve un taux de pr ci sion lev En effet les connaissances utilis es pour le raisonnement sont propres au domaine et aux usages et compr hensions qui y sont attest s et le raisonnement lui m me repose sur des interpr tations formelles pr cises Le tout est de pouvoir s appuyer sur des connaissances de raisonnements les axiomes de l ontologie qui soient tr s pr cis ment con ues pour garantir le respect de la continuit
450. s des propri t s de l accessibilit dans la th orie des r seaux On semble assez loin dans ces approches de trouver des patrons d indexation que nous avons introduits qui sont tr s li s la notion de motif relationnel r current Mais force est de reconna tre que le fait que les patrons s mantiques dont il est question dans ces travaux soient introduits comme des th ories est loin d tre contradictoire avec l acception des design patterns dans le g nie logiciel qui insiste bien sur les m thodes applicables aux objets pr sent s Et qu on a bien l un niveau abstrait les pr misses de ce que seront les connaissances assertionnelles d une BC Le typage fonctionnel de ces entit s indique bien les liens et op rations possibles et de fait souhaitables dans le cadre applicatif que l on a retenu Le rapprochement avec nos patrons d utilisation devient plus explicite dans la pr sentation que font Gangemi et ses coll gues des patrons de conceptions ontologiques appliqu s la cr ation d ontologies noyaur GM03 MGOS04 GCB04 Gangemi dans GM03 propose en effet de r utiliser les notions de haut niveau de l ontolo gie DOLCE GGM 02 ob issant aux principes de coh rence formelle nonc s par Guarino au sein d une structure relationnelle qui pr sente ces notions dans un contexte d utilisation ici les Descriptions et Situations Le patron qui en r sulte D amp S cf figure 4 4 pr
451. s descripteurs issus du thesaurus de INA aussi bien que du texte libre quand il n existe pas de descripteur adapt Elles permettent l indexeur de savoir quelle est l information qui est pertinente ce qu il doit ventuellement modifier retrancher ou ajouter selon le contenu qu il rencontre En fait ces grilles doivent tre comprises comme des candidats index adapter au cas particulier que constitue chaque document index Ainsi dans notre exemple l indexeur doit pouvoir remplacer le des cripteur centre hospitalier par clinique si le besoin s en fait sentir ACCIDENT MEDICAL DEL Pays si diff rent de France Ville DET M decine Centre hospitalier Nom de l h pital en champ Texte Accident chirurgical Erreur m dicale TAB 3 3 La grille d indexation d un accident m dical Nous devons noter que si les grilles ressemblent par leur aspect 4 un formulaire il y a pourtant des diff rences subtiles Tout d abord elles ne b n ficient pas d une structure relation nelle plus pr cise que celle offerte par les champs du formulaire d indexation introduit pour Vindexation th matis e PINA cf p 29 En ce sens elles ne proposent pas de sch ma v rita blement adapt chaque besoin applicatif on ne sait pas si le centre hospitalier est consid r comme le responsable de l accident ou comme un simple lieu alors que cette information peut sembler impor
452. s entit s de premier plan au m me titre que les objets qu ils relient Ainsi la logique du premier ordre introduit la notion unificatrice de pr dicat Ces pr dicats s appliquant aux constantes d un domaine d interpr tation ou aux variables peuvent tre d arit unaire ou multiple Ils repr sentent les notions abstraites qui servent d terminer les objets concrets des configurations du monde repr sent es ainsi que leurs interactions Dans le cas de notre application audiovisuelle nous pourrons trouver des pr dicats unaires comme Emission Interview ou Professeur mais aussi des pr dicats binaires comme Contient ou Participe Il sera ainsi possible de cr er un ensemble de formules logiques figure 2 2 rendant partiellement compte de l exemple de la page 29 l mission index e contient une interview qui est une s quence dans laquelle un des participants un professeur se livre une explication d une maladie cardio vasculaire la maladie bleue Emission emission_ decrite MaladieCardioV asculaire maladie_ bleue Ji p Interview i Professeur p AContient emission_decrite i Participe p i Explique p maladie_ bleue Va Interview x Sequence x FIG 2 2 Formules de la logique du 1 ordre repr sentant un extrait d index En regardant cet exemple on sait que l objet que l on d crit emission_decrite peut tre compris comme tant une mission et contient un objet non n
453. s le champ rdfs comment Ce champ destin contenir des informations textuelles ne peut pas tre structur de mani re rendre compte explicitement des d finitions diff rentielles En configurant l export de DOE de mani re appropri e on parvient tout de m me obtenir des commentaires lisibles et surtout r cup rables par tous les diteurs de notre tude Les informations de l ontologie formelle sont galement export es avec succ s comme on l a d j fait remarquer il y a des similitudes entre l expressivit de RDFS et celle des supports GC pour l export desquels notre diteur a t con u en premier lieu On a donc l un r sultat extr me ment important on peut poursuivre le travail de formalisation et d op rationnalisation entam dans DOE dans un autre outil en ayant toujours acc s aux informations qui ont t d finies ant rieurement Les choses sont plus d licates en ce qui concerne l import dans DOE d ontologies cr es avec d autres outils RDFS est en effet un langage qui m me dans sa syntaxe XML admet plusieurs variantes syntaxiques ce qui complique consid rablement le travail de conception des feuilles de style XSLT Par exemple comme on l a voqu la page 173 on peut d clarer une classe comme un l ment rdfs Class ou comme un l ment rdf Description de type rdfs Class De plus comme ces ontologies sont essentiellement des ontologies munies d une s mantique formelle il
454. s mains de ceux qui connaissent les arcanes du syst me plut t qu au large public des usagers et des clients Au cours d observations que nous avons men es sur des sessions de recherche documentaire VINA par le biais de fichiers de trace nous avons pu analyser comment les documentalistes proc dent une s rie de reformulations de leurs requ tes au fil de leur intuition et de leurs connaissances sur le sujet concern Par exemple pour une requ te demandant des images sur les d buts des supermarch s Leclerc le documentaliste pose une requ te comportant les mots clefs supermarch et Leclerc qu il affine suivant des crit res de date ou g ographique Ces raffinements peuvent leur tour tre suivis d largissements ou des reformulations faisant intervenir des termes li s de supermarch magasin puis hypermarch Il est noter que le dernier terme n existe pas encore l poque cibl e mais une indexation post rieure elle m me r alis e sur un document r cent peut tr s bien l avoir introduit dans le parcours qui m ne au bon document Le tableau 1 2 donne les diff rentes requ tes rentr es dans le syst me par le recherchiste ainsi pist FIND lt IMAGO BASINA gt emission WHERE ITOUSTEXT PH WORDS leclerc amp supermar recherche de notices comportant les mots Leclerc et supermarch un joker est utilis pour compenser les variation
455. s with RDF Technology the DOPE Project IEEE Intelligent Systems 19 3 2004 219 Bibliographie TA JO1 Tam02 TUDHOPE D ALANI H et JONES C Augmenting Thesaurus Relationships Pos sibilities for Retrieval Journal of Digital Information 1 8 2001 TAMMA V A M An Ontology Model supporting Multiple Ontologies for Knowledge Sharing Th se de doctorat University of Liverpool 2002 TBC 02 THOMERE J BARKER K CHAUDHRI V CLARK P ERIKSEN M MISHRA S TBHO3 T102 PORTER B et RODRIGUEZ A Web based Ontology Browsing and Editing Sys tem In Proceedings of the 14th Innovative Applications of AI Conference IAAI 02 Edmonton Alberta Canada 2002 THOMOPOULOS R BUCHE P et HAEMMERLE O Du flou dans les graphes concep tuels In 3 mes Journ es Nationales sur les Mod les de Raisonnement JNMR 03 Paris 2003 Rapha l TRONCY et Antoine ISAAC DOE une mise en oeuvre d une m thode de structuration diff rentielle pour les ontologies In 13th Journ es Francophones d Ing nierie des Connaissances IC 02 pages 63 74 Rouen France May 28 30 2002 TNLt05 TOLKSDORF R NIXON L J B LIEBSCH F MINH NGUYEN D PASLARU BONTAS TPCO4 Tro04 Tur98 TV03 TVV04 UG96 UK95 van86 VB96 220 E et Nixon L J B Enabling real world Semantic Web applications through a co ordination middleware In Proceedings of the 2 4 European Semantic We
456. saurus actuels D un autre c t les disciplines de l informatique et plus particuli rement de l intelligence artificielle apportent des r ponses des probl mes g n riques qui pourraient bien tre li s aux probl mes documentaires concrets de l Institut Des techniques d ing nierie des connaissances permettent en effet d encoder les significations de ressources conceptuelles de mani re les rendre manipulables par des syst mes informatiques Ces techniques ont parmi leurs objectifs d am liorer l acc s le partage et la r utilisation de ces connaissances entre syst mes mais aussi entre utilisateurs humains Leurs principales caract ristiques sont la formalisation des connaissances ces derni res deviennent utilisables par l ordinateur qui m ne des raisonnements la relative richesse expressive dont on dispose dans ce cadre formel les langages de re pr sentation comprennent toutes sortes de concepts relations r gles de d finition et de raisonnement qui permettent d organiser les connaissances exploit es par le syst me la g n ricit des architectures envisag es celles ci utilisent des langages de repr sentation de connaissances qui sont adaptables des domaines et des applications variables des ontologies sp cifient la signature du langage construit ainsi que les r gles de raisonnement sp cifiques qui s appliquent ses l ments Ces techniques qui r sultent d effor
457. se devait de consid rer quelques unes de ces propositions Cette exp rimentation est venue conclure un long travail de collaboration avec Rapha l Troncy autour de la conception et de l emploi d une ontologie de l audiovisuel qui tirerait parti du savoir faire documentaire de PINA dans un cadre formel de description ontologique et de recherche automatis e d index IT04 IT05b Mise en place de l exp rimentation Pour demeurer dans un cadre familier nous avons choisi d adapter un th me d j abord celui d une lecture critique des documents audiovisuels telle qu abord e dans le point de vue eau d OPALES Cette pr occupation est relativement proche des pr occupations docu mentaires de notre Institut puisqu elle implique une description pr cise de la structure et du contenu th matique des documents audiovisuels De ce fait elle int ressait aussi au premier plan les travaux effectu s au cours de la th se de Rapha l Troncy Dans ces travaux tait en effet particuli rement reconnu le fait que les descriptions doivent m langer des l ments strictement orient s description audiovisuelle et des notions relevant d un domaine donn Nous souhaitions cependant changer de domaine Nous avons fait le choix de nous concentrer sur le celui de la m decine Des fonds de INA nous avons extrait une trentaine de documents AV en majorit des magazines d a peu pr s une heure chacun Nous en avons ensuite
458. sent la cr ation de ressources structur es M me dans le cadre des langages les plus contraints il reste toujours possible d exprimer et comme on verra par la suite d utiliser pour des raisonne ments des liens sp cialis s entre les entit s de la base de connaissances Seuls varient le statut accord ces liens entre entit s de premier ordre et attributs d une entit conceptuelle con ue comme l l ment central de la repr sentation et l arit permise uniquement binaire ou bien quelconque Dans un syst me documentaire reposant sur l utilisation d un langage de repr sen tation de connaissances structur es les index pourront donc b n ficier d une capacit expressive sup rieure celle des syst mes documentaires traditionnels Au sein de la fonctionnalit F1 introduite dans le chapitre 1 pour traiter ce probl me d ex pressivit nous avions distingu les besoins concernant la forme des descriptions la possibilit de cr er et d exploiter des expressions dont la forme est labor e de ceux relevant de leur substance la possibilit de faire reposer ces expressions sur un vocabulaire riche et adapt au domaine d application S agissant de l expressivit formelle des index les connaissances cr es pour repr senter les index s inscrivent bien dans le paradigme relationnel que nous recherchions Quel que soit le choix de repr sentation retenu pour ces liens relations propri t s
459. sid r s Ainsi que sur la r flexion m thodologique dans le but de pouvoir g rer de la mani re la plus efficace possible la conception et l utilisation de ces r f rentiels sp cialis s Cette initiative du web s mantique a g n r quelques syst mes de recherche qui sont deve nus par la suite des r f rences SHOE HH01 et Ontobroker FAD 00 par exemple ont t les premiers g rer la repr sentation d annotation documentaires reposant sur des ontologies qui permettent l adaptation des traitements dont ces repr sentations font l objet Projets pion niers ils ont cependant plus cherch r pondre aux probl mes techniques qu se positionner du c t des usages tels que nous les concevons Ontoseek GMV99 se rapprochait plus de cas d utilisation r els et des utilisateurs que l on peut y rencontrer par l utilisation de l ontolo gie linguistique WORDNET Fel98 Mais les proc d s de recherche utilisant la similarit entre graphes ne r pondent plus forc ment ce que nous cherchons Quant aux travaux expos s dans RBF 02 AMO 03 HS03a Svd 04 qui repr sentent autant d avanc es importantes pour la r alisation technique des objectifs du web s mantique il n op rent pas vraiment de rapproche ment explicite et d taill entre ces solutions et les besoins auxquels elles permettent de r pondre rapprochement indispensable l obtention d un cadre m thodologique coh rent De plus ces pr
460. signification formelle interpr table par des syst mes d inf rences Les s mantiques formalis es employ es pour cela comme les s mantiques ensemblistes sont videmment dif f rentes de celles non formalis es qui donnent aux ressources traditionnelles d une application une signification claire pour les humains qui les manipulent Quelles que soient les th ories in terpr tatives que l on retient dans chacun de ces deux mondes on est s r de se retrouver face une forme d incompatibilit ces th ories ayant pour but d exprimer des l ments de signification irr ductibles les uns aux autres Et pourtant nombreux sont les syst mes informatiques de gestion et de recherche d infor mation qui fonctionnent plut t correctement au regard de ce que l on attend d eux Lorsqu on prend en compte les besoins d une application de mani re convenable le recours des calculs visant assister celle ci n est pas n cessairement contre productif loin s en faut Ce qu il faut c est concevoir les ressources du syst me et la mani re dont celui ci les exploite de sorte ce qu elles soient en accord avec les usages et compr hensions du domaine en d autres termes les contraintes s mantiques que l on associe aux entit s que l on y rencontre Dans notre cas il faudra donc proposer une m thodologie d indexation base de connaissances formelles dont les r flexions concerneront tout la fois la co
461. significatives et d une mise en uvre dans un outil d dition d ontologie DOE Cette section constitue le premier pas vers une prise en compte efficace de nos consid rations applicatives dans le cours de la conception des ontologies Apr s le cas de la normalisation s mantique qui se pr occupe en priorit de la substance des index ontologiques concepts et relations vient le cas des patrons d indexation tourn s vers leur forme Pour obtenir des r sultats coh rents tant d un point de vue pratique que th orique nous proposons de reprendre en la pr cisant l approche des patrons de conception ontologiques Certains auteurs avancent en effet dans leurs travaux des structures g n riques r utilisables au sein d ontologies de domaine sp cialis es Nous allons montrer que cette vision telle qu elle a t introduite peut tre trop rigide au regard de besoins concrets mais qu elle peut ais ment tre adapt e notamment via le recours des connaissances de raisonnement d di es pour r pondre nos pr occupations 4 2 Des propositions pour rationaliser la conception des ontolo gies Il existe beaucoup de synth ses en mati re de construction de ressources ontologiques par exemple UG96 JBV98 Gom99 DSWT99 ou plus r cemment GFC04 qui propose le r capi tulatif le plus complet Avec la profusion d ateliers qui ont abord le sujet on peut bien se rendre compte des incertitudes th oriques et p
462. sqceEntretienMaladiesCV gt lt av Program gt lt av Interview rdf about EC_sqceEntretienMaladiesCV gt lt av hasParticipant rdf resource EC_prof1 gt lt av hasEditingInsert rdf resource EC_dessinStenose gt lt av Interview gt lt av Person rdf about EC_profi gt lt menelas role rdf resource EC_profRolel gt lt av Person gt lt menelas professor rdf about EC_profRole1 gt lt menelas cardio_vascular_disease rdf about maladieBleue gt lt av Explanation rdf about EC_explicationMaladiesCV gt lt av explains rdf resource maladieBleue gt lt av Explanation gt lt av Drawing rdf about EC_dessinStenose gt lt av explains rdf resource EC_stenoseAP gt lt av hasAVFeature rdf resource animatedValue gt lt av represents rdf resource EC_stenose gt lt av represents rdf resource EC_coeur1 gt lt av Drawing gt lt menelas stenosis rdf about EC_stenoseAP gt lt menelas cause_of rdf resource maladieBleue gt lt menelas state_of rdf resource EC_arterePulmonairei gt lt menelas stenosis gt lt menelas pulmonary_artery rdf about EC_arterePulmonairel gt lt menelas part rdf resource EC_coeur1 gt lt menelas pulmonary_artery gt lt menelas heart rdf about EC_coeur1 gt lt av Animated rdf about EC_animation1 gt lt rdf RDF gt CODE 5 1 Index d crivant une mission contenant une interview en RDF 174 5 2 Exp rimentations ontologiques
463. ssances de raisonnement ou de liens sp cifiques au domaine employables dans des d finitions SLL 04 montre que cela est envisageable et m me de fa on semi automatique mais le travail fournir reste tr s important Une telle adaptation de ressources pr existantes est donc extr mement d licate Tout d abord on doit bien faire remarquer que ces ressources ne sont pas toujours imm diatement disponibles on ne trouvera pas de thesaurus ou de corpus textuel exploitables pour chaque application De plus il faut bien faire attention la fa on dont sont adapt s les r seaux de significations que l on peut r cup rer partir de ces sources Il faut videmment fournir un travail de formalisation consid rable si l on veut b n ficier de la rigueur formelle et des connaissances de raisonnement qui constituent les avantages les plus importants des ontologies Cependant il ne faut pas n gli ger l interpr tation naturelle des notions de l ontologie en construction Car contrairement ce que l on peut esp rer les ressources pr existantes ne r pondent pas forc ment aux crit res de rigueur que nous souhaitons atteindre et ce d s le niveau des connaissances informelles Une ontologie a un objectif de classification rationnelle que n ont pas forc ment les p ritextes voir page 20 de l application qui d crivent tr s souvent des faits ou les thesauri qui sont construits en premier lieu pour la recherche d info
464. ssions s mantique La s mantique diff rentielle est elle la seule autoriser une normalisation Nous venons en effet d un laboratoire universitaire le LALICC qui propose une th orie s mantique qui s int resse la d termination de types primitifs puis leur utilisation au sein de structures qui rendent compte des significations des l ments de la langue en une d marche coh rente et for malis e Des90 On trouve notamment des sch mes s mantico cognitifs Abr95 voir figure 5 12 qui dans le domaine verbal permettent de d finir par exemple des situations statiques ou bien des volutions qui s appliquent aux diff rentes entit s impliqu es par les actions d nonciation De tels travaux seraient d un int r t certain pour pauler l analyse ontologique d un domaine d application De fait nous avons essay de les prendre en consid ration lors de quelques unes de nos exp rimentations comme nous l avons voqu en section 5 2 1 Cependant force est de reconna tre que nos efforts ont t relativement peu satisfaisants d un point de vue scientifique Si les primitives s mantiques de cette th orie sont adapt es la conception de vocabulaires abstraits coh rents le passage au niveau d un domaine d application peut s av rer dans un certain sens contre productif Les propositions qui sont faites ici prennent en effet tout leur int r t d s lors qu il s agit d exprimer les nuances des expr
465. st finalement celui dont les centres d int r ts ont t les plus proches des n tres sa th se aborde en effet le th me des b n fices de l emploi des ontologies pour la description documentaire Mais elle le fait d une mani re plus concentr e sur la cr ation de ressources sp cifiquement documen taires et son orientation m thodologique est moins globale que la n tre en ce qui concerne la conception des ressources ontologiques elle m mes Tro04 surtout si l on consid re l int r t que nous portons aux descriptions et connaissances de raisonnement de nature relationnelle Il reste que beaucoup de nos travaux et des r sultats de ceux ci ont port sur des probl mes partag s et ont d bouch sur la r alisation d objets communs comme on pourra le constater lors de la lecture de notre chapitre consacr aux exp rimentations que nous avons men es lors de cette th se Les ontologies que nous avons r alis es les outils que nous avons construits les r flexions m thodologiques men es ont ainsi pu b n ficier d efforts qui s ils gardaient des points de vue particuliers partageaient un objectif de recherche commun contribuer la d finition et d montrer les conditions de faisabilit d un nouveau paradigme d indexation et de recherche documentaire Le lecteur de ce manuscrit verra tous ces aspects plus en d tails au fur et mesure de leur mobilisation dans le fil de notre argument
466. sur des significations formelles labor es pour garantir la coh rence et la pr cision qui ont n cessit dans les syst mes documentaires Vabandon de la langue non contrainte Ces deux objectifs apparemment contradictoires peuvent on va le voir tre partiellement r con cili s On peut pour cela s appuyer sur les pratiques existant dans le domaine d application du syst me documentaire les l ments qui sont int ressants 4 d crire leur interpr tation dans le cadre applicatif et l assistance attendue de la part du syst me de recherche On l a vu en effet dans le chapitre 1 on n indexe le plus souvent que dans le cas d une application bien pr cise Sans vis e applicative pas de strat gie d interpr tation du contenu documentaire et pas ou tr s peu de prescriptions interpr tatives 4 m me de garantir une compr hension et une ex 77 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques ploitation correctes des index Ce constat vident dans le cadre documentaire traditionnel est souvent oubli ou n glig dans les approches base de connaissances Est il faisable d isoler de mani re pr cise les pratiques applicatives Il n est pas du ressort de ce manuscrit d apporter une r ponse d finitive ce probl me g n ral d acquisition des connais sances N anmoins on peut faire remarquer que les usages documentaires s incrivent souvent dans des communaut s bien d limit
467. t 5Les codes REA PRO PRE et PAR d signent respectivement le r alisateur le producteur les pr sentateurs et les participants 15 Chapitre 1 La description des documents audiovisuels dans les processus documentaires Titre propre Titre collection Chaine de diffusion Date de diffusion Statut de diffusion Heure de diffusion Heure de fin de diffusion La mort de l infarctus Comment a va France 3 26 01 1996 Premi re diffusion 23 18 58 24 10 27 Th matique M decine sant Genre Magazine Reportage Type de description Emission composite M diam trie Culture connaissance magazine m decine G n rique REA Gauthier Bertrand PRO Lanzi Jean PRE Lanzi Jean PRE Olivry Etienne PAR Fruchart Jean Charles PAR Jordanne Jean PAR Marco Jean PAR Nataf Patrick PAR Lemonier Sophie Descripteurs maladie cardio vasculaire ath roscl rose infarctus cholest rol pr Descripteurs secondaires R sum vention alimentation r gime alimentaire op ration chirurgicale pontage coronarien art re dilatation d pistage recherche m di cale m decine pr dictive Toulouse Chine Lille Strasbourg Etats Unis ville framingham image de synth se endoscopie Un dossier principal pr sente un tour du monde des pratiques alimen taires et des politiques de d pistage avec pour guide le professeur Jean Charles FRUCHART Institut Pasteur de Lille Dans une deuxi me partie
468. t Agent qui est anti rigide on peut toujours trouver des situations ou un individu qui a t agent peut ne plus l tre La r gle de subsomption correspondant la rigidit stipule qu une propri t anti rigide ne peut subsumer qu une propri t du m me type Par cons quent on peut am liorer une hi rarchie en attribuant les m ta propri t s de rigidit et d anti rigidit aux propri t s concern es et en reconsid rant toutes les relations de subsomption qui enfreignent la r gle concernant l h ritage et la rigidit Au fur et mesure des corrections on rendra plus explicites les affirmations sous entendues par la conceptualisation Par exemple Agent ne peut g n raliser Personne il devra tre introduit comme un r le que pourra jouer une personne En fait Guarino introduit bien d autres r gles concernant l association de conditions d identit existence d attributs permettant de distinguer les instances les unes des autres comme un num ro ISBN pour un livre aux propri t s la d pendance des propri t s entre elles une propri t est d pendante d une autre si toutes ses instances sont n cessairement li es une instance de celle ci le concept de S quence d pendant par exemple de celui de Programme toute s quence faisant partie d un programme et les conditions d unit permettant de d clarer que tout individu instanciant une propri t peut tre
469. t tre consid r s comme d notant une certaine expertise pour l application Dans notre cas nous avons s lectionn parmi les sp cialisations du concept role de l ontologie 2Voir en page 60 ou OWL04 pour une pr sentation compl te 175 Chapitre 5 Exp rimentations et discussions MENELAS les concepts sp cialisant les r les acad mique professionnel et hospitalier l excep tion du r le attribu l institution hospitali re elle m me ce qui a t rendu possible en utilisant le constructeur OWL owl complementOf Cet exemple formul partiellement en logique de des cription dans la figure 2 12 de la page 61 est pr sent en utilisant la syntaxe XML de OWL dans le code 5 3 Ainsi on peut encoder les connaissances autorisant les inf rences illustr es par les changement de types de concept sur la figure 5 8 et r pondre des requ tes comme missions contenant des t moignages d expert expliquant une maladie cardio vasculaire Pour impl men ter de tels raisonnements on peut se tourner vers des raisonneurs OWL comme BOR SJ02 qui a t int gr dans Sesame Et pourtant cette solution peut ne pas tre assez puissante Comme nous ciblons des index riches en connaissances relationnelles nous voudrions exploiter des connaissances de raisonne ment exploitant ces relations OWL DL permet de sp cifier des propri t s alg briques pour les relations comme la transitivit le code 5 4 montre pa
470. t rielle Par exemple VINA comme beaucoup d institutions s effor ant de capitaliser leurs connaissances a con u des guides m thodologiques recensant les bonnes pratiques susceptibles de r pondre ses besoins Ces guides sont pr sents sous la forme de bibles d indexation Pic96 ou d indications r par ties entre les diff rents descripteurs dont l emploi peut poser probl me Des notes d application ext rieures au thesaurus et plus compl tes que celles ci en quelque sorte L INA s int res sant la caract risation pr cise des programmes de t l vision on trouvera toute une s rie de recommandations concernant l emploi de plusieurs cat gories d objets audiovisuels pour d crire un programme donn Ainsi la rubrique mini programme en plus des pr cisions sur la si gnification du descripteur correspondant on trouve des r gles d usages qui indiquent quelles sont les cat gories plus techniques qui lui sont typiquement associ es interview animation montage d archives et autres Il existe cependant des solutions plus formalis es des grilles d indexation qui indiquent di rectement pour diff rents th mes ou v nements les descripteurs qui doivent appara tre dans 92 8 8 Assister la formulation des descriptions Vindex Par exemple on peut trouver une grille relative un v nement de type accident m dical illustr e dans le tableau 3 3 Ces structures recommandent de
471. t introduire de telles relations entre les notions qu ils contiennent mais qu ils ne le font que de mani re implicite Soergel dans SLL 04 rappelle par exemple que la relation m r ologique est parfois exprim e aussi bien par l inter m diaire des relations hi rarchiques que des relations d association et ce au sein d un m me thesaurus Il faut noter que ce d faut peut avoir des r percussions tr s importantes si un the saurus associe une interpr tation floue aux relations qu il pr sente et en particulier la relation En recherche d information le rappel d signe le rapport entre le nombre de r ponses correctes renvoy es effectivement par le syst me et le nombre de r ponses correctes qu il aurait d renvoyer Cette notion est compl mentaire du silence 137 a pr cision d signe le rapport entre le nombre de r ponses correctes et le nombre de r ponses total renvoy es par le syst me Cette notion est compl mentaire du bruit 27 Chapitre 1 La description des documents audiovisuels dans les processus documentaires hi rarchique on peut douter qu il suffise apporter un contexte d interpr tation suffisamment pr cis pour garantir la continuit s mantique Il serait donc n cessaire de distinguer clairement ce qui rel ve de l organisation hi rarchique de la structuration horizontale et d introduire expli citement les types de relations qui correspondent aux associations entre notions d
472. t l eau Le premier concernait des documents vocation ethnologique 13 documents pour peu pr s 6 heures de vid o La strat gie de description en accord avec les experts de ce domaine participant au projet documentalistes chercheurs s est concentr e sur les actions de soins prodigu es aux nouveaux n s toilette allaitement endormissement Avec V ronique Malais nous avons d fini une ontologie permettant de traiter ces aspects V ronique Malais a tout d abord travaill sur l extraction de termes partir de ressources textuelles ou terminologiques du domaine Ensemble nous avons ensuite appliqu la normalisation s mantique pr conis e par Bruno Bachimont la lumi re du contexte textuel dans lequel les termes apparaissaient Il faut galement remarquer que comme dans le cas de l ontologie du cyclisme nous nous sommes tourn s vers les concepts de haut niveau de l ontologie du projet MENELAS pour organiser le haut niveau de notre propre ontologie C est ce moment que nous avons pu d terminer le patron d indexation tel qu illustr dans la figure 3 10 de la page 99 des m res d crites par leur posture pratiquent des soins d hygi ne sur TL assignation des m ta propri t s relevant du niveau de la forme des concepts assigne en effet ceux ci des lois dans le cadre d une logique modale Par exemple pour le concept Personne et si l on renonce consid rer l indexation tempor
473. t l ob jet d une normalisation s mantique Bac00 Comme nous le verrons dans le chapitre 4 cette proposition d passe en fait le cadre de la simple interpr tation de concepts et relations puis qu elle s inscrit dans un processus complet de conception d ontologies Nous pr f rons n anmoins aborder d s ce moment les caract ristiques qui font d elle un outil pr cieux pour l acc s la signification de l ontologie et des index qui sont con us avec son aide Une s mantique diff rentielle pour les unit s linguistiques Tout part en fait des intitul s langagiers des concepts et des relations Ind pendamment des sp cifications formelles de ces notions il faut leur donner une signification informelle ad quate au domaine consid r Pour cela des textes s lectionn s pourraient constituer le contexte d interpr tation id al N anmoins leur rattachement l ontologie pose probl me Il faut donc se r soudre recr er autour des notions un contexte artificiel qui guide leur interpr tation linguistique de mani re satisfaisante Quelle th orie s mantique peut elle tre utilis e une telle fin Bruno Bachimont se tourne vers la s mantique diff rentielle de Fran ois Rastier RCA94 Dans le paradigme diff rentiel le sens est intra linguistique il se construit par des relations de similarit et d opposition entre les unit s du syst me linguistique On ne se pr occupe pas du rapport des termes a
474. t la nature des constructeurs changent en fonction de la logique de description consid r e permettant de contr ler l expressivit autoris e pour les formules et de se concentrer sur les primitives utiles pour une d claration satisfaisante des informations au niveau de la connaissance de structurer facilement les connaissances ainsi d clar es et de les r partir entre ce qui rel ve d une conceptualisation g n rale un domaine et d assertions particuli res mais aussi de distinguer les diff rentes sortes de notions rencontr es chacun de ces niveaux de s appuyer sur cette structuration des connaissances et sur les restrictions op r es par rapport la logique du premier ordre pour proposer des processus de d monstration plus efficients voire complets Pour aider la conception et l utilisation des SBC les LD font clairement le distinguo entre des connaissances terminologiques on parle parfois de T box d finissant concepts et r les nous verrons plus en d tail dans la section 2 3 1 quelles sont les diff rentes possibilit s en la mati re et des connaissances assertionnelles A box d crivant les individus effectivement rencontr s dans les situations repr sent es et comment ceux ci sont reli s entre eux Ces assertions sont semblables aux formules de la logique du premier ordre faisant intervenir des constantes nomm es ceci pr s que les pr dicats ne peuvent
475. t pr f rer un tel choix Dans Sesame une telle opportunit est impl ment e dans un module d inf rence sur mesure o les axiomes et les r gles de RDFS sont compl t es par ceux de OWL DLP et des r gles de raisonnement sp cifiques aux ontologies exploit es C est une mani re plut t rigide de concevoir un tel syst me les r gles sont encod es au niveau de la sp cification du raisonneur et non dans l ontologie elle m me mais elle permet cependant de mettre en uvre des raisonnements int ressants On peut ainsi de l index de la figure 5 8 d duire les assertions gris es et en pointill qui viennent s ajouter celles issues des raisonnements OWL On dispose alors de bien plus d l ments dans la base de connaissances pour r pondre aux requ tes Le tableau 5 2 r sume le nombre de triplets explicites et inf r s contenus dans la base de connaissances Sesame pour notre exp rimentation La saturation de cette base est obtenue en utilisant les r gles OWL DLP compl t es par une vingtaine de r gles sp cifiques l application en majorit des r gles de composition Le code de la figure 5 5 montre un extrait du fichier sp cifiant le fonctionnement du raisonneur sur mesure que nous avons construit pour Sesame Cette r gle s int resse la composition des relations de d composition en s quence et de repr sentation si un objet a comme 3BOR impl mente en fait la s mantique du langage DAML OIL mai
476. t proche du n tre savoir l analyse de documents audiovisuels la bor s m langeant interviews et extraits Sto03a Mou99 et LA83 soulignent bien l importance de l analyse du contenu personnes th mes et lieux sont mentionner Mais elles voquent aussi un autre imp ratif la forme audiovisuelle influen ant la perception et donc la compr hension de ce qui est montr il faut en tenir compte lors de l indexation De fait de nombreuses re cherches documentaires ciblent plus l objet audiovisuel en tant que support d une information que cette information elle m me que l on peut d ailleurs souvent atteindre dans des documents plus faciles manipuler que les documents audiovisuels On se retrouve dans la situation d un usage analogue celle de la citation dans le texte il s agit tout autant de rendre compte d une 18 1 2 Le probl me de l acc s l information pour les documents audiovisuels pr sentation particuli re de s appuyer sur une l gitimit donn e pour les images d archives que de traiter un th me donn Michel Dauzats de VINA faisant un tat des lieux des langages documentaires d di s l image dans Dau94 rappelle bien que l un des objectifs en la mati re a fortiori pour les documents audiovisuels est d indexer la forme et la technique Ceci impose de produire des descriptions relatives aux proc d s audiovisuels employ s de proc der une analys
477. t que de produire une ontologie qui convienne son m tier De fait un tel sujet correspond 9Notamment en section 2 4 pages 66 et suivantes 4011 faut mentionner que l on retrouve ici une partie des probl mes que l on a d j voqu es dans cette section page 187 190 5 3 Discussions m thodologiques des pratiques relativement bien tablies qui cr ent un cadre satisfaisant d activit d acquisition des connaissances Et finalement d un point de vue plus personnel il s agissait l d un terrain d exp rimentation extr mement int ressant pour nos propres hypoth ses Ainsi que nous l avons mentionn dans la section 5 2 3 cette ontologie la constitution de laquelle nous avons tr s activement particip a t inspir e par les usages de PINA Sous notre impulsion et au contact de chercheurs sp cialistes de la s miotique du document audiovisuel comme Peter Stockinger Sto03a ou Louis Chamming s de la direction de la recherche de VINA elle a pris un tour plus s miotique Elle contient a pr sent des primitives permettant comme dans le cas du point de vue audiovisuel d OPALES de faire la distinction entre la description d une forme audiovisuelle celle de son contenu th matique et celle de la liaison entre les deux niveaux pr c dents Jn fine on dispose d un contenu ontologique propre aux sp cificit s du document audiovisuel auxiliaire dans la mesure o il devra tre
478. t sp cifi es dans les supports permettent un contr le qui concerne autant la substance des descriptions on a vu pr c demment que les graphes ne contiennent que des concepts et des relations issus du support la forme des descriptions signatures et hi rarchies en conjonction avec le respect de r gles de construction pr cises permettent de contr ler les combinaisons de concepts et de relations qui sont consid r es comme l gales dans le domaine Expressivit formelle et continuit s mantique l exemple des LD On peut d finir de mani re similaire les primitives de repr sentation utilis es dans les logiques de description in troduites en section 2 2 1 L aussi les sp cifications terminologiques des T box introduisent les concepts et relations r les pour reprendre le vocabulaire des LD au sein de hi rarchies interpr tables formellement et leur assignent des contraintes additionnelles qui pr cisent leur signification tout en restreignant leur emploi dans des bases d assertions Interview L Sequence Professeur L Personne aPourParticipant C range Personne aPourParticipant C domain Sequence U Programme aPourInvite L aPourParticipant RoleExpert L Role RoleProfesseur L RoleExpert joueRole E domain Personne joueRole E range Role Fic 2 10 Extrait de T box Ainsi on peut sp cifier un concept respectivement r le en tant que sp cialisation d un autre concept r
479. tG ographique d pendance D un objet n existe que si une activit ou un niveau administratif pr cis ont t d finis Pays rigidit R identit O deux pays ayant au moins un m me gouvernement sont iden tiques unit U h rit e d 0bjetG ographique d pendance D h rit e d ObjetG ographiqueAdministratif TAB 5 1 M ta propri t s associ es des concepts g ographiques de l ontologie du cyclisme Pour chaque m ta propri t X le symbole X respectivement X indique qu elle est associ e respectivement qu elle ne peut tre associ e la propri t consid r e R I U et D renvoient respectivement la rigidit l identit l unit et la d pendance La balise 0 pour la m ta propri t d identit indique que le concept fournit son propre crit re d identit c est dire que celui ci ne provient pas d un concept plus g n ral Pour plus de d tails se reporter WG01 et la section 4 2 2 en page 120 Comme on vient de l voquer cet cart par rapport aux pr conisations issues de l ontologie formelle vient de ce que l ancrage dans l application supprime certains des effets de polys mie tant redout s par Guarino en limitant les mondes possibles tudier pour attribuer les m ta 5Nous sommes n anmoins conscient que dans une optique plus large o l on voudrait par exemple aligner notre ontologie avec des ontologies d di
480. tains partenaires du projet taient sp cialistes Ces ontologies sont ensuite propos es l utilisateur pour cr er des index des segments documentaires qu il a isol s cf figure 2 15 Le syst me se charge de v rifier la coh rence des descriptions par rapport aux sp cifications formelles signature des relations et liens hi rarchiques et applique des connaissances de raisonnement sp cifiques a chacune des ontologies donn es sous la forme de r gles pour am liorer les r sultats des recherches Pour g rer les annotations conceptuelles et conduire les inf rences OPALES utilise COGITANT 74 GS98 d velopp par le laboratoire LIRMM GC Du point de vue du parcours succinct que nous venons de faire OPALES doit donc envisager des probl mes g n raux de repr sentation et de gestion des connaissances dans un cadre logique o les index ont une interpr tation formelle mobilisable en vue de l assistance la recherche par le raisonnement logique Tout cela doit tre trait avec le souci constant de la sp cificit du cas audiovisuel il faut notamment trouver des solutions qui respectent voire facilitent la continuit s mantique comme le contr le automatique du processus d indexation On a donc affaire un large ventail de probl mes qui ne sont que partiellement communs avec ceux du web s mantique puisqu ils insistent sur des points qui sont parfois laiss s de c t dans cette initiative 2 5 Conclusio
481. tant parce qu ils auront moins concevoir eux m mes en r utilisant des notions abstraites consensuelles adaptables leur application que parce que ce qu il feront sera son tour consensuel et adaptable pour la conception d autres ontologies ou r utilisable dans d autres syst mes 109 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques 110 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique 4 1 Introduction Dans les chapitres qui ont pr c d on a vu comment l utilisation de SBC utilisant des on tologies tait en mesure d apporter des solutions novatrices aux probl mes de l indexation et de la recherche documentaires Complexes du point de vue de leur utilisation ces ontologies peuvent n anmoins s ins rer dans les usages et les compr hensions rencontr s dans les applica tions concern es Il faut pour cela cr er les ressources sp cifications formelles et informelles patrons d indexation dont on vient de voir qu elles taient n cessaires 4 une utilisation et un fonctionnement pertinents du syst me dans ce cadre applicatif Le probl me est que de telles ressources ne sont pas faciles construire m me si l on suppose donn es les connaissances du domaine qui permettront de le faire par la collaboration d un expert ou l expertise du concepteur de l ontologie lui m me En effet on a vu que pour b n ficier des pl
482. tante dans ce cas De plus les grilles proposent d j certaines des informations que l on retrouvera dans l index alors qu un formulaire se contente de donner une structure sans mentionner les valeurs th matiques qui s ins reront dans cette structure Une grille se place r solument dans une approche prescriptive un formulaire peut par exemple contraindre certains champs ce qui n est pas le cas de la structure de formulaire de PINA mais il ne propose pas de valeur par d faut Il est acquis que ce sont de telles solutions inscrites mat riellement l aide du langage d in dexation et de lui seul qui doivent nous inspirer puisque nous nous sommes restreint dans le chapitre 1 n introduire que des solutions qui concernent le support de l indexation Il n est pas question de proposer ici des r flexions sur la mani re de former des documentalistes l indexation base de connaissances m me dans le cadre d une application pr cise En somme une grille constitue une r f rence pour les index r ellement produits en donnant un exemple de l information qui a t jug e pertinente pour les recherches venir On a l un moyen d agir sur la coh rence et la pertinence des index un niveau diff rent de celui de la prescription d une interpr tation pour les descripteurs puisque on fait plus que donner une si gnification Cet objet est par ailleurs plus int ressant pour l utilisateur voulant c
483. tel sch ma de description se r v le consensuelle et pertinente puisque les experts du domaine qui ont t confront s au prototype pr sent dans SBCT02 s y sont adapt s sans difficult notable Cependant de telles solutions manquent de souplesse en particulier au niveau de l expressivit relationnelle En effet si les champs du formulaire sont modifiables on se rend compte que cela ne concerne que les valeurs qu ils peuvent prendre On est ainsi libre de modifier les concepts employ s dans une description mais pas les relations qui les unissent On ne peut donc pas v ritablement changer la structure du formulaire si ce n est en cr er un autre Et si le sch ma de description jug pertinent pour l application admet des variations importantes dans quelques cas particuliers on ne peut pas vraiment en tenir compte l outil d assistance ditoriale se mue alors en une contrainte qui peut rebuter l utilisateur File Annotate Search Ontology Help MIA JInformation_Object al 8 E 4 3 Production Physical Content Administration f Create Active Agent Objects Setting Active Agent A Aant EI Derain Andr al With Action smoke x el Obiect pipes smoking equipment ml With Recipient win Ok Reset Found pipe 9 times in ontology Fic 3 9 La description du contenu de l image dans le projet MIA extrait de HSWW
484. tes con ues pour tre r utilis es dans des domaines plus pr cis Apr s avoir parcouru ces solutions tr s diverses nous avons vu que certaines taient bien compatibles avec nos besoins Des patrons de conception ontologiques mettent en relation des notions issues d ontologies de haut niveau de sorte que l on puisse r cup rer des notions une structure et une axiomatisation pertinentes d un point de vue th orique Les pr occupations qui ont dict l laboration de tels patrons peuvent cependant tre loi gn es des besoins applicatifs tels qu ils sont formalis s dans les patrons d indexation Une fois d termin le patron d utilisation applicatif il faut le rattacher explicitement la structure du patron de conception par l interm diaire de la relation d h ritage et de connaissances de rai sonnement s effor ant de r aliser des rapprochements entre structures diff rentes A ce stade le lecteur attentif pourra soulever la question de la place de la cr ation du patron applicatif dans le processus de d veloppement des ressources ontologiques pr c de t il la conception de l ontologie 150 4 4 Ing nierie ontologique et patrons d indexation lt ruleml imp gt lt ruleml _body gt lt swrlx classAtom gt lt owlx Class owlx name Program gt lt ruleml var gt prgm lt ruleml1 var gt lt surlx classAtom gt lt swrlx classAtom gt lt owlx Class owlx name BroadcastedProgram gt lt ru
485. teur Petite Enfance 1003 008000 56990 Navigation Un paysage i contenia aPourTraitSaillantContenant i A audiovisuel 1003 Ce qu estla bu e i f 8 audiovisuel 1003 Condenseur n i f 8 audiovisuel 1003 Condenseur simple aPourTraitSaillantContenant estinterpr t Comme estinterpr t Comme DiscoursTechnique compl mentaireDe Tx de remplissage du cache 1 925 Fic 2 15 Un Gc index dans OPALES 71 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV primitives de repr sentation reposant sur des interpr tations formelles Par rapport aux syst mes documentaires existants il y a l une grande avanc e On a en effet vu que la signification des liens des thesaurus est trop floue pour garantir la v racit d interpr tations op rationnelles qui seraient d riv es directement du r seau de relations s mantiques Et m me si des traitements d inspiration graphique exploitant les distances entre notions peuvent tre mis en uvre dans des thesaurus adapt s des domaines applicatifs extr mement pr cis CTHD00 on applique toujours des strat gies de recherche et de reformulation qui sont g n riques ind pendantes du domaine En un sens l engagement ontologique de telles solutions n est pas assez fort pour autoriser une exploitation plus fine Les ontologies reposant sur des hi rarchies de sp cialisation exploitables de fa
486. teurs du langage OWL DL Avec ces constructeurs on peut par exemple caract riser des concepts comme celui d une s quence de dialogue en introduisant une condition n cessaire qui sp cifie qu on a affaire 4 une s quence ayant au moins deux participants SequenceDialogue C Sequence gt aPourParticipant Personne Fic 2 11 Caract risation du concept SequenceDialogue en LD On pourra par exemple consulter sur le site du w3c les cas d utilisation guidant la conception du langage OWL propos dans le cadre de l initiative du web s mantique cf p 2 4 Et lire les nombreux messages li s ce sujet sur les listes de discussions aff rentes 60 2 8 Ontologies contr le et traitements pour des syst mes d indexation et de recherche Cette logique permet l expression de relations d quivalence entre concepts complexes il est possible d affirmer que tel concept sp cialise tel autre ou bien sp cialise une expression complexe mais aussi d noncer qu un concept est sp cialis par une expression de ce type On peut ainsi construire de v ritables d finitions formelles apportant des conditions n cessaires et suffisantes de reconnaissance d un concept ou d un r le dans une BC Par exemple on peut introduire le concept d interview d expert comme correspondant exactement aux interviews dont au moins l un des participants est reconnu comme un expert fig 2 12 Le syst me pourra reconnaitre qu
487. ticulier par rapport l preuve se contente d y assister TAB 3 2 Principes diff rentiels associ s aux sp cialisations directes de Personne extrait de TI02 Au final les similarit s et les diff rences collect es sur le chemin qui m ne d une notion une autre permettent d inter d finir celles ci sans qu il y ait besoin de se tourner vers un contexte donn En particulier si on part de la notion la plus g n rique de la taxinomie ainsi construite celle qui ne poss de pas d autre propri t que de relever du contexte applicatif on peut construire la signification absolue dans ce contexte applicatif de chacune des unit s langagi res em ploy es On est pass d un signifiant dont la signification n tait pas assez contrainte un v ritable concept dont la signification ancr e dans le domaine est invariable et peut donc fonctionner comme une primitive exprimant une connaissance On a donc ainsi cr une hi rarchie de notions interpr tables de mani re naturelle par les utilisateurs humains du SBC Ces utilisateurs pourront donc mieux appr hender la signification des descripteurs qu ils emploient pour cr er les index Il suffit de consid rer que ce r seau de sp cification s mantique est une partie int grante de l ontologie l ontologie diff rentielle Contexte d interpr tation et indexation Nous avons mis en pratique les propositions th oriques de Bruno Bachimont tout a
488. tilisait des notions comme m re SoinHygi ne et pratiqu Par Et que ces notions s opposaient Personne participant et Action les plus g n riques de l ontologie du domaine concern Ce sont justement de telles notions qui composent les patrons noyau ceux ci donnent de fait les motifs les plus g n riques g n ralement utilis s dans un domaine Ces trois niveaux sont pr sents plus ou moins explicitement dans les diff rents travaux sur l introduction des patrons de conception ontologiques et leur sp cialisation Mais notre r capi tulatif s il explicite ces r flexions les place aussi distinctement dans l optique de l gitimation applicative entreprise par le recours syst matique des patrons d utilisation applicatifs De fait une proposition comme celle de GCB04 montre bien nos trois niveaux donn s indirectement dans les figures 4 4 et 4 5 Mais elle n atteint pas le niveau de pertinence requis par les patrons applicatifs puisque la structure du niveau applicatif est la m me que celui du niveau noyau elle m me reprise du patron de conception BR ak Course of Events usage playedBy sequences g n rique hors domaine Endurant participant in Perdurant i usage jou Par inclus g n ral dans le domaine utilisation Mere fe pratiqu Par SoinHygi ne stucturante de l application FIG 4 9 Encha nement des patrons ontologiques partiels pour la petite enfance La figure 4 9 illustre bien ces dif
489. tinent pour l application vis e on augmente les chances pour ces index d tre correctement interpr t s et exploit s dans ce contexte applicatif De fait l exploitation des index par un moteur d inf rence utilisant des connaissances ontologiques peut b n ficier du recours des patrons En effet les configurations et les notions que ceux ci pr sentent sont suppos s proches des index produits ce qui autorise 4 les consid rer comme des structures piv ts auxquelles on peut comparer les requ tes et les descriptions de mani re faciliter leur rapprochement La premi re solution laquelle on puisse penser est d introduire les patrons en tant que sp cifications des requ tes poser par les utilisateurs De la m me fa on que l indexeur avait acc s une formulation typique des connaissances du domaine le chercheur aura un aper u de la forme canonique des index de la base qu il s appr te interroger Ce chercheur pourra ensuite adapter cette forme son besoin sp cifique dans le cadre d un moteur de recherche exploitant les graphes conceptuels il cr era ainsi un graphe repr sentant sa requ te et le syst me se chargera de trouver les index qui sp cialisent et donc impliquent au sens logique cette requ te Dans cette approche le patron d indexation sert de r f rentiel commun la cr ation des index et celle des requ tes nous avons donc l un premier moyen de r duire la distance entre ces l ments
490. tion et d acc s aux index L utilisateur se retrouve en effet directement confront au r f ren tiel conceptuel et formel de repr sentation des connaissances lors de deux tapes cruciales pour le syst me documentaire quand il doit l utiliser pour produire un index qui soit pertinent quand il doit le plus souvent en tant que chercheur acc der 4 la signification d un index d ja existant renvoy par le syst me lors d une requ te par exemple Comment faire alors pour faciliter la t che de l utilisateur ces deux moments De la m me mani re que pour les SBC se pose d un point de vue technique le probl me d un compromis entre expressivit autoris e et traitements envisageables d un point de vue op rationnel on doit aboutir un quilibre satisfaisant entre la complexit d un syst me de gestion des connaissances d une part et son utilisabilit par des agents humains d autre part Cette utilisabilit sera videmment valu e l aune des pratiques d j existantes et des capacit s cognitives des utilisateurs qui ne maitrisent pas forc ment les ressorts de la s mantique formelle ou op rationnelle des ontologies Les ontologies doivent donc apporter des sp cifications qui permettent d obtenir la fois une indexation conome d un point de vue cognitif et des processus de recherche naturel lement compr hensibles des traitements formels efficaces qui s appuient
491. tion et la s mantique associ e 47 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV Introduction des vocabulaires sp cialis s dans des langages de RC Par exemple si l on veut repr senter un index sous la forme d un graphe conceptuel comme dans OPALES il faut introduire des types de concepts et des relations qui constitueront la partie du vocabulaire de repr sentation relevant du domaine d application le support des futurs graphes conceptuels Pour notre exemple on pourra introduire videmment des concepts comme Sequence Personne mais aussi des types plus g n raux du domaine audiovisuel comme ObjetAV regroupant les s quences et les programmes et des relations comme participe lt xml version 1 0 encoding iso 8859 1 standalone no gt lt DOCTYPE CGXML PUBLIC COGITANT CGXML Format Specification 1 0 EN http cogitant sourceforge net cgxml dtd gt lt CGXML xmlns ina http www ina fr gt lt support name Exemple AV gt lt conceptTypes gt Eers lt ctype id id 101240791089724631510348203210 label Personne gt lt ctype id id 101240791089724631510498354554 label Sequence gt lt ctype id id 101240791089724631510498398264 label 0bjetAV gt Pa lt conceptTypes gt lt relationTypes gt Li lt rtype id id 101240791089645150322641047820 label participe gt Lses lt relationTypes gt lt support gt lt CGXML gt CODE 2 1 Extra
492. tions diff rentielles est plus vident en ce qui concerne la phase de conception de l ontologie L organisation suivant des termes pr cis d une ontologie s av re en effet contre intuitive du point de vue de l utilisa teur non sp cialiste en RC plus habitu aux classifications l ches davantage guid es par l usage pr sent es dans les thesauri Si une d finition naturelle par la cr ation d un contexte local pour l interpr tation aide grandement elle ne peut compenser la complexit apport e par l utilisa tion des concepts et des relations abstraits introduits dans l ontologie pour clarifier la d finition rigoureuse des entit s m tiers Par exemple les notions proches d un point de vue th matique peuvent se retrouver assez loign es si on recourt une navigation classique dans l arborescence diff rentielle dans le cas de la petite enfance les personnes n taient pas imm diatement li es aux groupes de personnes la distinction entre individu et collection tant introduite pr ala blement alors que ces deux types d entit s peuvent tre consid r s au m me titre comme les protagonistes d une action et sont quasiment interchangeables dans les sommets concern s du patron d indexation Un tel constat ferait donc pencher en faveur de la non int gration de l ontologie m tier avec une ontologie de haut niveau comme cela a t le cas pour l ontologie de l eau Ou du moins puisqu un t
493. tions et discussions Nous esp rons cependant que l effort d exemplification et de discussion auquel nous nous sommes livr ici pourra tre utile ceux qui voudraient r employer nos hypoth ses fins d utilisation directe ou de recherche nouvelle 200 Conclusion Ad quation de nos solutions aux questions pos es Initialement le sujet de ce manuscrit aurait d tre Capture et formalisation des contraintes s mantiques utilisation pour la conception des ontologies A l arriv e le lecteur pourrait tr s bien faire observer que d une certaine fa on ce sujet a t trait dans ce manuscrit Tout au long de nos travaux nous nous sommes effectivement int ress la fa on dont on pouvait rendre compte dans un cadre formel de significations et d usages relevant d un contexte s mantique non formel Ce contexte interpr tatif m tier est d fini par les interpr tations que l on rencontre dans le domaine applicatif vis par un syst me d information particulier Et on peut consid rer que ces interpr tations apportent justement des contraintes qui via leur transposition connais sances formelles expressions d finitoires r gles d inf rence devraient id alement s appliquer l interpr tation formelle du vocabulaire de description apport par une ontologie Cette th se propose donc un cadre de conception d ontologies qui permet une utilisation rationnelle et relativement ef
494. tions pos sibles concernant le monde mod lis pour permettre ceux qui la r utilisent d en sp cialiser les sp cifications selon leurs besoins r els 118 4 2 Des propositions pour rationaliser la conception des ontologies D autres approches proposent des principes qui s ils s appliquent la conception pour des formalismes particuliers apportent des r flexions int ressantes pour le d veloppement d ontolo gies en g n ral Par exemple Alan Rector dans Rec03 cherche normaliser les ontologies encod es l aide de logiques de description En effet celles ci du fait de la sp cification de quantit de d finitions exploitables par des classifieurs pr sentent souvent une structure hi rar chique complexe o au final les concepts apparaissent souvent comme sp cialisations directes de concepts auxquels ils n taient pas rattach s explicitement lors de la mod lisation A l arriv e l utilisateur mis en pr sence d une telle ontologie ne peut parvenir r interpr ter ais ment les motivations conceptuelles qui en ont guid la cr ation Rector propose donc de mettre en avant un squelette hi rarchique qui regroupe les concepts primitifs et doit r pondre un certain nombre de crit res permettant d atteindre un r sultat plus coh rent mais aussi plus accessible cr ation d une structure arborescente homog n isation des crit res de sp cialisation l int rieur des branches
495. tives au lien causal pour d duire que dans la concat nation le segment 2 doit tre plac avant le segment 1 Evidemment le dernier mode semble le plus int ressant du point de vue de la recherche sur les syst mes documentaires puisqu on approcherait alors de tr s pr s le travail d un humain Il est cependant probable que l importance du travail de mod lisation requis ainsi que les capacit s de raisonnement actuelles mettent hors d attente la r alisation de projets semblables l heure actuelle Et quelques travaux d automatisation des processus d dition documentaire l aide des connaissances sur les contenus apportent des pistes int ressantes ils utilisent des sch mas de publication non dynamiques dont l instanciation ne d pend aucunement des raisonnements qui ont t conduits pour trouver les l ments qui s ins reront dans ces sch mas Ran00 RBv 00 GBvH03 Quels raisonnements pour les syst mes d indexation base de connaissances Tout au long de notre travail nous avons insist sur l importance de l inf rence comme moyen d assister les pratiques documentaires de ceux qui utilisent le syst me Cependant en la mati re de nombreux choix restent possibles qui sont fonction de la richesse des connaissances que l on souhaite sp cifier mais aussi des besoins en ce qui concerne les performances des SBC Comme on peut s y attendre dans une section de discussion nous n allons pas proposer
496. tout agent susceptible de cr er des repr sentations la structure et au contenu r currents Par exemple on a vu que les applications d extraction d information ontologiques partir de textes pouvaient avoir besoin de telles constructions pour orienter leur travail ZC94 Le 03 Des ap proches d extraction d informations parcourant des bases de donn es pour associer les valeurs rencontr es des entit s du domaine et en d duire des relations entre celles ci voir par exemple HS03a peuvent galement avoir int r t d terminer explicitement des formes correspondant aux descriptions typiques qu elles sont suppos es extraire des donn es structur es pr existantes L approche de conception d ontologies par patrons de conception est galement relativement g n ralisable Dans la mesure o l ontologie concevoir doit contenir plus qu une simple hi rar chie de concepts sans relations conceptuelles pour lier explicitement ceux ci on peut tre int ress par la r utilisation et l adaptation de structures relationnelles ayant fait l objet d un effort de sp cification important Tout d pendra ensuite de l existence d un patron correspondant un usage g n rique proche de celui qui est envisag et de la possibilit de l adapter comme nous l avons fait aux contenus r ellement rencontr s dans l application Finalement c est peut tre importance accord e une forme relativement riche de raiso
497. tructuration qui d une certaine mani re aide maintenir la continuit interpr tative entre l indexeur et le chercheur On peut noter que cette approche garantit galement une certaine coh rence quant au traitement documentaire tout comme le thesaurus contraint le vocabulaire de la notice le formulaire permet l instauration d une politique de contr le ditorial des index Cette approche peut cependant sembler trop rigide pour tous nos besoins Elle ne permet de rendre compte que de relations fig es lors de la d finition du formulaire ce qui posera probl me lorsqu on voudra cr er un index l g rement diff rent De plus le niveau d application de ces relations reste implicite si l un de leurs relata est connu la valeur d un champ l autre n est pas imm diatement accessible La notion r f renc e dans un champ joue t elle le r le indiqu par rapport l entit d crite par le formulaire en principe le segment documentaire ou par rapport la valeur d un autre champ du formulaire Et si oui lequel De l index pseudo structur de notre exemple on peut d duire que c est l mission d crite qui parle de la st nose et non le professeur qui y intervient A moins d introduire des structures de type sous formulaires qui pour chaque entit pr sente dans les champs offriraient nouveau la possibilit d une description structur e Ce genre de m canisme peut tre utile mais il reste rigi
498. ts et ce cause du point de vue descriptif retenu On cherche en effet faire une description qui concerne la fois un th me donn en l occurrence la g ographie de l eau Ce th me videmment tr s vaste comporte des entit s de tous types les objets audiovisuels consid r s sous un angle davantage s miotique Le medium audio visuel met disposition des l ments et des proc d s permettant de d livrer un message dont certains l ments sont particuli rement int ressants nos lt traits saillants une lecture p dagogique du contenu audiovisuel en quoi le message se rapporte au contenu th matique d une mani re plus ou moins appropri e On insistera ce niveau sur les valeurs scientifiques associ es aux diff rents l ments d finition explication Tous ces l ments que l on trouve dans notre ontologie s ils pr sentent des points communs au regard du contenu ontologique ont cependant un usage qui les distingue clairement Plut t qu une seule ontologie homog ne on a affaire trois sous ontologies orthogonales que les relations du patron d indexation articulent pour obtenir des descriptions conformes au point de vue retenu De fait une de ces branches celle des proc d s et l ments audiovisuels est d ailleurs une importation de l ontologie de l audiovisuel que nous voquerons en section 5 2 3 SOn trouvera parmi eux des objets spatiaux co
499. ts de recherche d j anciens sont actuellement popularis es par le web s mantique qui essaie de les repenser pour qu elles puissent s adapter des besoins r els et au passage l chelle induit par la dimension du web Notre th se a donc d aborder le probl me de l indexation et de son usage dans les syst mes d un point de vue dual se rapportant la fois aux pratiques existantes et des th mes issus des disciplines scientifiques et techniques Son enjeu est une r flexion m thodologique sur l articula tion entre ces usages et des techniques plus ou moins abstraites Nous ne devions pas perdre de vue en effet qu exp rimenter de nouvelles pistes en mati re de syst me d information dans un Ins titut comme le n tre c est proposer des instruments pour une pratique existante mais aussi voir comment ces syst mes techniques sont susceptibles de modifier cette pratique En l occurrence comme on le verra plus tard dans ce manuscrit le cadre d indexation que nous proposons a des r percussions sur la cha ne de description et de recherche documentaires puisque l on assistera d sormais une partie des t ches de recherche qui se faisaient auparavant manuellement On peut donc synth tiser notre probl me comme tant celui de l adaptation des technologies venues de l intelligence artificelle et de la repr sentation des connaissances un contexte le document AV que sa digitalisation met disposition de to
500. tte tape est d expliciter la signification des libell s linguistiques des concepts pour qu ils fonctionnent comme des primitives de connaissances v ritables unit s de sens compr hensibles et manipulables dans le cadre applicatif vis par le SBC Bruno Bachimont recommande en effet de se tourner vers la langue pour l gitimer mais aussi servir de point de d part effectif l ensemble de la conception de l ontologie Pour lui construire une ontologie est un acte de mod lisation qui doit s effectuer partir de l expression linguistique des connaissances du domaine 14 METHONTOLOGY inlut par exemple une formalisation et une impl mentation 1 Bac96 introduit le terme d ontologies r gionales pour indiquer le lien entre de telles ontologies et l application dans laquelle elles sont ainsi ancr es 124 4 3 Prescrire une mani re de construire les notions ontologiques Tout d abord il faut donc extraire des termes des corpus textuels textes crits ou oraux documentations ou gloses Ces termes pourront tre utilis s pour d signer les concepts de Vapplication Cette tape ant rieure la phase de normalisation elle m me n a pas fait l objet de recherches dans le cadre de cette th se mais de celle de V ronique Malais Mal05 De tels termes m me si on parvient lors de leur extraction recr er un r seau interpr tatif significatif ne sont pourtant pas assez pr cis pour tre
501. ttp img cs man ac uk oil http www daml org language 6FAst Classification of Terminologies http www cs man ac uk horrocks 27Une version de d monstration est disponible sur le site d Ontoprise la soci t qui le d veloppe en collaboration avec l AIFB de Karlsruhe http www ontoprise de 129 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique Le dernier outil voqu ici sera WebODE ACFGO01 Cette plate forme en ligne d velopp e par le LAI de Madrid se place au niveau m thodologique dans la lign e d ODE un diteur qui assurait fid lement le support de METHONTOLOGY la m thodologie propos e par ce laboratoire Elle illustre bien l volution des outils de construction d ontologies puisque les nombreuses tables de repr sentations interm diaires de son pr d cesseur ont t remplac es par une interface plus intuitive aux d pens des contraintes m thodologiques L accent a plus t mis sur la possibilit d un travail collaboratif ou sur la possibilit comme dans Prot g d tendre la plate forme par des outils compl mentaires comme un diteur d axiomes un moteur d inf rences ou bien l outil ODEClean int gration dans WebODE de la m thode de Nicola Guarino cf section 4 2 2 WebODE similaire en cela aux autres diteurs accepte l export et l import d ontologies en RDFS DAML OIL et OWL On observe donc une r elle convergence ent
502. u long de notre travail VINA en particulier dans le cadre du projet OPALES Rapha l Troncy et nous m mes avons d velopp un outil de cr ation et de visualisation d ontologies DOE pour Differential Ontology Editor qui r pond aux sp cifications nonc es dans Isa01 Cet outil dont nous reparlerons en d tail dans le chapitre 4 a t ins r dans la plate forme d annotation d OPALES ICG 04 de sorte que l utilisateur lorqu il cr e un index conceptuel puisse avoir acc s l interpr tation m tier de la notion qu il souhaite employer et le cas ch ant en s lectionne une plus appropri e ses intentions La figure 3 6 montre l utilisation de l ontologie diff rentielle lors de indexation dans le contexte de application d OPALES d di e la petite enfance Gr ce de telles propositions m thodologiques on est m me de faciliter le travail de l in dexeur et plus g n ralement la t che de tous ceux qui ont acc s aux concepts et aux relations 89 Chapitre 3 Faciliter la conception et l acc s aux index s mantiques Ustensile a_pour_ l ment_de_descriptio pratiqu _au_moyen_de localis _spatialement_par LocalisationD finieParDegr D Ouverture a_pour_caract ristique_de_localisation pe d action d hygi ne concernent enfant Sp cification de but But baigner l enfant iff ren Sp cification de but G LocalisationD fi
503. u support et des processus de l indexation Le fait est qu en restreignant les possibilit s de saisie des interpr tations dans un syst me on peut influencer l ensemble de la cha ne l indexeur ne peut pas ins rer une interpr tation par trop incoh rente ou inadapt e et celui qui acc de la description peut trouver une aide dans la TMais cette situation est amen e voluer tr s rapidement la Direction des Archives a par exemple cr une interface d acc s aux documents et aux notices INAMEDIA qui a pour vocation d tre directement employ e par le public 21 Chapitre 1 La description des documents audiovisuels dans les processus documentaires mani re dont elle est formul e Ce probl me a d j t abord par les approches documentaires nous allons donc commencer par voquer les difficult s que l on peut rencontrer dans les syst mes textuels existants et observer la mani re dont elles sont g r es 1 3 Le contr le du support de l indexation La mati re de l indexation est ce que l indexeur juge pertinent de communiquer celui qui effectue une recherche Il est donc important de garantir une continuit d interpr tation et d ex ploitation DB00 parle de continuit s mantique entre ce que choisit d exprimer un indexeur et ce que va comprendre celui qui va se retrouver face la notice La qualit de la restitution de cette interpr tation conditionne la qualit de l
504. ue le patron n a pas vocation tre un pur exemple illustratif et non prescriptif partir duquel l indexeur devrait extrapoler un besoin d indexation En particulier il semble absurde de proposer un patron qui introduise des instances nomm es pour les concepts pr sents sauf en cas de besoin extr mement pr cis comme une application relative un objet particulier personne ou lieu par exemple du domaine Des instances g n riques seront g n ralement plus adapt es ce que le patron d indexation est cens exprimer la mani re dont les descriptions pertinentes sont g n ralement formul es Enfin on peut s interroger sur la complexit du patron d indexation et des index qui sont obtenus partir de celui ci la suite des op rations de modifications que nous avons introduites en page 99 Ici galement on ne peut pr juger de ce que seront les besoins des points de vues applicatifs venir et pour chacun des points de vue de tous les contenus documentaires inter pr ter et repr senter Id alement un patron d indexation doit tre plut t simple pour faciliter son appropriation et son utilisation par les indexeurs Par contre il ne doit pas tre simpliste et favoriser la cr ation d index suffisamment riches au regard des besoins applicatifs Par exemple dans le point de vue d OPALES relatif la description des documentaires relatifs la g ographie nous avons d gag un patron en apparence s
505. uite par l utilisation des principes diff rentiels et l introduction de concepts de haut niveau permettait de rationaliser et clarifier le r sultat de l acquisition des connaissances conceptuelles Des notions extraites directement du texte repr sent es en figure 5 10a on parvient une arborescence normalis e tr s organis e la branche la plus profonde comporte 10 niveaux de sp cialisation Et ce m me si nous avons pour cette ontologie diminu la quantit et la complexit des notions de haut niveau Ainsi notre premi re distinction s pare les entit s abstraites cat gorie dans laquelle nous avons d taill les types de donn es au sens informatique des entit s concr tes Celles ci comprennent des entit s temporelles les diff rents actes de r servation et des entit s caract ris es par un rapport essentiel l espace Cette cat gorie regroupera son tour des objets g ographiques des artefacts les diff rents moyens de transports et des objets biologiques les diverses personnes etc En revanche la hi rarchie de relations ne comporte que des liens que l on pourrait qualifier 181 Chapitre 5 Exp rimentations et discussions AnyConcept AnyConcept Q MeanOfTransport Q ConcreteEntity Plane SpatialEntity Boeing Q GeographicObject Airbus Q AdministrativeGeographicObject Car Country Ferry C City Motorbike NaturalGeographicObject Ship Artef
506. ujours plus de personnes avec des besoins pr cis et vari s une pratique l indexation nous mentionnons que nous nous int ressons la fois la cr ation et l exploitation des index toutes les deux n cessaires la constitution de bases documentaires audiovisuelles exploitables Dans un premier temps ces technologies impliquent en effet une complexification des donn es et des traitements en eux m mes les index sont structur s et leur manipulation fait appel des connaissances de raisonnement que l on souhaite les plus pr cises possibles Dans un deuxi me temps l adoption de ces technologies am ne une complexification de la pratique d in dexation elle m me Nous visons en effet une indexation riche manuelle qui dans l tat actuel des connaissances scientifiques n cessite toujours l expertise d humains qui connaissent les domaines 3 Introduction d application des syst mes documentaires mais ne maitrisent pas forc ment les techniques de repr sentation que ceux ci sont cens s utiliser Il faut par cons quent s efforcer de r duire cette complexit Tout d abord on peut faire remarquer que celle ci est li e au fait essentiel que les techniques et langages propos s dans les disciplines scientifiques que nous avons voqu es sont formalis s On donne aux ressources conceptuelles qu utilisera le syst me les index aussi bien que le vocabulaire qui permet de les exprimer une
507. umentaires jug s int ressants la qualification qui indique ce en quoi ils sont pertinents que ce soit au niveau de la substance m me du contenu ou de sa mise en forme et la structuration qui relie les l ments d crits dans une structure m ta documentaire rendant compte de la complexit structurelle du document audiovisuel Finalement une notice telle que celle du tableau 1 1 va contenir des champs relatifs la fiche signal tique du document les donn es de l identification des champs consacr s la description du document d autres consacr s la gestion du support mat riel du document et enfin ceux qui concernent la gestion de la notice dans le syst me documentaire Les champs les plus int ressants au niveau documentaire sont les champs relevant du contenu r sum s quences descripteurs th matiques descripteurs image etc Ce sont eux qui b n ficient de l effort de documentation le plus important et vont en particulier rendre compte des aspects voqu s ci dessus ceux qui n cessitent le plus l interpr tation du document par l indexeur On retrouve cette distinction entre les donn es interpr tatives et les autres dans le projet OPALES Que ce soit pour l application relative aux documents sur la petite enfance ou celle concernant l analyse des programmes documentaires sur l eau les informations reconnues comme les plus pertinentes et partant qui ont fait l objet de la plus grande attention so
508. un contenu conceptuel sp cialis Par exemple pour le point de vue relatif la petite enfance les actions d crites impliquaient souvent une m re souvent caract ris e par sa posture corporelle et son enfant taient pratiqu es l aide d ustensiles et Pour se d marquer du choix particulier des GC pour la repr sentation des connaissances dans OPALES nous utiliserons ensuite le terme plus g n rique de patron d indexation Ce terme tout en mettant l accent sur l assis tance l indexation garde bien une r f rence un aspect graphique et relationnel via la notion de patron 98 8 8 Assister la formulation des descriptions taient g n ralement rep r es spatialement par rapport un lieu une maison une pi ce d fini par un degr d ouverture sur l ext rieur ainsi que par sa fonction sociale On peut partir de ces besoins concevoir un patron d indexation adapt au point de vue concern Le graphe de la figure 3 10 montre ce patron sous la forme d un graphe conceptuel dont les sommets sont des individus g n riques a_pour_ l ment_de_description Ustensile SoinHygi ne localis _spatialement_par LocalisationD finieParDegr DOuverture a_pour_caract ristique_de_localisation LocalisationD finieParFonction Fic 3 10 Un patron d indexation pour la description de soins sur les enfants Ce graphe sera ensuite modifi en fonction de
509. un sous ensemble commun L h ritage multiple devient donc possible et l on peut obtenir une structure de treillis et non plus d arbre Par exemple on vu la page 87 que Rouleur et Grimpeur taient deux notions qui taient en opposition dans notre ontologie diff rentielle du cyclisme Cependant les concepts formels correspondants ont des extensions qui peuvent avoir en commun plusieurs individus par exemple l individu lance_armstrong On peut par cons quent d finir dans l ontologie r f rentielle un concept formel Grimpeur_Rouleur dont la r f rence sera l intersection des extensions des concepts Grimpeur et Rouleur et dont lance_armstrong sera un l ment En un sens le passage l ontologie formelle permet de se lib rer de certaines contraintes la mani re dont l interpr tation linguistique impose ses r gles aux primitives tout en apportant les siennes les primitives ont maintenant une signification formelle Dans l ontologie r f rentielle on essaie donc de donner aux primitives une signification formelle Cette signification si elle doit tre en accord avec la signification s mantique naturelle donn e dans l ontologie diff rentielle en est tout de m me distincte l ontologie r f rentielle est en quelque sorte le produit fini de la conception au niveau des connaissances Il est clair qu elle doit expliciter toutes les lois logiques induites par la conceptualisation que l on veut sp cifier
510. ur accessible et compatible avec ces besoins De la m me fa on que des m thodes de d veloppement g n riques ont t propos es pour rationaliser la conception ontologique celles ci ont pu s appuyer sur des environnements labor s dont l objectif tait de rendre plus intuitive la saisie des connaissances formelles rattach es aux concepts et aux relations Nous avons d j partiellement abord cette probl matique dans le chapitre 3 du point de vue de l assistance la compr hension des notions formalis es Nous allons pr sent nous int resser de plus pr s aux outils effectivement utilisables pour cr er des ontologies suivant des approches m thodologiques coh rentes ou du moins offrant des interfaces intuitives pour cr er des connaissances complexes Depuis une dizaine d ann es un tr s grand nombre d instruments d assistance l dition d ontologies a t cr Nous ne nous attacherons pas tous les examiner en d tails beaucoup d tudes sur ce sujet ont t conduites de DSWT99 qui le premier non ait un jeu de crit res d di s l valuation rationnelle des diteurs Den04 qui en recense plus de cinquante Re prenant un travail avanc dans Isa01 et TI02 nous nous concentrons ici sur les diteurs les plus populaires ou marquants Il faut galement mentionner que nous ne nous int ressons ici qu aux logiciels qui permettent la conception enti rement ma tris e par l utilis
511. ures comprenant les notions qui structurent le champ de l application et on peut s en servir comme point de d part des indexations effectives en les adaptant aux cas concrets rencontr s En concevant des connaissances de raisonnement qui soient d di es la d duction de connaissances permettant de passer des l ments du patron d autres structures ou r ciproquement on peut g rer un certain degr de variations par rapport ce patron ce qui permet de consid rer celui ci comme un canon en admettant qu un canon puisse tre d riv en des index qui ne sont pas stricto sensu des sp cialisations pour le SBC canon qui est certes implicite mais rendu pleinement op rationnel par le recours aux inf rences qui lui sont li es Ces deux m thodes aident donc construire des descriptions l gitimes par rapport aux pra tiques cibl es leur vocabulaire se place dans un contexte interpr tatif qui se rapporte clairement ce qui se passe dans le contexte applicatif et leur contenu se con oit explicitement en r f rence des structures qui capitalisent l expertise en mati re d indexation dans ce m me contexte 156 5 1 R capitulatif des apports m thodologiques de cette th se applicatif In fine on construit un syst me d assistance l indexation qui coupl des m ca nismes d inf rence appliquant des r gles de d duction en accord avec la signification de tous ces l ments favorise l obt
512. urs men en collaboration avec d autres cher cheurs et s est syst matiquement appuy que nous ayons particip ou non ces efforts de justification sur des sources attest es dans les domaines vis s guides de bonnes pratiques textes relatifs au th mes abord s licitation de connaissances aupr s d experts des domaines d application vis s Et pourtant comme l a montr la seconde partie de ce chapitre notre travail de recherche serait loin d tre termin La mise en uvre de nos propositions a directement soulev de nombreux probl mes auxquels nous n avons pas forc ment pu apporter de r ponses Nous pourrions nous d fausser en rappelant que nombre d entre eux n taient pas vraiment de notre ressort tel que celui de la cr ation d un outillage pouvant r aliser des calculs d inf rence complexes sur une grande chelle Il reste que ces probl mes sont inh rents approche que nous proposons et que le lecteur devra garder ce fait l esprit lors de la lecture de la conclusion de ce manuscrit qui va aborder des questions plus g n rales concernant l largissement de la port e de nos travaux 50 Au sens d une implication logique entre leurs interpr tations formelles comme dans le cas des Gc 51T ne nous appara t pas ill gitime de consid rer notre participation au projet OPALES comme constituant deux exp rimentations ontologiques part enti re 199 Chapitre 5 Exp rimenta
513. ussi sur des consid rations pratiques Les patrons n ont pas en effet rendre compte directement des lois contraignant l usage des concepts et relations dans l ontolo gie Par exemple pour notre point de vue de la petite enfance il serait improductif de pr senter un patron articulant des actions impliquant en tant que participants g n riques des Objets Physiques ou des personnes qui seraient caract ris s par des El ments de Description notions comptant parmi les plus abstraites de l ontologie d velopp e pour l occasion Plus la notion donn e dans le patron est g n rique plus l indexeur aura d effort pour adapter le patron d indexation un besoin de description concret 120n fait par l allusion une ontologie qui contient tous les concepts qui sont n cessaires l application tout en tant close pour la d finition ce qui implique qu elle contient tous les concepts y compris le concept applicable toute entit demand s pour d finir ceux ci Traditionnellement on pr f re pr senter les concepts dans des modules dont les niveaux de g n ralit sont diff rents mais notre approche par d finition diff rentielle et le besoin de situer les notions des patrons sur une chelle absolue nous poussent ici consid rer sous un angle unificateur les ressources ontologiques utilis es 181 en existe un quatri me le niveau formel qui s attache la description des modalit s d existence
514. ut niveau et besoins applicatifs Nous avons tent de reproduire cette d marche de sp cialisation d un patron de conception ontologique pour une ontologie d di e la description des documents audiovisuels IT04 Cette ontologie dont le d veloppement a r pondu aux besoins d gag s lors de la th se de Rapha l Troncy mais aussi dans une certaine mesure ceux d un des points de vue du projet OPALES se concentre sur la description des documents dans une perspective que l on essaie de rendre la plus neutre possible En l occurrence l indexation effectu e PINA nous a sembl un bon point de d part puisque cette indexation essaie de rendre compte de la forme et des dispositifs audiovisuels en tentant d anticiper un maximum de besoins Pour un r capitulatif des enjeux de la conception des ontologies noyaux on peut se reporter VB96 L atelier de la conf rence EKAW 2004 d di ce type d ontologies auquel nous avons particip donne lui un bon aper u des recherches actuelles s inspirant de cette approche GB04 40Le point de vue de lecture critique des documentaires g ographiques avait en effet besoin d outils de cat go risation des l ments audiovisuels 143 Chapitre 4 Faciliter la conception d ontologies pour l indexation s mantique L obtention d une ontologie noyau a t guid e la fois par ces besoins et par les notions de haut niveau introduites par Gangemi et ses
515. ut prendre Par cons quent on ne peut pas dire qu instancier de tels sch mas constitue un acte d engagement ontologique fort propice 4 une quelconque l gitimation des connaissances axiomatiques qui sont produites lors de cette instanciation Lorsqu on utilise un design pattern on se place pourtant dans un cadre pr cis celui de composants architecturaux qui ont une signification en termes m tier f t elle mentionn e de mani re extr mement abstraite Si nous sommes int ress une adaptation de cette vision dans l ing nierie ontologique c est que ce que nous recherchons ce sont des l ments qui rel vent plus du contenu des connaissances ontologiques que de leur structure Plus proches de notre questionnement sont donc les m thodes qui essaient de d finir des patrons conceptuels g n riques nous les appellerons donc patrons de conception ontologiques conceptuels ventuellement munis d axiomes que l on peut directement sp cialiser pour obtenir les connaissances ontologiques au niveau d un domaine ou d une application Ces travaux essaient d initier la conception avec des composants issus d ontologies de haut niveau satisfaisant des crit res d utilisabilit les connaissances g n riques doivent tre facilement mobilisables lors de la production des ontologies et leur contenu doit tre adapt un ventail applicatif consid r pr sent comme prioritaire par rapport aux probl mes formel
516. utilis s comme symboles primitifs du SBC en l tat actuel des choses on ne peut tre s r que les proc d s d analyse des textes limiteront suffisamment les interpr tations vari es dont ces termes peuvent tre l objet Il faut pour cela qu un concepteur humain compl te le travail d extraction en fixant une fois pour toute la signification de ces termes et ce de mani re rationnelle ce que Bachimont appelle l engagement s mantique Bac00 est la base de l engagement ontologique Pour cela comme on l a vu au chapitre 3 dans la section 3 2 2 on a recours la construction d une ontologie diff rentielle On utilise des principes de normalisation linguistique pour expliciter la signification des primitives similarit avec le p re diff rence avec le p re similarit avec les fr res diff rence avec les fr res Et l on obtient un arbre de notions qui constitue pour chacune d entre elles un contexte qui lui permet d tre interpr t e de mani re non ambigue Formalisation Pour concevoir des primitives qui soient exploitables dans un SBC il faut cependant s abstraire du paradigme d interpr tation linguistique Les primitives doivent en effet fonctionner dans des langages de RC dont les m canismes d interpr tation sont formels on devra donc introduire des concepts et des relations munis d une v ritable s mantique formelle Comme on l a vu dans le chapitre 2 dans le domaine de la repr sentation
517. ux objets du monde mais du rapport qu ils entretiennent avec les autres termes En pratique les unit s du syst me linguistique trouvent une signification gr ce des traits s mantiques les s mes qui vont permettre de d finir des oppositions entre ces signifiants Les s mes que l on peut associer une unit sont regroupables en deux cat gories les s mes g n riques qui sont communs d autres unit s ils permettent de regrouper les unit s entre elles les s mes sp cifiques qui permettent une unit de se distinguer de celles avec qui on l a regroup e gr ce aux s mes g n riques Par exemple si on se restreint au domaine cycliste on va pouvoir associer entre autres le s me r ussit en montagne au signifiant grimpeur et le s me r ussit en plaine au signifiant rouleur Par contre elles vont partager les s mes g n riques homme et dont le m tier est de participer des courses cyclistes associ s au signifiant coureur cycliste Ces deux s mes vont tre g n riques pour les unit s grimpeur et rouleur Par contre les s mes r ussit en montagne et r ussit en plaine sont des s mes sp cifiques qui permettent de distinguer ces deux unit s l une de l autre Ces deux types de s mes permettent de d finir une unit par les identit s et les diff rences qu elle entretient avec les unit s dont la signification est
518. vec les pratiques attest es via et les textes ou gloses qui peuvent les encoder que l on avait obtenu en ce qui concerne la substance des descriptions savoir les concepts et les relations que les patrons mobilisent Il serait donc int ressant de justifier la forme de ces patrons elle aussi l aide de th ories s mantiques adapt es Toute forme d assistance au travail manuel d acquisition de cette forme serait galement la bienvenue Comme on vient de le faire remarquer on pourrait r utiliser les r sultats des investigations des quipes de Jean Pierre Descl s ou James Pustejovsky puisque ceux ci proposent des dictionnaires associant des significations structur es aux l ments de la langue Plus prosa quement r ussir isoler puis rattacher nos patrons des expressions langagi res issues de corpus relevant du domaine de l application cibl e serait d j une avanc e appr ciable Comme nous l avons mentionn auparavant des travaux existent qui sont capables d explorer les textes pour extraire des candidats pour les concepts et relations d une ontologie BAC04b La plupart s attachent au rep rage des d finitions pour associer des r seaux des l ments conceptuels consid r s comme centraux Le 00 Mal05 Dans l optique de l extraction de pa trons d indexation il faudrait pouvoir adapter ces outils pour qu ils puissent rep rer des sch mas d utilisation de ces entit s dans le domaine appli
519. velopment and Implementation Issues in the Semantic Web New York City USA 2004 KHPGO02 KALYANPUR A HENDLER J PARSIA B et GOLBECK J SMORE Semantic Kno04 KP99 Kri83 KV03 LA83 Lak87 Lal98 Le 00 Le 03 Len95 Les02 LH04 LHB00 Markup Ontology and RDF Editor Rapport technique Mindswap 2002 http www mindswap org papers Consortium KNOWLEDGEWEB State of the Art on Ontology Alignment Deliverable 2 2 3 FP6 507482 2004 KASSEL G et PERPETTE S Co operative ontology construction needs to carefully articulate terms notions and objects In Ontological Engineering on the Global Infor mation Infrastructure Dagstuhl Castle Germany 1999 KRIPKE S La logique des noms propres Seuil Paris 1982 Koris K et Vouros G A Human Centered Ontology Management in HCONE In IJCAI 03 Workshop on Ontologies and Distributed Systems Acapulco Mexico 2003 LOUSTALET C et ASSOCIATION MEDIADOC SCIENCEs D crire l audiovisuel ma nuel m thodologique pour l analyse de contenu des documents audiovisuels caract re documentaire Rapport technique CNDP 1983 LAKOFF G Women Fire and Dangerous Things University of Chicago Press 1987 LALMAS M Logical Models in Information Retrieval Introduction and Overview Information Processing and Management 1 34 1998 LE PRIOL F Extraction et capitalisation automatiques de connaissances partir de documents textu
520. vidente la mutation de son environnement technique l acc s informatis aux contenus documentaires change la mani re dont on peut exploiter ceux ci et cr e des besoins nouveaux en termes d outils et de m thodes Bac98 Cela induit de mani re plus g n rale des changements du contexte organisationnel dans lequel s effectue l indexation les grandes institutions doivent se poser la question de modalit s d acc s diff rentes leurs fonds et on peut observer l mergence de petites communaut s travaillant de fa on pr cise exigeante partir des documents dont elles peuvent assurer elles m mes la production l indexation et l acc s De fait les professionnels reconnaissent que ce en quoi doit constituer l indexation change glissant progressivement de la synth se le r sum d un contenu l analyse la mise en valeur des l ments du contenu qui sont pertinents pour un besoin donn Wal99 Comme on le verra tout au long de ce manuscrit notre recherche a tent de concilier deux mouvements d essences diff rentes Tout d abord deux probl mes fondamentaux peuvent tre d gag s de l analyse des trai tements documentaires la cr ation des index puis leur recherche Acc der au contenu des documents audiovisuels n cessite en effet une indexation Or ce processus est d licat plut t fastidieux accomplir il demande d anticiper sur les besoins d acc s aux index construits ce
521. vit P gagogique Activit Scientifique Activit Diplomatique Activit Juridique G Activit Economique Pollution o 2 Nanm a 1e Activit G ologique Activit Eau Fic 5 4 Hi rarchie de concepts issue de l ontologie de l eau Apr s avoir d fini les ressources ontologiques du projet nous avons galement particip aux s ances d valuation de la plate forme d indexation d OPALES Au cours de ces s ances une La branche du th me de l eau proprement dit et celle des proc d s et l ments audiovisuels 10Voir ICG 04 pour une pr sentation succincte des interfaces et fonctionnalit s NNK03 pour une pr senta tion d taill e de l architecture sous jacente 166 5 2 Exp rimentations ontologiques vingtaine d heures par point de vue il a fallu familiariser des utilisateurs novices en repr sentation des connaissances avec les enjeux de ce type d approche hi rarchie organis e de fa on rigoureuse index structur s repr sentation formalis e exploitable par des m canismes d inf rence contr le du contenu des descriptions Ces experts des domaines concern s ont ensuite r alis sous notre supervision une quantit tout fait r aliste au regard des volumes documen taires consid r s d index conceptuels une trentaine pour le point de vue de la petite enfance et une quarantaine pour celui de l eau ces index comportant en moyenn
522. vit s dans le domaine consid r sont des activit s simples mettant en jeu des acteurs physiquement pr sents au m me endroit Il sera alors pertinent de munir l ontologie d une r gle de raisonnement telle que celle de la figure 3 16 L emploi des patrons d indexation est donc intimement li celui des connaissances de rai sonnement m me si le niveau auquel ces deux types de ressources sont donn es est diff rent En effet pour pouvoir s appliquer au plus grand nombre de cas avec pertinence les r gles d in 16Fn fait il s agit comme dans les processus de recherche documentaire traditionnels de r expliciter une information que l on a gard implicite par souci d conomie 107 Chapitre 3 Faciliter la conception et Vacc s aux index s mantiques va lt Pa Le ObjetSpatial lt _ pratiqu H Activit E estDans gt Localisation ae ee TS Fic 3 16 R gle de raisonnement d duisant de nouvelles connaissances partir de celles d un patron d indexation f rences doivent produire les connaissances les plus sp cifiques que l on puisse d river partir des hypoth ses les plus g n rales possibles Ainsi dans l exemple de la localisation on cherche transf rer le type de rep rage le plus pr cis qui soit estDans estSur ce qui impliquera de cr er autant de r gles que de type de rep rage mais en l appliquant des entit s extr me ment g
523. voir un ensemble d axiomes ne peut que r aliser une approximation des lois r gissant tous les mod les possibles pour une application mod les auxquels on n a d ailleurs pas forc ment acc s Une ontologie pour Guarino ne peut donc que refl ter une conceptualisation de mani re indirecte et toujours partielle Et cela est relativement normal puisqu il propose d utiliser comme sp cifica tion des axiomes qui ont une forme logique et une s mantique ensembliste Une telle sp cification reste de nature extensionnelle et ne permet d approcher qu imparfaitement la complexit des significations g n ralement exprim es dans un domaine en particulier de celles exprim es au moyen de la langue Et ce m me si on utilise des m canismes logiques labor s permettant d approcher une interpr tation d sign e comme intensionnelle tels les mondes possibles de Kripke Des niveaux de sp cification vari s et compl mentaires A d faut de donner une sp cification compl te du sens d un vocabulaire une ontologie peut essayer de donner les r gles et contraintes les plus m me de guider les interpr tations qui sont faites par les utilisateurs humains et le syst me des connaissances repr sent es avec celui ci Le niveau de sp cification atteindre est variable en fonction du degr d exigence de l application et en particulier des traitements que l on veut effectuer au moyen des index Tout d abord est c
524. vulgarisation des techniques scientifiques aurait le m me index C est pourquoi l indexation VINA utilise toujours en compl ment du thesaurus qui norme le vocabulaire de certains champs d autres zones en texte libre cf tableau 1 4 On peut ainsi cr er des expressions mettant en jeu des relations entre les notions reconnues dans un document Mais nouveau on retombe dans le pi ge de la variabilit textuelle Il importe donc de cr er un moyen d exprimer de mani re rationnelle contr l e des structures rendant compte de la complexit du document d crire Descripteurs maladie cardio vasculaire ath roscl rose infarctus cholest rol Descripteurs secondaires endoscopie R sum Apr s une reconstitution d un homme faisant un infarctus Jean Charles FRUCHART explique l aide d image endoscopique comment l ath ro scl rose maladie cardio vasculaire par exc s de cholest rol est la pre mi re cause de mortalit en France TAB 1 4 Utilisation du texte libre en compl ment des mots clefs extrait du tableau 1 1 1 3 3 Structurer les index En fait d s le niveau de la notice on doit se poser le probl me de la structuration de l information pr sent e dans la description du document entre informations catalographiques Dans le monde documentaire on y fait ainsi r f rence car elles jouent pour les descripteurs et les descriptions un r le semblable celui
525. w asEditing Drawing sqceEntretien Insert dessinStenose hasParticipant Person prof1 hasSubSequence represents Heart coeur1 represents Stenosis PulmonaryArtery stenoseAP arterePulmonaire1 Th me CVDisease maladieBleue Professor profi Role Fic 5 7 Repr sentation graphique de l index du code 5 1 Rechercher et raisonner dans la base de connaissances Comme on l a vu au fil de ce manuscrit l int r t de l utilisation des ontologies dans un syst me d indexation et de recherche repose en grande partie sur l utilisation de processus d inf rence exploitant les connaissances de l ontologie pour am liorer l acc s aux index Les assertions explicites que l on trouve dans les descriptions peuvent en effet tre compl t es par des assertions d riv es Ainsi il serait souhaitable partir de l index de la figure 5 7 d obte nir dans la base de connaissances des assertions factuelles correspondant ce qui est repr sent en figure 5 8 Par exemple si une s quence contient une s quence expliquant un sujet donn on peut en d duire qu elle aussi contribue l explication de ce sujet On peut ainsi retrouver des objets AV qui font r f rence des th mes vari s m me si lesdits th mes n apparaissaient explici tement que dans les l ments contenus dans ces objets Ici
526. x et des requ tes et la mani re dont les compl tions sont ins r es dans le fonctionnement g n ral du syst me Cette distinction se rapproche de l opposition classique dans le domaine des syst mes experts entre cha nage avant et cha nage arri re 63 Chapitre 2 Ontologies et SBC pour la description conceptuelle de documents AV similarit entre descriptions et requ tes GL02 pour un exemple dans le domaine de l au diovisuel et les approches logiques Celui qui guide le plus souvent les approches a base de connaissances est le mod le logique inspir par les travaux de van86 tels que les d clinent KC95 NB96 CMF96 Oun98 Gen00 voir Lal98 pour une pr sentation globale des diff rentes visions de ce mod le ici on utilise l interpr tation logique formelle des index et des requ tes pour tablir si les premiers sont pertinents pour les secondes Un index sera pertinent si un m canisme d inf rence formelle a r ussi rapprocher logiquement la connaissance exprim e dans cet index de celle requise par la question q Le plus souvent c est le cas si l interpr tation logique de l index implique celle de la requ te i q doit tre valable pour les r gles d ductives d finies par la logique et les axiomes induits par les connaissances priori Car si on se place dans un cadre logique on a n anmoins toujours affaire un syst me base de connaissances con u pour une application un doma
527. xtuelle le destinataire de l interpr tation L utilisateur du syst me peut il tre assist en fonction de ses pratiques lorsqu il se retrouve face ce que l indexeur a cr A VINA il faut dis tinguer deux usages D une part celui de l Inath que de France o le public qui acc de au document n a pas a priori une connaissance approfondie de la documentation audio visuelle Souvent les utilisateurs ne maitrisent pas les concepts qui leur permettraient de rechercher correctement les informations et sont oblig s de recourir l aide d un docu mentaliste D autre part celui de l exploitation commerciale des archives o la m diation op r e par les documentalistes entre le syst me et le client devient totale le client apporte sa requ te et c est le documentaliste qui va rechercher sa place le document et surmonter les difficult s d acc s qui pourraient survenir Dans le cadre de notre th se d informatique et plus largement du th me de recherche Descrip tion des Contenus Audiovisuels quipe dans laquelle ces travaux ont t men s l am lioration doit porter sur le second item de la cha ne Comment faire en sorte de mieux capter l interpr ta tion pertinente du contenu du document audiovisuel Comment obtenir un syst me qui utilise efficacement ce contenu afin de faciliter les t ches de description et de recherche documentaires Ces questions nous am nent au probl me du contr le d
Download Pdf Manuals
Related Search
Isaac These Finale
Related Contents
StarTech.com HDMI over IP Extender with Audio Brodit ProClip 511292 Production d`oxygène en situation d`exception, vers une autonomie kurzanleitung guide rapide verkorte handleiding hitri vodič SALES AND INSTALLATION GUIDE Copyright © All rights reserved.
Failed to retrieve file