Home

32 - Lirmm

image

Contents

1. La recherche biom dicale s appuie en grande partie sur l extraction de connaissances A partir de donn es r cup r es de mani re exp rimentale il est n cessaire de pouvoir interpr ter les r sultats L quipe TATOO bas e au LIRMM est sp cialis e dans ce domaine Une tape du processus d extraction de connaissances est la fouille de donn es Or certains probl mes peuvent appara tre lors ce traitement Les donn es proviennent parfois de diff rentes sources et peuvent donc tre peu ou pas coh rentes Les donn es peuvent tre tr s volumineuses en terme de quantit Les donn es peuvent aussi s av rer incompl tes de temps autres Ces facteurs peuvent rendre difficile l utilisation des algorithmes classiques de fouille C est pourquoi l quipe TATOO souhaitait int grer les donn es de diff rentes sources sp cialis es dans le domaine biom dical Les r centes avanc es en biologie mol culaire et en g nomique ainsi que les progres technologiques au niveau de l quipement ont permis un flux tr s important des connaissances dans ce domaine En cons quence les bases de donn es biom dicales ont connu une croissance exponentielle ces derni res ann es Ces banques de donn es sont devenues des l ments centraux de la recherche dans ce domaine et il est donc crucial pour les biologistes de disposer d outils informatiques ad quats leur permettant d analyser ces donn es Voil donc l
2. l oppos e des attentes du client 16 Mat riels et m thodes et faisabilit Tests Sp cifications P de validation Conception architecturale Conception Tests d taill e 4 unitaire Tests d int gration illustration 3 Le cycle de vie en V source http wikipedia org La litt rature ce sujet sugg re donc de n utiliser ce type de m thode que dans les cas o il est consid r que de toute mani re la ma trise d ouvrage n interviendra qu au niveau des sp cifications et au niveau des recettes Elle sugg re aussi dans la mesure o il peut y avoir une communication r guli re entre les deux parties d utiliser les m thodes dites agiles Le but de ces m thodes est de s assurer tout au long du processus de d veloppement que le r sultat final correspondra bien aux attentes du client et non pas aux sp cifications qui ont la f cheuses tendance d tre incompl tes voir La th orie de la r ationnalit limit e et les th ories contractuelles des organisations Pour ce faire la plupart des m thodes agiles sont fond es sur un cycle de vie it ratif A chaque fin de phase le produit doit tre op rationnel et chacune d elles doit correspondre l ajout de nouvelles fonctionnalit s Cela n cessite g n ralement un plus grand travail de programmation car il faut souvent faire du refactoring cependant on est certain de fournir autre chose qu une analyse o
3. tudiant r side dans le fait que la derni re tape qui est la maintenance est g n ralement r duite au stricte minimum du fait qu elle ne rapporte pas de points Statistiquement il apparait donc que la dur e de vie d un projet de ce type est de l ordre de 2 ans Apr s quoi le logiciel devient obsol te et ou impossible mettre jour De ce fait il est g n ralement remplac par un nouveau projet Nous avons essay d tre le plus professionnel possible en prenant en compte cette tape du d veloppement 31 Collecte repr sentation et interrogation de ressources Ainsi les utilisateurs pourront envoyer leurs rapports de bug ou leurs suggestions a supportOkeft fr ou ajouter un ticket sur keft googlecode com N importe qui pourra aussi contribuer au projet grace la licence GPL3 qui autorise l utilisation la distribution et la modification de l application De notre c t il nous sera toujours possible m me au bout de plusieurs ann es de mettre jour le code source gr ce googlecode x De plus l architecture du logiciel a t pens e de mani re pouvoir tre r utilisable par n importe quel d veloppeur 8 http www gnu org licenses gpl 3 0 html 32 Conclusion Ce projet a t l occasion de mieux cerner les enjeux d une bonne communication au sein d une quipe de d veloppement De plus chacun de nous aura acquis certaines connaissances qui pourront s av rer utiles dans u
4. SE illustration 5 Taxonomie des m thodologies source http wikipedia org Dans le mod le RUP les diff rentes t ches Analyse Mod lisation D veloppement Test sont consid r es comme des disciplines s ex cutant simultan ment au cours du projet mais pas avec la m me intensit Ainsi par exemple nous consid rons que la mod lisation intervient tout au long du projet mais repr sente une charge de travail plus importante au d but du projet Business Modeling Requirements Analysis amp Design Implementation Test Deployment Configuration amp Change Mgmt Project Management Environment Iterations illustration 6 Exemple de d coupage en disciplines source http dn codegear com 19 Collecte repr sentation et interrogation de ressources Cette vision est plus repr sentative de la r alit et convient parfaitement au contexte car il semblait vident tant donn la complexit du sujet que nous aurions des corrections a apporter a la mod lisation au fur et 4 mesure que nos connaissances s am liorent tout au long du projet C est pourquoi nous avons choisi ce mod le de m thode A 4 Outils logiciels Notre projet reposant en grande partie sur la communication il nous fallait des outils permettant d am liorer celle ci Google Code Project Hosting est un service gratuit d h bergement de projets Open Source sur la plateforme Google Code Il a permis de g rer les diff rentes v
5. avons essay de limiter le nombre d actions n cessaires pour un sc nario Le r sultat est qu un utilisateur pourra passer d une recherche une autre uniquement en deux cliques s lection d un r sultat puis action effectuer Nous vous invitons lire le manuel d utilisation pour plus d informations 6 http www genome jp kegg soap doc keggapi manual html 7 http xml nig ac jp index html 24 R sultats ER KEFT Knowledge Extractor For TATOO beta 0 85 Efm xl Fichier Keft Edition Outil Aide Rechercher en ligne am INAME Chronic myeloid leukemia CML E path hsa05220 ICATEGORY Cancer PATHWAY hsa05220 Chronic myeloid leukemia GENE BCR ABL translocation HSA 613 25 EVI overexpression HSA 21 22 AML1 translocation HSA 861 p16 INK4A mutation HSA 1029 p53 mutation HSA 7157 RB1 mutation HSA 5925 IENV FACTOR 1 3 Butadiene CPD C16450 Rubber industry MARKER BCR ABL translocation HSA 613 25 WT1 HSA 7490 TIDRUG Imatinib mesylate Gleevec DR D01441 Hydroxyurea DR D00341 Interferon alpha DR D00745 D02745 D03305 D04552 D0455 COMMENT ICD O 9875 3 Tumor type Chronic myelogenous leuka REFERENCE PMID 15719031 gene tumor type AUTHORS RenR TITLE Mechanisms of BCR ABL in the pathogenesis of chronic my leukaemia pour chercher des info par internet L utilisation d un syst me de panier permet de mettre en m moire les r sultats trouv
6. les relations entre ces entit s G nes Pathways Malacies illustration 1 Relations genes pathway maladie Genes Un g ne est un morceau d ADN contenu dans le noyau de nos cellules et qui porte le plan de fabrication d une prot ine Les g nes sont porteurs des informations relatives aux caract ristiques d un individu couleur des yeux par exemple L homme poss de environ 30 000 g nes ce qui ne repr sente que 5 de tout son ADN Certaines esp ces animales et v g tales ont plus de g nes que l homme 10 Mat riels et m thodes Gene Pathways Le m tabolisme est un ensemble de transformation de processus biologiques qui se manifestent dans tous les tissus de l organisme vivant Le m tabolisme est constitu d un r seau de r actions biochimiques Lorsqu un ensemble d termin de r action de ce r seau se produit partir d un l ment appel pr curseur jusqu un ou des produits finaux cet ensemble de r actions est appel voie m tabolique Chacune de ces r actions est catalys e par une enzyme prot ine tr s sp cialis e qui intervient dans la cin tique chimique de la rection c a d la vitesse laquelle elle se produit Voici la repr sentation graphique d un pathway 11 repr sentation et interrogation de ressources Collecte ALZHEIMERS DISEASE or app soluble fragment c83 p3 peptides fragment y Secretase Af17 40 42 amp Secret se Park
7. puisse utiliser le fruit de notre travail Pour travailler avec ce serveur il nous a alors suffit d installer un plug in Subversion pour Eclipse dont nous allons parler ci apres 2 Plate forme de d veloppement Il y a g n ralement trois niveau en mati re d outils de d veloppement L diteur de texte simple exemple bloc note de windows les IDE qui sont en quelque sorte des diteurs de texte volu s et les plate formes de d veloppement qui sont des syst mes aux fonctionnalit s multiples La plate forme de d veloppement couramment utilis e pour JAVA est Eclipse C est un environnement complet disposant de nombreux outils pour faciliter le d veloppement ainsi que les tests et le d ploiement En utilisant cet environnement muni d un plug in pour Subversion il nous a t possible de travailler a plusieurs sur le code m me lorsque nous n tions pas ensemble 3 Wiki L innovation de ces derni res ann es en mati re de knowledge management reste le wiki Ce systeme qui permet la mise en commun des connaissances par mise jour successive et qui a montr son efficacit Etant donn la m thode de d veloppement choisie la r daction du rapport pouvait se faire en parall le des autres t ches Afin de mettre en commun nos recherches et de conserver r guli rement une trace de ce que nous faisions le wiki fournit par GoogleCode en m me temps que le serveur de fichier s av rait tre l outil id al Il n
8. son vrai nom Kyoto Encyclopedia of Genes and Genomes KEGG est un projet japonais de grande envergure dont l objectif ambitieux est d int grer toute la connaissance mondiale en g n tique KEGG est compos e d une vingtaine de bases de donn es mais celles qui nous int ressent sont les suivantes gt KEGG PATHWAY KEGG DISEASES KEGG GENES Ce service web nous permettra de connaitre les relations entre chaque entit et utilise le protocole SOAP Cot technique KEGG fournit une API sous forme de classes JAVA ou d un fichier WSDL Les premi res sont directement utilisables dans un programme crit en JAVA alors que le deuxi me contient les sp cifications du service qui permet de programmer ses propres classes dans le langage que l on souhaite 1 http www genome jp kegg 14 Mat riels et m thodes L inconv nient de KEGG est que son API n est pas tres normalis e On pourra par exemple obtenir les noms des pathways si on lui demande la liste de ces derniers par contre on sera dans l incapacit totale d obtenir le nom d un pathway a l aide de son identifiant Les donn es ne sont pas toujours atomiques On se retrouvera souvent donc a devoir segmenter des cha nes de caract res pour avoir l information qui nous int resse ou a combiner deux r sultats de fonctions Ce qui rend donc notre application difficile 4 maintenir car si la mise en forme de KEGG change alors il faut changer une partie de notre programme Une ra
9. UM UNIVERSIT MONTPELLIER 2 SCIENCES ET TECHNIQUES ESSE LS Rapport de TER Encadrants Paola SALLE Sandra BRINGAY Etudiants Charles Edouard COSTE Karima ZAYRIT Wei XING Xin HU Version 1 0 26 04 2008 Table des mati res Remerciements Introduction A Mat riels et m thodes A 1 Objectifs 1 Besoins 2 Sp cifications A 2 Services web 1 KEGG 2 Gene ontology 3 MESH A 3 M thodologie 1 Cycle de vie 2 M thode de d veloppement A 4 Outils logiciels 1 Serveur de fichier 2 Plate forme de d veloppement 3 Wiki 4 UML B R sultats B 1 Interrogation B 2 Ergonomie B 3 Performances B 4 R utilisabilit C Discussion C 1 R ussite ou chec C 2 Perspectives C 3 Les point forts du projet 1 L interface 2 Les performances 3 La maintenance Table des matieres 10 13 14 15 15 16 18 20 21 21 21 31 31 31 10 13 16 20 23 24 24 27 27 29 30 30 31 Collecte repr sentation et interrogation de ressources Conclusion Glossaire R f rences bibliographiques R f rences webographiques Illustrations 33 35 3 39 41 Remerciements L quipe tient remercier comme il se doit ses encadrantes Sandra BRINGAY maitre de conf rence l Universit Montpellier III et Paola SALLE doctorante dans l quipe TATOO pour leur soutien et leur disponibilit ainsi que pour leurs pr cieux conseils et leur patience Introduction
10. angage de description de donn es bas e sur 1 T e Plus DDIQDHOO Fara XML et permettant de repr senter des r usinage C est donc une technique qui ontologies s approche de l optimisation du code m me si PP P Voir p 30 les objectifs sont radicalement diff rents N Wes Services Description LANGUAGE source wikipedia org C est un un format XML qui indique Voir p 17 comment utiliser le service web qui lui est S mpLE OBJEct Access ProTocoL m associ Protocole de commande distance bas sur Voir p 14 XML Voir p 13 14 15 SQL 35 References bibliographiques LES CAHIERS DU PROGRAMMEUR SWING Titre Les cahiers du programmeur Swing Auteurs Emmanuel Puybaret Voir p 18 2UML pour LEs DECIDEURS Titre UML pour les d cideurs Auteurs Franck Vall e Voir p 16 18 37 References webographiques 1GENE OnToLocy Adresse du site web http www geneontology org Voir p 15 2GNU GENERAL PUBLIC LICENCE Adresse du site web http www gnu org licenses gpl 3 0 html Voir p 32 3GooGLECoDE Adresse du site web http googlecode com Voir p 20 4KEGG API REFERENCE Adresse du site web http www genome jp kegg soap doc keggap i manual html Voir p 24 5KvoTo ENCYCLOPEDIA or GENES AND GENOMES Adresse du site web http www genome jp kegg Voir p 14 6SourceForGE Adresse du site web http sourceforge net Voir p 20 7Wes API For Biolnrormatics Adresse du site web http
11. e de termes utilis e pour l analyse documentaire dans le domaine biom dical Le vocabulaire MeSH est un outil d indexation d articles pour l Index Medicus amp et MEDLINE et de catalogage pour les ouvrages et les documents audiovisuels Le vocabulaire contr l de MeSH est un trait distinctif de MEDLINE L indexation de la documentation biom dicale est effectu e de mani re homogene et coh rente Les descripteurs MeSH sont organis s de facon hi rarchique dans le MeSH Tree Structures descripteurs en structures arborescentes mis jour chaque ann e Malheureusement faute de temps nous n avons pas t en mesure d int grer ce service dans notre application A 3 M thodologie Tout projet se doit de d marrer par le choix de la m thode de travail qui conditionnera toute la d marche 1 Cycle de vie Un projet peut suivre diff rents types de cycles de vie Le plus connu est sans doute le cycle en V cependant nous avons opt pour une autre solution Il suffit de chercher un peu sur internet pour se rendre compte que chacun a un peu sa propre conception de chaque type de cycle de vie Cependant quelques livres r cents comme UML pour les d cideurs doc 2 consid re que le cycle en V impose un effet tunnel En effet d apr s l auteur ce type de cycle est suppos ne faire intervenir la maitrise d ouvrage qu au d but et la fin du projet Ce qui laisse le loisir la maitrise d uvre de produire un logiciel
12. ersions du logiciel grace au systeme Subversion SVN Afin de faciliter la mise en commun du travail de chacun et de b n ficier du suivi de version sur chaque fichier nous avons d cid d utiliser un serveur SVN Google code a sembl tre le plus adapt a nos besoins c est pourquoi dor navant chaque membre de l quipe mettra son travail en ligne sur http keft googlecode com qui correspond a notre site projet La communication entre maitrise d oeuvre et maitrise d ouvrage se fait quant a elle via le groupe google ProjetTer cr par Sandra Bringay dans cette optique 1 Serveur de fichier Lorsque l on souhaite travailler en groupe sur du code il devient important de g rer les versions des fichiers C est le r le d un serveur de fichier Diff rents sites web proposent gratuitement d h berger des projets informatiques Les plus en vogue sont SourceForge net et GoogleCode com Le second propose moins de fonctionnalit s mais se r v le plus simple utiliser Pour ne pas se perdre dans une jungle de fonctions dont nous n avons pas besoin nous avons pr f r utiliser GoogleCode 4 http sourceforge net 5 http googlecode com 20 Mat riels et m thodes Evidemment si le service est gratuit il y a une contrepartie nous devions attribuer une licence libre notre projet Nous nous sommes entendus et cela n a pas sembl poser de probleme d autant plus que notre int r t est qu un maximum de personnes
13. inson s Disease Cellcycle SCA amp syauclein Fe65 fragmentation Intracellular precursor glycolytic A degradation protein activity Oo NAC mr path P Secretase BACE AICD A i microglia c99 Apoa tp amyloidpleque__p fragment Ua Bar COT gt aia 3 7 senile plaque P APP HMW y Secretase a I ga eos NY IL1B L mr beri caspa A SP3 ls EN A fragment j Rar Dh Ca Complement cascade Ap gt homeostasis A 4 C31 Complement and g l fragment coagulation S o neurotoxic peptide cascades H02 GSK3B gt APT Mied y neurofibrillary mal tangles NFT E 05010 12126106 12 N terminal fragment illustration 2 Alzheimer s disease source http www genome jp kegg Mat riels et m thodes 2 Sp cifications Une fois la capture des besoins r alis e nous avons pu tablir les sp cifications de notre futur logiciel Par rapport aux besoins exprim s il a t d fini que notre produit devrait pouvoir interroger diff rentes bases de connaissances L engouement pour les services web nous a pouss a choisir ce moyen d interrogation dans la mesure du possible Une grande partie du travail aura d ailleurs t la recherche de services disponibles via le protocole SOAP Ces nouveaux protocoles ont l avantage d tre bas s sur des requ tes http standard Cela signifie que peu importe o l on soit si on peut acc der des sites internet alors on peu faire communiquer un logiciel a
14. ison suppl mentaire donc de bien d finir notre architecture KEGG est donc une ressource indispensable notre projet mais l utilisation de ce seul service ne permettrait pas de r pondre compl tement aux besoins En effet KEGG comme la plupart des bases de connaissance a adopt sa propre nomenclature et il arrive donc que l utilisateur ne sache pas r ellement comment s appelle ce qu il cherche Pour cela il nous faut compl ter les informations recueillies 2 Gene ontology Gene Ontology GO est consid r par beaucoup comme une esp ce de dictionnaire dans lequel on peut retrouver une grande quantit de termes biom dicaux Nous avons vu que KEGG a adopt une nomenclature bien sp cifique GO quant lui tente de lister un maximum de termes afin de connaitre ce quoi ils se r f rent C est un bon compl ment KEGG dans le sens il permet par rapport un terme donn de savoir quoi il se r f re le site de Gene Ontology ne pr sente pas de moyen d acc der aux donn es par les services web Cependant apr s de longues recherches nous avons trouv le site WABI qui fournit un acces par le protocole SOAP aux ressources de GO 2 http www geneontology org 3 http xml nig ac jp index html 15 Collecte repr sentation et interrogation de ressources 3 MESH MeSH est l acronyme de Medical Subject Headings Le MeSH produit par la NLM U S National Library of Medicine est une liste normalis
15. mportante mettre en uvre dans de futures versions Nous regrettons aussi de ne pas avoir pu int grer les donn es de MESH Cela aurait permis d obtenir plus de donn es sur les maladies Nous aurions aussi aim g n rer une javadoc complete afin de bien documenter les classes de notre application Cette partie devrait cependant tre faite assez facilement 30 Discussion C 3 Les point forts du projet Malgr quelques regrets quant au r sultat nous avons quand m me eu la satisfaction d aller au dela de la simple r ponse aux besoins 1 L interface A la base l interface n a pas vraiment fait l objet d exigences fonctionnelles fortes car tant secondaire par rapport au traitement Cependant nous avons r ussi obtenir un r sultat int ressant pour l utilisateur Rappelons que l interface que nous avons labor e permettra l utilisateur d enchainer diff rentes recherches en simplement deux cliques de souris Nous nous f licitons aussi de la visualisation des r sultats qui n tait pas n cessaire mais que nous avons tout de m me inclue et donne un petit plus notre application 2 Les performances Aucune sp cification particuli re ne faisait tat des performances de l application C est pourtant un facteur que nous avons pris en consid ration et le syst me de cache permettra l conomie de plusieurs heures de traitements 3 La maintenance le probl me d un grand nombre de projets d
16. ne future vie professionnelle Nous sommes d autant plus satisfait que le r sultat r pond plut t bien aux besoins du cahier des charges Et m me si certaines am liorations sont encore apporter notre strat gie de d veloppement et les choix techniques que nous avons fait favorisent le support long terme de ce logiciel 33 Glossaire Langage de programmation utilis pour EXTREM PROGRAMMING gas prog P M TE e effectuer des requ tes sur des bases de M thode it rative et incr mentale de i E M donn es de type dit relationnel d veloppement logiciel focalis e sur l aspect Voir p 30 programmation Voir p 18 TATOO Extraction de connaissances dans les bases de INTEGRATED DEVELOPPEMENT ENVIRONMENT donn es motifs s quentiels et ontologies Voir p 5 7 Logiciels d dition de code source Voir p 21 Unifieo Process REFACTORING o M thode g n rique it rative et incr mentale La refactorisation anglicisme venant de o du nu de d veloppement de logiciels orient s objet refactoring est une op ration de maintenance du code informatique Elle consiste Mu retravailler le code source non pas pour UNIFORM Resource Locator ajouter une fonctionnalit suppl mentaire au Synonyme de adresse web logiciel mais pour am liorer sa lisibilit Voir p 13 simplifier sa maintenance ou changer sa Wes OnToLoGY LANGUAGE n ricit on parle aussi de remaniement e j 8 ony L
17. objectif du projet KEFT Knowledge Extractor For TATOO que notre groupe a initi dans le cadre de notre master informatique professionnel et recherche unifi l universit Montpellier 2 l occasion d un travail d tude et de recherche de 3 mois Fournir aux experts un logiciel capable d interroger diff rentes bases et de r cup rer les donn es sous une forme exploitable A Materiels et m thodes A 1 Objectifs 10 1 Besoins 10 Genes 10 Pathways 11 2 Sp cifications 13 A 2 Services web 13 1 KEGG 14 2 Gene ontology 15 3 MESH 15 A 3 M thodologie 16 1 Cycle de vie 16 2 M thode de d veloppement 18 A 4 Outils logiciels 20 1 Serveur de fichier 20 2 Plate forme de d veloppement 21 3 Wiki 21 4 UML 21 Cette partie du rapport pr sente l essentiel de notre d marche Nous y aborderons un peu plus en d tail les sp cifications du logiciel et les choix techniques et strat giques que nous avons effectu s afin de r pondre aux besoins de la maitrise d ouvrage Collecte repr sentation et interrogation de ressources A 1 Objectifs 1 Besoins Comme vu pr c demment le but du projet est d int grer diff rentes donn es biom dicales Mais pas n importe lesquelles et pas n importe comment Selon le cahier des charges fournis par la maitrise d ouvrage le produit devra tre capable de r colter des informations concernant des g nes des maladies et des pathways Il devra aussi tre capable d tablir
18. ous suffirait alors pour la r daction du rapport de r cup rer tout ce qui aura t crit 4 UML Nous avons vu que la communication prenait une part importante dans notre projet Notre quipe pr sentant plusieurs nationalit s les erreurs de d interpr tation risquaient d tre fr quentes 21 Collecte repr sentation et interrogation de ressources Comme son nom l indique UML Unified Modeling Language et un langage Un langage connu de tous les membres du groupe De ce fait son utilisation a permis de mieux clarifier les choses et dissiper les malentendus Cependant les outils libres d utilisation ont un niveau de qualit encore limit dans ce domaine et nous n avons pas pu utiliser ce langage autant que nous l aurions souhaite 22 B R sultats B 1 Interrogation 24 B 2 Ergonomie 24 B 3 Performances 27 B 4 R utilisabilit 27 23 Collecte repr sentation et interrogation de ressources B 1 Interrogation Le minimum syndicale pour notre application est bien videmment qu il soit capable d interroger les bases de donn es qui nous int ressent Nous allons voir que c est bien le cas L application se connecte parfaitement bien aux services web KEGG et GO Les classes que nous avons d velopp gr ce la documentation de KEGG et l interface vers GO fournie par le site WABI permettent l interrogation de ces services B 2 Ergonomie Le logiciel est relativement facile d utilisation Nous
19. s Ainsi n importe qui pourrait r cup rer le package principal de notre application et d velopper sa propre interface utilisateur tout en conservant les m mes fonctionnalit s 27 C Discussion C 1 R ussite ou chec 30 C 2 Perspectives 30 C 3 Les point forts du projet 31 1 L interface 31 2 Les performances 31 3 La maintenance 31 Cette partie pr sente le bilan du projet Nous allons voir les points positifs et les points n gatifs 29 Collecte repr sentation et interrogation de ressources C 1 R ussite ou chec La premi re question a se poser concernant le r sultat de notre projet est Avons nous rempli les objectifs fix s Dans la mesure ou l objectif de notre travail tait l interrogation de sources de donn es biom dicales et leur int gration sous une forme exploitable pour de le fouille de donn es nous pouvons dire que l objectif est atteint En effet notre application est capable de r cup rer des donn es provenant de KEGG et de GO et de les int grer dans une base de donn es SQL qui permet de r cup rer facilement les donn es C 2 Perspectives Il est videmment impossible de faire un projet parfait question de temps et de moyens Voici quelques l ments que nous n avons pas pu traiter et qui pourrait faire l objet de mises jour Faute de temps nous ne sommes pas all s jusqu exporter nos r sultats sous le formatOWL Cela semble tre la fonctionnalit la plus i
20. s ainsi que de les visualiser 25 Collecte repr sentation et interrogation de ressources CO as 26 Ez 22 MM Qoo 25 RAS RP1 o 11 pasUnGene hn ABCR 104010 00003 Acute myeloid leukemia AN 04012 d MA Chronic myeloid teukemis 304015 05220 illustration 7 Visualisation du r sultat R sultats B 3 Performances Lors des premiers tests nous avons pu nous rendre compte que les temps d interrogation des services web avaient tendance tre tr s longs environ une demi seconde par requ te de ce fait il a fallut trouver une solution Gr ce notre m thodologie de d veloppement nous nous sommes rendu compte assez t t lors de la premiere it ration qu il fallait trouver un moyen d acc l rer le traitement des donn es Pour cela nous avons opt pour un syst me de cache qui puisse conserver les r sultats en locale pendant une certaine dur e Pour cela nous avons utilis le design pattern Fagade qui est le plus appropri En y ajoutant une classe d abstraction pour une base de donn es nous avons pu obtenir des temps de traitement quasi instantan s pour autant que la recherche ait t faite ant rieurement B 4 R utilisabilit Une architecture qui permet de r utiliser les classes principales L architecture de Keft s articule autour de la classe du m me nom Cette classe a t con ue pour pouvoir tre r utilisable par d autres d veloppeur
21. u un logiciel moiti fini 17 Collecte repr sentation et interrogation de ressources Ny Besoin S Elaboration a Faisabilit Fabrication te Transition Exploitation ou Test par les utilisateurs illustration 4 Cycle de vie it ratif source http wikipedia org 2 M thode de d veloppement Le cycle de vie d fini il faut d finir une m thodologie de travail pour organiser ce dernier au sein de l quipe La plus connue est sans nul doute le pilotage par les cas d utilisation Il existe un nombre cons quent de m thodes de d veloppement Nous avons vu que nous nous orientons vers des m thodes agiles Nous avons identifi deux m thodes connues l Extrem Programming XP et le Rational Unified Process RUP Nous n entrerons pas dans le d tail de ces m thodes qui m riteraient un rapport elles seules Cependant la grande diff rence entre ces deux m thodes est le niveau de formalisme n cessaire ou possible En effet la m thode XP dont nous avons eu un apergu dans UML pour les d cideurs doc 2 ainsi que Swing doc 7 dans la collection des Cahiers du programmeur n est pas tr s formaliste Elle n oblige pas produire de document d analyse et se base beaucoup sur la virtuosit des d veloppeurs Comme nous voulions une m thode permettant de structurer notre travail nous avons pr f rer opter pour la m thode RUP 18 Mat riels et m thodes Cascade Formalisme
22. vec un service web Ce qui n est pas le cas lorsque l on interroge une base de donn es directement car si un pare feu est en place il se peut qu il emp che ce type de communication A 2 Services web Un aspect important des nouvelles technologies du web est l apparition des services web Ces derniers sont en quelque sorte des sites web pour programmes Les donn es sont directement envoy es d un site web un autre ou un logiciel tournant sur votre ordinateur Cependant il arrive souvent qu un service web ait son quivalent en html format standard des pages web pour qu un humain puisse aussi s en servir Pour utiliser un service web il faut connaitre son adresse URL exactement comme pour un site web Par contre il nous faut aussi la liste des fonctions que l on peut appeler Un service de gestion de photos pourrait proposer par exemple addPhoto getPhoto deletePhoto 13 Collecte repr sentation et interrogation de ressources Pour ne pas avoir a v rifier constamment que les fonctions soient toujours disponibles et pour ne pas avoir mettre jour l URL du service s il change souvent certains services web proposent un fichier WSDL qui contient la description compl te du service Une application pourra donc v rifier si elle est toujours en mesure d interroger le service Voici quelques ressources biom dicales connues disponibles en ligne et interrogeables par des services web 1 KEGG De
23. xml nig ac jp index html Voir p 15 24 39 illustration 1 illustration 2 illustration 3 illustration 4 illustration 5 illustration 6 illustration 7 Illustrations Relations g nes pathway maladie 10 Alzheimer s disease source http www genome jp kego 12 Le cycle de vie en V source http wikipedia org 17 Cycle de vie it ratif source http wikipedia orQ nenn 18 Taxonomie des m thodologies source http wikipedia org 19 Exemple de d coupage en disciplines source http dn codegear com 19 Visualisation du r sultat iiiiiiiieiieeieeeecereceeceee 26 41 Collecte 42 repr sentation et interrogation de ressources

Download Pdf Manuals

image

Related Search

Related Contents

RETRO FIT LED SERIES  to the information brochure.  【募集要項に定める提出書類一式及び記入要領】  IC3(アイシーキューブ)とPJP-25UR/PJP  TRAILED TANK  Aries User Manual - Aries FilterWorks  Nobo Internal Glazed Case Fabric 9xA4  English - Soulution    HAM User Manual  

Copyright © All rights reserved.
Failed to retrieve file