Home

SPIRALES 2008

image

Contents

1. 100 R sultats attendus livrables 10 lignes maximum e Version 1 0 d EST db document e suffisamment g n rique pour tre install e sur n importe quel serveur bio informatique e Distribution d EST db aux quipes IRD ou partenaires int ress s pour utiliser l application apr s d claration l APL D veloppement de nouvelles fonctionnalit s ajoutant une valeur ajout e importante EST db o Possibilit de lancer le pipeline par les partenaires et IRDiens expatri s o Lancement du pipeline partir des s quences format fasta et pas uniquement des chromatogrammes o Am lioration des interfaces de consultation o Mise en place d un module de visualisation des s quences ESTs compar es leur contig o Am lioration de l interface d administration e Module d Annotation Automatique en grande fonction e Module analyse comparative inter et intra esp ces e R daction d une publication dans la revue appropri e et ou d une communication dans un congr s international 101 Pertinence du projet pour votre communaut scientifique Les quipes IRD concern es par ce projet utilisent d j en routine l application EST db pour traiter leurs donn es de g nomique Ce projet s il continue permettra de r aliser de nouveaux types d analyses indispensables comprendre la biodiversit et rechercher de nouveaux g nes d int r ts chez les plantes tropicales EST db est un outil incontournable pour la r
2. 3 5 6 8 du pr sent formulaire Joindre le cas ch ant tous documents utiles document de sp cifications techniques et fonctionnelles cahier des charges propositions techniques et financi res re ues O Projet autre qu un d veloppement d application IS proposition finalis e concernant tous autres domaines animations v nements traitement de donn es calcul intensif Ne renseigner que les parties 1 2 3 5 7 8 du pr sent formulaire o Continuum d un projet SPIRALES existant pr vu sur 2007 2008 ou suite d un pr c dent projet SPIRALES Formulaire de demande SPIRALES 2008 page 2 32 spirales ird fr o Continuum d un d veloppement d une application IS Ne renseigner que les parties 1 2 3 4 6 8 du pr sent formulaire O Continuum d un projet autre qu un d veloppement d application IS Ne renseigner que les parties 1 2 3 4 7 8 du pr sent formulaire Les demandes d h bergement d applications IS d acc s un serveur de d veloppement de cr ation de d p t Subversion SVN de formations IS ne constituent pas des demandes SPIRALES et doivent tre adress es directement equipe is ird fr sans ch ance particuli re 4 Dur e pr vue O Dur e pr vue Olan Bi 2 ans Pour les continuums date de d marrage du projet o 2004 o 2005 0 2006 2007 2 Porteur s de projet Cette partie questions
3. Bien que manuelle la proc dure d installation n est pas complexe accompagn e d une notice d installation elle ne posera pas de soucis pour l adoption de l outil par les utilisateurs cibles Toutefois l installation devra tre effectu e par un informaticien bioinformaticien poss dant les droits root sur le serveur Formulaire de demande SPIRALES 2008 page 28 32 spirales ird fr Op ration 91 Les utilisateurs pourront ils faire fonctionner l outil sans votre aide Si les utilisateurs doivent solliciter votre quipe ou des consultants externes ou suivre une formation d crire les d tails et les co ts Oui il y aura une possibilit d aide Une formation de courte dur e sur l utilisation du pipeline des fonctionnalit s propos es par l application peut tre envisag e Ce sera r fl chi en fonction de la demande des utilisateurs et surtout g r par C Dubreuil Tranchant Assurance qualit maintenance et support 92 Lister les techniques que votre quipe utilisera pour d tecter les erreurs ou d fauts Pour conna tre les ventuels probl mes de l application on va stocker les messages d erreur dans un fichier de log d EST db L administrateur sera galement averti par email en cas de probl mes graves Le fichier log d apache sera galement examin en cas de probl me 93 Dans le cas o vous auriez un programme beta en fin de d veloppement d crire comment il fonctionnera
4. e recherche veloppement D l gation aux Syst mes d Information P le des services d appui la recherche Informatique scientifique Appel projets interne OPIRALES 2008 Formulaire de demande DSI SPIRALES Soutien aux Projets Informatiques dans les Equipes Scientifiques Remise des projets 16 novembre 2007 Contact spirales ird fr R gis Hocd Informatique Scientifique regis hocde ird fr ou equipe is ird fr I R D Institut Recherche D veloppement www ird fr Si ge social 213 rue La Fayette 75010 Paris Demande d un soutien DSI sur les projets informatiques des UR US Formulaire de demande DSI SPIRALES 2008 Soutien aux Projets Informatiques dans les Equipes Scientifiques Le pr sent formulaire comporte diff rentes parties qui doivent ou non tre renseign es selon la nature de votre projet La modification du formulaire en une s rie de questions pr cises est destin e a faciliter le travail des valuateurs Les propositions doivent tre adress e sous forme lectronique au format RTF DOC ou PDF l adresse suivante spirales ird fr 1 Nature du projet Cette partie questions 1 a 4 doit tre renseign e quelque soit la nature de la proposition nouveau projet ou continuum d un projet SPIRALES existant tude de faisabilit projet finalis de d veloppement d une application IS ou autre 1 Titre du projet D veloppement de la plateforme
5. LEROY T HAMON S de KOCHKO A 2007 Molecular Characterization of an Ethylene Receptor gene CcETR1 in coffee trees Its relationship Formulaire de demande SPIRALES 2008 page 13 32 spirales ird fr with fruit development and caffeine content Mol Genet Geno 277 701 712 CAMPA C RAKOTOMALALA J J de KOCHKO A HAMON S 2007 Chlorogenic Acids Diversity in green beans of wild coffee species Advances in Plant Physiology Accepted Charoenwut c P Kongsawadworakul J P Pichaut D Nandris U Sookmark C Tranchant J Narangajavana and H Chrestin 2007 Cloning and Characterization of Specific Molecular Markers of Rubber Tree Trunk Phloem Necrosis In Proc IRRDB Int rubb Conf 12 14 November 2007 Siem Reap Cambodia Chatsapsin S U Sookmark P Kongsawadworakul C Tranchant and H Chrestin 2007 Differential expression of some ASR gene isoforms in the latex and bark of rubber tree Effects of Ethrel stimulation In Proc IRRDB Int rubb Conf 12 14 November 2007 Siem Reap Cambodia F Cartieaux C Contesto A Gallou G Desbrosses L Taconnat J P Renou and B Touraine 2007 Simultaneous interaction of Arabidopsis thaliana with Bradyrhizobium sp ORS278 and Pseudomonas syringae pv tomato DC3000 leads to complex transcriptome changes MPMI accept Fernandez D Ramiro D Petitot A S and Maluf M 2006 Phylogenetic analysis of the WRKY transcription factors gene superfamily in coffee plants Proce
6. par l Equipe IRD Bradyrhizobium photosynth tique a pour objectif d identifier les acteurs mol culaires n cessaires l interaction entre les l gumineuses tropicales du genre Aeschynomene et les Bradyrhizobiums photosynth tiques L interaction L gumineuse Rhizobium se caract rise par la sp cificit avec laquelle elle s tablit La reconnaissance mutuelle des deux partenaires est donc une tape clef de la mise en place de cette symbiose Cette reconnaissance est rendue possible par une signalisation mol culaire complexe qui implique des lipo chito oligo saccharides bact riens LCOs ou facteurs NOD reconnus par des kinases v g tales particuli res Cet v nement de reconnaissance entre facteurs NOD bact rien et kinases v g tales induit chez la l gumineuse une cascade de signalisation complexe qui conduit la formation d un organe sp cialis le nodule au sein duquel la bact rie symbiote s internalise Cette suite d v nements a t mise en vidence chez tous les Rhizobium caract ris s jusqu maintenant mais l universalit de ce paradigme a t tr s r cemment remise en question par notre tude du couple Bradyrhizobium photosynth tiques Aeschynomene En effet l examen des s quences g nomiques de deux souches de Bradyrhizobium photosynth tiques ORS278 et BTAi1 n a pas permis de d tecter la pr sence des g nes nod communs chez ces bact ries ceci d montre que les facteurs Nod ne sont pas requis pour
7. plus de 9 000 s quences et continue de grandir La collection de clones EST provient de plusieurs organes diff rents de la plante inflorescence pousses feuill es embryons somatique et zygotique Dans le cadre d une nouvelle collaboration initi e avec la Tha lande les ressources g nomiques disponibles pour le palmier huile vont tre largement augment es en 2008 Ces ressources dont le traitement bioinformatique sera r alis IRD n cessiteront l utilisation d outils bioinformatiques automatis s pour lannotation des s quences Elles serviront de base pour 1 le d veloppement de la premi re puce oligonucl otides de palmier huile qui sera utilis e dans le cade d un projet focalisant sur le d veloppement et la maturation du fruit bourse de th se RTRA et 2 la recherche de marqueurs SRR en collaboration avec le Cirad Programme 7 Hevea Equipe H v a IRD Mahidol University UR060 Clifa Hevea brasiliensis est la seule esp ce v g tale cultiv e zone tropicale humide pour la production de latex duquel est tir le caoutchouc naturel Le programme Recherche de marqueurs mol culaires du stress et de g nes candidats li s la production du latex chez Hevea brasiliensis men e par l quipe Franco Tha e IRD Mahidol University est bas sur l analyse de l expression diff rentielle de g nes dans la latex et le phlo me corce interne d Hevea L tude porte sur des arbres de clones h
8. Auguy F Gherbi H Bogusz D and Franche C Functional analysis of the metallothionein gene CgMT1 isolated from the actinorhizal tree Casuarina glauca Mol Plant Microbe Interact 2007 20 1231 1240 P ret B Svistoonoff S Lahouze B Auguy F Santi C Doumas P and Laplaze L A role for auxin during actinorhizal symbioses formation Plant Signal Behav 2008 In press P ret B Swarup R Jansen L Devos G Auguy F Collin M Santi C Hocher V Franche C Bogusz D Bennett M and Laplaze L Auxin influx activity is associated with Frankia infection during actinorhizal nodule formation in Casuarina glauca Plant Physiol 2007 144 1852 1862 Download PDF Petitot A S Lecouls A C and Fernandez D 2007 Sub genomic origin and regulation patterns of a duplicated WRKY gene in the allotetraploid species Coffea arabica Tree Genetics and Genomes DOI 10 1007 s11295 007 0117 x PONCET V DUFOUR M HAMON P HAMON S de KOCHKO A LEROY T 2007 Development of genomic microsatellite markers for Coffea genus and their potential use for endangered wild species Genome Accepted Poncet V Rondeau M Tranchant C Cayrel A Hamon S de Kochko A Hamon P 2006 SSR mining in coffee tree est databases potential use of EST SSRs as marker across Coffea genus Mol Genet Geno 276 no 5 pp 436 449 Rotchanapreeda T P Kongsawadworakul U Sookmark C Tranchant and H Chrestin 2007 Ethylene induces
9. alisation de nos programmes de recherche et pour leur valorisation sous forme de publication Ce projet SPIRALE permettra aussi l optimisation d EST db afin de rendre cette application transf rable et utilisable pour les quipes IRD expatri es et les partenaires ext rieurs Formulaire de demande SPIRALES 2008 page 30 32 spirales ird fr 102 Pertinence du projet vis a vis des objectifs de SPIRALES justification d un financement DSI Le projet que nous proposons entre tout fait dans les objectifs de SPIRALES Il s agit de finaliser l application EST db utilis e par 4 UMRs diff rentes en ajoutant de nouvelles fonctionnalit s et en produisant un code suffisamment param trable afin que l application soit install e sur n importe quelle plate forme et distribu e a des partenaires de d velopper de nouveaux modules EST db outil con u d velopp et utilis de fa on transversale par les diff rentes quipes UMRS plantes pr sentes l IRD Ce projet qui concerne plus sp cifiquement la g nomique comparative permettra d tendre l utilisation d EST db des partenaires ext rieurs d organismes tels que l INRA Cf Programme Biodiversit ou le CNRS Cf Programmes Symbioses actinorhiziennes ainsi qu des partenaires du Sud Cf Programme H v a 103 Retours sur investissement attendus pour l unit l institut Pour les unit s o Analyse et exploitation des donn es g nomiques o Avanc e dans les
10. ESTs comme sur GOBLET et utilisation par exemple d AMIGO pour visualiser le graphe Ajout d une fen tre permettant a chaque consultant d inclure des commentaires sur une s quence particuli re singleton et ou contig gt Nouvelles fonctions 1 mois fin juin 2008 Un module Publish EST qui permettrait de formater les informations relatives une s lection d ESTs avec le format requis pour une soumission a une base de donn es publiques Module de recherche des Open Reading Frame ORF Module permettant le calcul du codon usage et du en G C des s quences 45 Eventuellement budget d taill montrant les co ts des t ches cl s des diff rents modules ou phases Les informations apport es doivent tre coh rentes avec celles pr cis es a la question 18 Prestation de services 20 000 euros le d tail n est pas disponible Nous n avons pas encore fait tude d taill e avec le prestataire Mat riel 10 000 euros financement demand inter UMR 46 Si vous demandez des fonds pour des activit s autres que du d veloppement logiciel pourquoi ces activit s sont elles essentielles l accomplissement de votre projet 47 Quel sont les risques encourus si votre projet ne peut tre finalis ch ance et dans le budget pr vu Comment comptez vous pallier ces risques SI le projet ne peut pas tre finalis l ch ance toutes les am liorations de l appli
11. Lipoxygenase Genes jasmonate pathway early upregulation in the inner bark tissues of Rubber Tree In Proc IRRDB Int rubb Conf 12 14 November 2007 Siem Reap Cambodia SALMONA J DUSSERT S DESCROIX F de KOCHKO A BERTRAND B JOET T 2007 Deciphering transcriptional networks that govern Coffea arabica seed development using combined cDNA array and real time rt pcr approaches PI Mol Biol Accepted Silva M C V rzea V Guerra Guimar es L Azinheira H G Fernandez D Petitot A S Bertrand B Lashermes P Nicole M 2006 Coffee resistance to the main diseases leaf rust and coffee berry disease CBD Brazilian Journal of Plant Physiology 18 119 147 Sy M O Hocher V Gherbi H Laplaze L Auguy F Bogusz D and Franche C The cell cycle promoter cdc2aAt from Arabidopsis thaliana is induced in the lateral roots of the actinorhizal tree Allocasuarina verticillata during the early stages of the symbiotic interaction with Frankia Physiol Plant 2007 Verdeil JL Niemena N Alemanno L Tranbarger Timothy John 2007 Pluripotent versus Totipotent plant stem cells dependence versus autonomy Trends In Plant Science Vol 12 N 6 245 252 Vuillet L Kojadinovic M Zappa S Jaubert M Adriano J M Fardoux J Hannibal L Pignol D Verm glio A and Giraud E 2007 Evolution of a bacteriophytochrome from light to redox sensor The EMBO Journal 6 14 3322 31 34 Description et an
12. Si des utilisateurs se sont d j engag s pour l utiliser listez les 94 De quelle mani re votre quipe fera t elle le suivi des erreurs dans ce projet Toutes les erreurs du projet comme toutes les taches accomplies avec succ s seront not es dans le fichier du suivi de projet Les erreurs seront signal es au chef de projet En cas d urgence une r union de crise sera organis e afin de corriger le probl me cr 95 De quelle mani re apporterez vous un support vos utilisateurs pendant la dur e de ce projet et apr s Pendant la dur e du projet les utilisateurs continuent utiliser l ancienne version de EST db qui poss de les fonctionnalit s basiques pour leurs analyses Apr s la mise en place de la version am lior e le suivi entretien mise jour gestion des erreurs Sera assur par le responsable de la plateforme bioinformatique C Dubreuil tranchant ou rempla ant En tant qu administrateur de bases de donn es il assurera la maintenance de la base de donn es am lioration des performances de s curit gestion d erreurs sauvegardes mises jour 96 De quelle mani re apporterez vous un appui aux d veloppeurs d autres outils qui souhaiteraient utiliser et int grer votre outil aux leurs En cas de demande d int gration de notre outil dans un outil externe apr s un accord pr alable entre les chefs des projets et les responsables scientifiques d EST db nous
13. allons mettre la disposition de ces d veloppeurs la documentation technique et le sch ma de la base de donn es et du pipeline 7 Description du projet HORS d veloppement d application IS m thodes solutions et moyens Cette partie questions 97 a 99 concerne les nouveaux projets ainsi que les demandes de continuums HORS d veloppement d application IS La demande peut tre accompagn e de tous documents utiles pr sentation du projet global ou descriptif du projet rapport de phases Formulaire de demande SPIRALES 2008 page 29 32 spirales ird fr pr liminaires tude de faisabilit dossier d expression des besoins ou cahier des charges devis d taill 97 Description du projet 98 Description technique du projet choix technologiques si appropri 99 Organisation faisabilit et ch ancier du projet 8 Pertinence r sultats livrables attendus et valorisation du projet Cette partie questions 100 a 106 doit tre renseign e quelque soit la nature de la proposition nouveau projet ou continuum d un projet SPIRALES existant tude de faisabilit projet finalis de d veloppement d une application IS ou autre La demande peut tre tre accompagn e de tous documents utiles pr sentation du projet global ou descriptif du projet rapport de phases pr liminaires tude de faisabilit dossier d expression des besoins ou cahier des charges devis d taill
14. connaissances fondamentales en biologie des plantes o R alisation de publications Pour l institut o D veloppement d une application EST db g n rique transf rable o D veloppement de la premi re plateforme bio informatique IRD o D veloppement de comp tences nouvelles en bio informatique o Expertise IRD en bio informatique et transfert aux partenaires 104 Capitalisation valorisation transfert de savoirs faire ou d outils possibles ou pr vus en mati re d lS Toute la m thodologie sera d crite et l application ainsi que la documentation associ e rapport de sage documentation technique sera transmise sur demande au sein de l institut en vue de transf rer notre savoir faire et expertise dans ce domaine La valorisation de cet outil sera aussi assur e par le biais de publications dans des revues sp cialis es de communication a des congr s de formations organis es pour les quipes potentiellement int ress e Les chercheurs associ s ce projet valoriseront l application EST db en publiant les r sultats issus des analyses r alis es dans les revues scientifiques ad quates 105 Valorisation possible ou pr vue s R daction d une publication dans la revue appropri e et ou d une communication dans un congr s international s D claration de l application EST db APL e Distribution d EST db aux quipes IRD ou partenaires int ress s et mise en ligne au niveau du site de la plateforme bio
15. la DSI apport pour l laboration du projet Si vous avez b n fici de l appui de la DSI coordination IS pool d informaticiens scientifiques de Dakar ou Noum a SIL pour l laboration de cette proposition d crivez tr s bri vement le type d appui Comme pour tout projet bio informatique le SIL de Montpellier est impliqu expertise conseil technique et administration syst me de la plate forme bio informatique de Montpellier 4 Bilan Etat d avancement des phases pr c dentes seulement pour les demandes de continuums Cette partie questions 28 32 ne concerne que les demandes de continuums pour des projets SPIRALES initi s au cours des ann es pr c dentes Il est vivement conseill d accompagner la demande de tous documents utiles rapport de phases pr liminaires cahier des charges r sultats prototype vues crans de l application d velopp e d monstrateur en ligne 28 Etat d avancement du projet A Acceptation du projet d but 2007 Pour la r alisation de ce projet il a t d cid de passer par un prestataire de service Avril et Mai 2007 R daction du cahier des charges pr cis par Christine Dubreuil Tranchant et validation par le groupe de travail Juin 2007 Identification de prestatires de service et mise en concurrence R alisation des tudes par les diff rents prestataires Adaptation du cahier des charges Fin Juin 2007 Soci t ASA Advanced Soluti
16. la base de donn es EST db Chaque projet g nomique g n re une masse importante d informations sous la forme d ESTs Avant d aboutir son annotation chaque EST doit subir une s rie de traitements n cessitant l utilisation de diff rents logiciels Compte tenu du volume important d informations et de traitements un pipeline est n cessaire pour automatiser l analyse de chaque EST e A l issue du s quengage des ESTs les chromatogrammes g n r s sont analys s afin d obtenir la s quence nucl ique e La s quence ensuite doit tre analys e afin de masquer les bases de mauvaise qualit et celles appartenant au vecteur puis s lectionner uniquement les parties r ellement informatives e Afin de supprimer la redondance au niveau des s quences et de d terminer l agencement des s quences une phase de contiguage est n cessaire e Puis les s quences sont annot es L tape finale est de comparer un pool d ESTs avec celui produit sur une autre plante tropicale ou avec les donn es publiques Les r sultats de chaque tape de ce traitement sont archiv s dans une base de donn e et l ensemble pipeline base de donn e est consultable et utilisable au travers d une interface Web Structure du pipeline Le pipeline ou la cha ne de traitements est un programme perl qui va permettre de combiner Formulaire de demande SPIRALES 2008 page 16 32 spirales ird fr l ex cution de plusieurs logiciels l analyse des r s
17. les Ces analyses optimiseront l identification de s quences orthologues entre diff rentes esp ces et donc l annotation des g nes identifi s Ces comparaisons permettront de rechercher les relations existantes entre les g nes de diff rentes esp ces synt nie ainsi que les relations de ces g nes au sein d un m me g nome Pour la r alisation du projet une d marche classique de g nie logicielle sera faite phase d analyse et de mod lisation interviews des acteurs notation UML cahier des charges veille technologique bibliographique phase de d veloppement phase de test et de r daction des documentations techniques L objectif final est l obtention d une application finalis e et g n rique permettant l analyse des ESTs aussi bien issues de plantes que d animaux La d claration l APL de l application EST db permettra sa distribution a toute quipe de recherche int ress e IRD ext rieure partenaires du Sud 35 Description de l existant moyens outils comp tences OU renvoyer un document joint A Moyen Tout d veloppement sera r alis sur la plate forme bio informatique d di la g nomique v g tale dont l infrastructure est la suivante e 2 serveurs de calcul de production DellTM PowerEdgeTM 6650 4 processeurs Xeon 2 7 Ghz amp 8 Go de RAM e 1 serveur de d veloppement e Un syst me de stockage RAID Dell EMC 1 To de stockage Un serveur de fichier B Outil Le pipeline et
18. les g nes sp cifiques du processus symbiotique Nod ind pendant Ce projet s inscrit dans un programme plus large visant identifier les signaux non Nod impliqu s dans notre mod le mais galement dans les symbioses actinorhiziennes et regroupe les quipes de P Normand CNRS Universit Lyon 1 de D Bogusz Equipe Rhizogen se IRD UMR DIA PC et la n tre Programme 3 Coffea Equipe g nomique et qualit du caf IRD UMR DIA PC L quipe g nomique et qualit du caf s engage dans un programme en g nomique comparative au sein des Rubiaceae et entre Rubiaceae et Solanaceae sans pour autant n gliger la comparaison avec Arabidopsis On dispose de plusieurs milliers de s quences EST caf produits par notre laboratoire ou par d autres membres du r seau international g nomique caf ier ICGN Dans le cadre du r seau international RubiComp Rubiaceae comparative soutenu par l IRD dans sa fonction d Agence il est pr vu dans un avenir tr s proche de produire plusieurs milliers d EST partir de diff rents tissus et de banques soustraites de Psychotria Rubiaceae La constitution d une nouvelle banque BAC caf ier est en projet et conduira dans un premier temps au s quen age des extr mit s des s quences BAC Enfin de tr s nombreuses donn es en g nomique sous forme d EST de s quences de BAC et de s quen age de g nome concernant la famille des Solanaceae essentiellement la tomate sont d j disponib
19. n rique facilement transf rable d autres quipes IRD ou ext rieure et r pondant aux demandes actuelles des projets scientifiques traitements de donn es de s quen age analyses comparatives B Situation du projet pour 2008 Suite l acceptation de ce projet un prestaire de service a t engag ASA et travaille actuellement sur les diff rents l ments d finis par le cahier des charges Le projet a relativement bien volu et nous souhaiton sle continuer en 2008 afin de le finaliser Quelques modifications sont noter un programme scientifique suppl mentaire Cf Programme 2 a t ajout suite l obtention d un projet G noscope Par ailleurs l quipe IRD travaillant sur Noum a en association avec l Universit souhaite installer EST DBle plus rapidement possible et constitue avec le programme H v a en Tha lande et le programme Caf la R union une demande tr s forte de transfert de l outil EST DB C Les diff rents projets scientifiques impliqu s dans ce projet Copie de 2007 et nouveaux projets Programme 1 Symbioses actinorhiziennes Equipe Rhizogenese IRD UMR DIA PC Equipe Ecologie microbienne CNRS Univ Lyon 1 UMR 5557 Les travaux d velopp s par l quipe IRD Rhizogen se symbiotique ont pour objectif de comprendre les m canismes mol culaires et cellulaires qui aboutissent la mise en place et au d veloppement des racines symbiotiques des arbres tropicaux de la famille
20. ne de traitement du pipeline combinant les logiciels bioinformatiques ad quats correspondant une nouvelle fonctionnalit de l application EST db Ces projets concernent en priorit les diff rentes esp ces propres rIRD et s tendront des esp ces travaill es dans des quipes d autres organismes INRA CNRS associ es l IRD par le biais des UMRs ou de projet de recherche communs Une br ve description des Formulaire de demande SPIRALES 2008 page 9 32 spirales ird fr programmes de recherche concern s est propos e Voir paragraphe Descriptif des Projets Scientifiques et permettra de mieux mesurer la n cessit de d velopper cette nouvelle fonctionnalit Cependant le d veloppement de ce nouveau module est conditionn par l am lioration pr alable du pipeline existant afin d une part de le rendre convivial et g n rique et d autre part d y ajouter certaines fonctionnalit s telle que l annotation automatique des s quences en grandes fonctions selon Gene Ontology ou encore l affichage correct des s quence et de leur contig Enfin pour valoriser l outil EST db une tape de documentation est indispensable pour sa d claration l Agence de Protection des Logiciels et sa distribution plusieurs partenaires souhaiteraient l installer et l utiliser sur leur plate forme L objectif de ce projet SPIRALE est de r aliser ces diff rentes op rations afin d obtenir un outil EST db convivial g
21. s Langages de programmation Perl bioPerl Python XHTML CSS JavaScript e Le logiciel libre Umbrello Linux est utilis pour la mod lisation UML e L diteur de texte Emacs sous Linux est utilis pour l criture des scripts e L acc s a la base de donn es se fait via terminal ou via l interface phpMyAdmin Documentation du code Tous les scripts sont soigneusement comment s Pour la documentation du code la syntaxe standard propre a chaque langage est utilis e Ainsi pour les scripts Perl les commentaires ponctuels sont introduits par Commentaire Description d une fonction en Perl begin Name Actions Parameters Returns end Documentation du code JavaScript les commentaires sont inclus dans Commentaire Pour un script module ent te du fichier comportera sa description g n rale FRERE HHH HHH GENERAL INFORMATIONS HHH HHH HH Name of the script HHH HHH HHH Formulaire de demande SPIRALES 2008 page 22 32 spirales ird fr Programming language Hitt Authors Hitt Location Hitt Updated Hitt Script role Hitt Hitt LINK WITH Hitt Hitt FREE HEEE EEE HEHEHE HEHEHE HE HE HE HE HE EEE EEE EE HHH HELP bioinfo mopl ird fr FEE EEE EEE EEE EEE HEHE HE HE HE EEE EEE EEE EE En vue de la d claration de l application a l APL tous les commentaires seront traduits en anglais 53 Lister le mat riel et les logicie
22. tous les autres livrables seront traduits Si vous ne traduisez par votre outil dans toutes les langues parl es par vos utilisateurs comment cela affectera t il l adoption de votre outil Fran ais Anglais 75 Quelles m thodes ou technologies seront utilis es pour la traduction de votre outil votre documentation et des autres livrables R daction directement en Anglais et validation apr s relecture par des anglophones Processus et quipe de d veloppement 76 Avez vous d j g r des projets de d veloppement logiciel pr c demment D crire bri vement votre vos exp rience s pass e s Oui Deux autres projets de d veloppement logiciel sont men s actuellement au sein de la plateforme Formulaire de demande SPIRALES 2008 page 26 32 spirales ird fr bioinformatique e Analyse conception et d veloppement d un portail web d di la g nomique du caf ier au sein de la g nopole de Montpellier dans le cadre du r seau International Coffee Genome Network ICGN support SPIRALES 2006 2007 e InterProtDB un syst me d information d di la gestion et l int gration de donn es prot omiques produites haut d bit SPIRALES d but en 2007 77 Les d veloppements seront ils r alis s par des membres de votre quipe par un prestataire sous contrat ou autre Prestataire de service 78 Si vous avez d j s lectionn des d veloppeurs de votre quipe ou d
23. un prestataire lister les sp cifier leurs r les et d crire leurs comp tences et leurs exp riences pass es Attacher leurs CV si vous les avez Advanced Solutions Accelerator Castelnau le Lez porrait effectuer le travail A confirmer si le projet est accept 79 Si vous envisagez un prestataire de service avez vous d j travaill avec un prestataire auparavant D crire comment vous vous assurerez qu il d veloppe ce que vous recherchez dans les temps et avec le budget pr vu Oui un projet Spirale ant rieur a t r alis avec ASA Cf point 76 Assurance pour le d veloppement du projet Cahier des charge d taill R unions bilan bimensuelles avec les utilisateurs et la responsable du projet bioinformatique C Dubreuil Tranchant ou rempla ant Suivi r gulier de l animateur scientifique V Hocher R daction de compte rendu Test par les utilisateurs 80 Impliquerez vous vos utilisateurs cibles dans le processus de conception et d impl mentation de l outil Si oui d crire comment Un groupe de travail impliquant les diff rents scientifiques demandeurs a t cr et se r uni au moins une fois mois avec la soci t prestataire de service Des r union ponctuelles sont par ailleurs organis en cas de n cessit pour d cid d une orientation a prendre A l issue de la conception des nouveaux modules les utilisateurs auront une d monstration ainsi qu une p
24. 0 s quences pour C glauca et 25 000 pour l aulne Alnus glutinosa dont le traitement bioinformatique sera r alis l IRD Une analyse comparative des s quences produites devrait permettre l identification in silico de g nes communs aux esp ces actinorhiziennes activ s lors de la mise en place de la symbiose Par ailleurs des tudes phylog n tiques r centes sugg rent une origine commune pour les diff rents types de symbioses fixatrices d azote La comparaison des s quences obtenues celles disponibles pour les l gumineuses devrait permettre de d gager des m canismes mol culaires communs aux deux types de symbioses et ainsi de mieux comprendre les facteurs impliqu s dans la mise en place des nodules racinaires fixateurs d azote Ce projet permettra la mise en place d un r seau international qui contribuera au d veloppement des ressources g nomiques des plantes actinorhiziennes La r alisation de ce programme de recherche est conditionn par l utilisation de la plateforme bio informatique IRD qui n cessite 1 des optimisations pour permettre nos partenaires un acc s aux donn es g nomiques et 2 l ajout de nouvelles fonctions pour la r alisation des analyses de g nomique comparative Programme 2 Aeschynomene Equipe Ecologie et Physiologie Mol culaire des Bradyrhizobium Photosynth tiques IRD UMR LSTM Formulaire de demande SPIRALES 2008 page 10 32 spirales ird fr Le programme de recherche d velopp
25. 5 17 doit tre renseign e quelque soit la nature de la proposition nouveau projet ou continuum d un projet SPIRALES existant tude de faisabilit projet finalis de d veloppement d une application IS ou autre 5 Unit O UMR OUR OUS N 188 Nom DIA PC 6 D partement ODME DRV ODss 7 Nom du porteur de projet Christine Dubreuil Tranchant et Val rie Hocher 8 Statut et coordonn es du porteur de projet Christine DUBREUIL IE IRD 0467416334 0467416222 christine tranchant mpl ird fr TRANCHANT Montpellier Val rie HOCHER CR1 IRD 0467416196 0467416222 hocher mpl ird fr Montpellier 9 Nom et coordonn es du Directeur d Unit si diff rent Serge HAMON DR1 IRD 0467416194 0467416222 hamon mpl ird fr Montpellier Formulaire de demande SPIRALES 2008 page 3 32 spirales ird fr 10 Aval du directeur d unit obligatoire Le travail effectu au niveau du projet EST dbde part son aspect collaboratif et les modules d j op rationnels constitue d j en soi un ensemble remarquable Il a permis 4 Unit s de Recherche de se f d rer autour d une approche DSI Spirale pour concevoir et d velopper un produit tout fait original Il reste cependant quelques petits am nagements terminer en particulier au niveau du fonctionnement automatiser et des visuels I s agit maintenant d aller jusqu au bout de l initiative et de finaliser l application via une documentati
26. Chez Medicago truncatula nous projetons de densifier l analyse du polymorphisme de s quence le long d un bras chromosomique chromosome 5 afin d acc der des mesures de d s quilibre de liaison Le s quen age des r gions riches en g nes de ce chromosome est en cours CNS Evry et les donn es partiellement disponibles Dans ce contexte nous allons tre amen s d finir des fragments g nomiques balisant le chromosome 5 et des amorces permettant l amplification sp cifique de ces fragments Pour d finir ces amorces 400 fragments pr vus il serait int ressant de pouvoir mettre en place un outils bioinformatique de routine permettant une recherche automatis e et syst matique de fragments g nomiques v rifiant certains crit res comme par exemple l absence de zones r p t es l unicit au sein du g nome de la r gion consid r e et la recherche dans les bases de donn es EST d homologie de s quences avec des g nes connus chez d autres L gumineuses d int r t Pois Soja Haricot Lotier Programme 5 Caf cotonnier Equipe R sistances IRD UMR 186 RPB Nos objectifs sont d identifier et de comprendre les m canismes cellulaires mol culaires et g n tiques mis en jeu dans la r sistance des plantes aux parasites Plus pr cis ment nos recherches se focalisent d une part sur l identification et la caract risation fonctionnelle de g nes impliqu s dans la r sistance et l activation des r a
27. KOCHKO A DUSSERT S 2007 Development of solid phase extraction and methylation procedures to analyse free fatty acids in lipid rich seeds Plant Physiol Biochem 45 3 4 250 257 Lecouls A C Petitot A S and Fernandez D 2006 Early expressed genes in the coffee resistance response to root knot nematodes Meloidogyne sp infection Proceedings of the 21st International Conference on Coffee Science ASIC Montpellier Lucas M Godin C Jay Allemand C and Laplaze L Auxin fluxes in the root apex co regulate gravitropism and lateral root initiation J Exp Bot 2007 In press MAHESH V ULLMANN P NOIROT M HAMON S de KOCHKO A WERCK REICHHART D CAMPA C 2007 CYP98A C1 and CYP98A C2 encode p coumaroyl 3 hydroxylases mediating chlorogenic acid biosynthesis in coffee trees Plant Mol Biol 64 145 159 Formulaire de demande SPIRALES 2008 page 14 32 spirales ird fr Morcillo F Gallard A Pillot M Jouannic S Aberlenc Bertossi F Collin M Verdeil JL Tregear JW 2007 EgAP2 1 an AINTEGUMENTA like AIL gene expressed in meristematic and proliferating tissues of embryos in oil palm Planta 226 6 1353 62 N DIAYE A M NOIROT S HAMON AND V PONCET 2007 Genetic basis of species differentiation between Coffea liberica and C canephora analysis of an interspecific cross Genetic Resources Crop Evolution 54 1011 1021 Obertello M Wall L Laplaze L Nicole M
28. Le choix initial est d utiliser des logiciels gratuits facilement accessibles et d j bien test s pour leur robustesse afin de pouvoir diffuser l outil EST db le plus facilement et largement possible 55 Justifier le choix de ces technologies conformit des r f rentiels robustesse p rennit communaut de d veloppeur importante Formulaire de demande SPIRALES 2008 page 23 32 spirales ird fr Robustesse gratuit des logiciels utilis s pour le pipeline logiciels tr s utilis s Perl e Langage de r f rence en bioinformatique e Langage sp cialis dans l extraction de donn es lecture de DB e Perl poss de un communaut importante de developpeurs e Biblioth que BioPerl et goPerl disponibles sur Internet Donn es en entr e et en sortie 56 num rer et d crire les donn es en entr e et en sortie de votre outil Entr e Chromatogramme de s quen age ou s quences en format FASTA Sortie liste de s quences annot es et r f renc es recherch es par mots clefs ou par blast pages HTML possibilit d exporter des s quences sous format fasta 57 D crire la disponibilit ou l accessibilit le format de stockage et d organisation ainsi que la qualit des donn es utilis es en entr e Quel est le co t et l effort requis de l utilisateur pour collecter acheter obtenir ou convertir ces donn es Dans quelles mesures le co t et l effort requis limiteront ils
29. ae ordre Arecales est une monocotyl done p renne cultiv e en zone inter tropicale qui constitue depuis 2004 la premi re source d huile v g tale dans le monde De par sa grande productivit cette plante est un enjeu cl pour le d veloppement de lagriculture durable dans de Formulaire de demande SPIRALES 2008 page 12 32 spirales ird fr nombreux pays tropicaux mais galement dans lapprovisionnement de biocarburants sources d nergies renouvelables au niveau mondial L quipe Ar cac es s int resse a diff rents aspects de la biologie du d veloppement de cette plante dont des connaissances approfondies sont n cessaires pour pouvoir mettre a la disposition des planteurs un mat riel v g tal performant Plus particuli rement nous nous int ressons la floraison d termination de la structure florale anomalies hom otiques de type pig n tique la fructification et la formation de embryon embryogen ses zygotique et somatique Afin d tudier les processus de r gulation sous jacents ces diff rents aspects du d veloppement reproducteur nous poursuivons depuis plusieurs ann es une approche de type transcriptomique Ceci implique la constitution d une collection d tiquettes de s quence d ADNc EST et leur utilisation pour effectuer des analyses d expression diff rentielle haut d bit exp riences de type macroarray microarray A heure actuelle la collection non redondante de s quences EST s l ve
30. alyse des besoins Copie 2007 Depuis quelques ann es les diff rentes quipes IRD du domaine v g tal d veloppent plusieurs projets de g nomiques Chaque projet a g n r une masse importante d informations qui tait impossible d analyser et d exploiter sans l aide de la bio informatique D s 2001 ces quipes IRD Plante appartenant diff rentes UMRs ont d cid de d velopper une application commune afin d une part de mettre en place une cha ne de traitement permettant d analyser les ESTs et d autre part de cr er une base de donn es et le site web associ destin s a g rer mutualiser mieux exploiter les informations g n r es par la cha ne de traitement L application EST db a t d velopp e au cours de 5 stages de master Informatique Pour les Sciences de l Universit de Montpellier Elle est install sur la plate forme bio informatique IRD d di a la g nomique v g tale et est utilis e par les 4 UMRs du domaine v g tal bas es sur le centre IRD de Montpellier ainsi que par des partenaires et IRDiens expatri s ex Projet H v a Tha lande Projet Caf lle de la R union Le pipeline a aussi t utilis pour analyser des donn es d autres UMRs telles que des ESTs issues de la souris A l heure actuelle plus de 100000 ESTs ont t g n r es analys es Ce volume de donn es ne cesse d augmenter et de nouvelles analyses sont demand es par les chercheurs Il s av re donc n cessaire de
31. ar bacteriophytochrome acquired by lateral gene transfer J Biol Chem 282 7320 8 Co senior authors Jouannic S Collin M Vidal B Verdeil JL Tregear JW 2007 A class KNOX gene from the palm species Elaeis guineensis Arecaceae is associated with meristem function and a distinct mode of leaf dissection New Phytologist 174 551 568 Jouannic S Argout X Lechauve F Fizames C Borgel A Morcillo F Aberlenc Bertossi F Duval Y and Tregear J 2005 Analysis of expressed sequence tags from oil palm Elaeis guineensis FEBS Letters 579 2709 2714 Kojadinovic M Laugraud A Vuillet L Fardoux J Hannibal L Adriano J M Bouyer P Giraud E Vermeglio A 2007 Dual role for a bacteriophytochrome in the bioenergetic control of rhodopsdeudomonas palustris enhancement of photosystem synthesis and limitation of respiration BBA Section BBA Bioenergetics accept Konan KE Durand Gasselin T Kouadio YJ Niamk AC Dumet D Duval Y Rival A amp Engelmann F 2007 Field development of oil palms El is guineensis Jacq originating from cryopreserved Stabilized Polyembryonic Cultures SPCs Cryo Letters 28 5 377 386 Kongsawadworakul P Sookmark U Nandris D and H Chrestin 2005 Cyanide metabolism and molecular approach of rubber trunk phloem necrosis Present and prospects oral communication In Proc Int Hevea workshop on tapping panel dryness Kerala India November 2005 LAFARGUE A de
32. aut et bas potentiel de production soumis ou non stress abiotiques anthropiques ou environnementaux conduisant une surproduction transitoire agents stimulants ou au contraire la cessation d finitive de la production du latex syndrome des encoches s ches ou de la n crose du phlo me L tude est bas e sur la construction et l analyse de banques soustraites SSH d ADNc de latex ou d corce interne des diff rents ph notypes tudi s Six banques SSH ont d j t construites en 2005 puis fin 2006 desquelles en tout environ 7 000 EST ont t s quenc s Quatre nouvelles banques SSH seront labor es en 2007 avec un s quen age pr vu d environ 4600 nouvelles EST D autres programmes de s quen age partir de nos banques d ADNc pleine longueur sont pr vus dans un futur proche L analyse bioinformatique des ces banques d EST au moyen du pipeline EST DB de l IRD Montpellier permettra le tri d unig nes et l laboration dans un premier temps de filtres macroarray puis a terme de microarrays Ces futurs outils serviront au diagnostic pour l optimisation de l exploitation en plantation et pour la s lection pr coce de nouveaux clones performants dans le cadre des programmes d am lioration de l h v a mis en uvre au sein des instituts sp cialis s des diff rents pays de la zone tropical humide producteurs de caoutchouc naturel Ce programme n cessite l utilisation de gros moyens d
33. autres fonctionnalit s r pondant des crit res propres au laboratoire Les donn es brutes et les donn es g n r es sont ensuite stock es dans une base de donn es MySQL A l issue du s quen age la s quence d ADN est repr sent e par un chromatogramme qui va tre analys par le pipeline Le logiciel de base calling utilis est Phred qui va permettre d obtenir les s quences nucl iques des ESTs Puis les r sultats de Phred sont trait s les bases de mauvaises qualit s sont masqu es et les s quences de mauvaise qualit sont limin es Les s quences appartenant au vecteur sont ensuite d tect es l aide du logiciel Vecscreen puis elles sont masqu es et supprim es Les s quences de petite taille sont limin es Chaque s quence d EST repr sente un fragment d un g nome mais certaines d entre elles peuvent tre redondantes ou recouvrantes Le contigage des s quences va permettre de r duire le nombre de s quences annoter d obtenir des s quences plus longues et donc r aliser une annotation plus fiable Ceci est r alis par le logiciel Stackpack A l issue du contigage les ESTs appartiennent ou non un contig L tape suivante est l annotation des s quences qui doit renseigner sur la fonction des prot ines putatives ventuellement associ es Une des m thodes les plus sures pour la d termination des g nes est la comparaison de la s quence analyser avec une banque de s quences Il s agit d une a
34. bilit 1 jour mois Tim TRANBARGER IRD Faible disponibilit 1 jour mois Herv CHRESTIN IRD Fable disponibilit 1 jour mois Fabienne CARTIEAUX IRD Fable disponibilit 1 jour mois Depuis Ao t 2007 C Dubreuil Tranchant est en cong s maternit et est remplac e par Olga PLECHAKOVA jusqu a son retour pr vu en Janvier 3 Moyens appui demand s a la DSI Cette partie questions 18 27 doit tre renseign e quelque soit la nature de la proposition nouveau projet ou continuum d un projet SPIRALES existant tude de faisabilit projet finalis de d veloppement d une application IS ou autre 18 Contribution demand e la DSI pour 2008 en euros HT et TTC Montant 2008 demand 20000 HT soit 23920 TTC pour les projets en France Ventilation par poste Fonctionnement Equipement Prestation de service 24000 euros 19 Demande envisag e pour 2009 si projet de 2 ans en euros HT et TTC 20 Montant s pr c demment attribu s par la DSI en euros HT Oo w 2005 2006 2007 Formulaire de demande SPIRALES 2008 page 5 32 spirales ird fr 21 Moyens affect s au projet et Cofinancements acquis hors SPIRALES HT Autres sources de financements acquis Montant HT Moyens apport s par l unit hors ressources humaines Montant HT 10 000 en 2007 Moyens demand s par l unit pour 2008 Montant HT 10 000 22 Moye
35. bio informatique IRD plante EST DB Analyse conception et d veloppement de nouveaux modules pour l annotation automatique et pour la g nomique comparative 2 R sum du projet propos 5 lignes maximum Le d veloppement croissant de projets g nomiques plante l IRD a conduit les chercheurs des UMRs concern es mutualiser leurs moyens et grouper leurs efforts pour mettre en place une plateforme bioinformatique plante lIRD Resp C Tranchant Dubreuil Depuis 2001 une cha ne ou pipeline d annotation coupl e une base de donn es Application EST db ont t con us pour analyser exploiter et stocker les donn es g nomiques Cet outil est en constante volution et c est dans ce contexte que s inscrit ce projet SPIRALE qui propose une optimisation de l outil existant coupl l ajout de nouvelles fonctions 3 Type de projet O Nouveau projet SPIRALES O Etude de faisabilit Demande d appui pour une analyse fine des besoins et la formulation de sp cifications ventuellement d veloppement d un prototype en vue d une seconde phase destin e au d veloppement et la r alisation du projet Ne renseigner que les parties 1 2 3 5 du pr sent formulaire O Projet finalis de d veloppement d une application IS proposition finalis e et d taill e en mati re d expression des besoins d identification des solutions et des moyens Ne renseigner que les parties 1 2
36. cation EST dbne sont pas impl ment es nous aurons n anmoins un produit utilisable par les quipes de l IRD de Montpellier mais sa diffusion imm diate e g transfert aux quipes sur Noum a ne sera pas possible Pour pallier ce risque un cahier de charges d taill sera r dig d finissant l ordre et la priorit des taches effectuer ainsi que les taches critiques Un suivi tr s rigoureux de l avancement du projet sera mis en place avec des r unions r guli res avec le prestataire afin de faire un bilan et en cas de retard analyser ses causes et corriger ventuellement le planning avec une prise en charge possible d une certaine partie du travail par la responsable de la plateforme bioinformatique si n cessaire 48 Si vous demandez un soutien d un an accepteriez vous de recevoir les cr dits l ann e prochaine plut t que cette ann e 49 Si cette demande concerne la phase 1 d un projet pr vu sur 2 ans pouvez vous r aliser le projet en entier sur une ann e si vous obtenez les cr dits en une seule fois Comment cela Formulaire de demande SPIRALES 2008 page 20 32 spirales ird fr impacterait il votre projet Architecture de l outil 50 D crire l architecture envisag e pour votre outil Identifier les composants cl s de l application et d crire comment ils interagissent un sch ma peut tre appr ciable Le pipeline et la base de donn es EST db Chaque pr
37. ctions de d fense et d autre part sur l exploration de la diversit des m canismes de r sistance associ s a diff rentes interactions plante parasite Nos mod les d tude sont le caf ier Coffea arabica attaqu par le champignon Hemileia vastatrix et les n matodes du genre Meloidogyne le cotonnier Gossypium hirsutum infect par la bact rie Xanthomonas campestris pv malvacearum Les activit s d velopp es font appel a des approches de g nomique fonctionnelle les approches transcriptomiques tant privil gi es Chez le caf ier nous avons d velopp des banques d ADNc soustractives pour tablir un catalogue des g nes exprim s lors des r ponses de r sistance du caf ier aux parasites et plusieurs g nes sp cifiquement exprim s dans la r sistance ont t clon s Cependant environ 35 des ESTs obtenues dans le cadre de l interaction du caf ier M exigua n ont pu tre annot es faute de similarit avec des s quences connues et pourraient repr senter des s quences sp cifiques des interactions plante n matodes D autres banques d ADNc sont en cours de construction avec nos partenaires Br siliens Embrapa associ s a ce projet et n cessiteront l utilisation d outils bioinformatiques automatis s pour l annotation des s quences Chez le cotonnier des approches physiologiques ont permis d identifier plusieurs enzymes essentielles intervenant dans les voies de signalisation de la r sistanc
38. d velopper de nouvelles fonctionnalit s sur l outil EST db Le projet SPIRALE que nous proposons a pour objectifs de finaliser le d veloppement de l application EST db documentation du code code Formulaire de demande SPIRALES 2008 page 15 32 spirales ird fr suffisament param trable pour que l application soit facilement transf rable sur une autre plate forme bio informatique ajout de nouvelles fonctions qui donneront une plus value importante a l application en vue de la d clarer a l Agence de Protection des Logiciels et de la distribuer aux autres URs de l IRD et partenaires interess s par outil 2007 de d velopper deux nouvelles fonctionnalit s a EST dbd di s a l annotaion automatique des s quences et a la r alisation d analyse de g nomique comparative o Le module Annotation Automatique Ce module est un pr requis indispensable toute analyse de g nomique comparative Il s agit de pourvoir classer les s quences ESTs annot es par le logiciel Blast en grande fonction selon la nomenclature Gene Ontology Ce syst me utilis par la communaut scientifique internationale est disponible mais n cessite une adaptation afin de s inclure au pipeline EST db existant o Le module G nomique comparative Ce module permettra aux quipes plantes IRD et partenaires de r aliser des comparaisons entre les g nomes des diverses plantes tudi es et ou avec les g nomes des plantes mod
39. de diff rents organismes 3 Exportation de s quences EST sous format fasta pour des tra tements ult rieurs e g recherche de microsatellites par le SSR pipeline mis en place aussi l IRD de Montpellier design de puces ADN 4 Utilisation en consultation distance par partenaires ou IRD expatri s P Normand Lyon H Chrestin tahilande T Joet La r union En projet transfert EST db sur Tha lande H Chrestin C Tranchant et sur Noum a V Poncet Formulaire de demande SPIRALES 2008 page 18 32 spirales ird fr 40 D crire en un paragraphe les innovations de votre projet pour votre communaut scientifique Les quipes IRD concern es par ce projet utilisent d j en routine l application EST db pour traiter leurs donn es de g nomique Ce projet permettra de r aliser de nouveaux types d analyses indispensables comprendre la biodiversit et rechercher de nouveaux g nes d int r ts chez les plantes tropicales EST db est un outil incontournable pour la r alisation de nos programmes de recherche et pour leur valorisation sous forme de publication Ce projet SPIRALE permettra aussi loptimisation d EST db afin de rendre cette application transf rable et utilisable pour les quipes IRD expatri es et les partenaires ext rieurs 41 Existent ils d autres outils similaires au v tre Si c est le cas lister ces outils et d crire les avantages de votre outil par rapport aux autres Lors de la mise
40. des Casuarinac es Filao Les Casuarinac es peuvent former des nodules racinaires en symbiose avec une bact rie filamenteuse du sol Frankia Les Casuarinac es appartiennent au groupe des plantes actinorhiziennes qui repr sente apr s les L gumineuses le deuxi me groupe de plantes fixatrices d azote Les arbres tropicaux de la famille des Casuarinac es jouent un r le environnemental essentiel notamment pour les pays du Sud Ces plantes poss dent une croissance rapide sont bien adapt es la s cheresse et sont capables de coloniser des sols pauvres En 2002 une tude comparative du transcriptome des racines et des nodules de C glauca a t entreprise dans le cadre du GENOPOLE Montpelli rain et le s quen age de transcrits partir de deux banques d ADNc de Casuarina racine et nodules a permis l obtention d environ 3000 s quences L analyse bio informatique sur la plateforme IRD a permis la validation des s quences et la cr ation de la premi re base de donn es g nomique pour les plantes actinorhiziennes Nous d veloppons actuellement un projet visant comparer plusieurs esp ces de plantes actinorhiziennes ayant des caract ristiques diff rentes en terme de mode d infection et de d veloppement nodulaire L obtention en 2007 d un projet Genoscope en association avec l quipe de P Normand CNRS Universit Lyon 1 va nous permettre le s quen age de 50 000 ESTs partir de deux esp ces actinorhiziennes 25 00
41. du module annotation fonctionnelle GO Ei Phase ce conception EJ Phases de d veloppement et de validation D veloppement et int gration du module analyse g nomique comparative EX Phase de conception E Phases de d veloppement et de validation Un ch ancier initial a t suivi Suite au d part de C Tranchant d but Adut nous avons rencontr quelques difficult s notamment pour des autorisations d acc s Par ailleurs l tude du module Gene Ontology a demand plus de temps que n cessaire afin d ajuster les possibilit s techniques aux demandes des utilisateurs Ces deux v nements ont retard d environ 1 mois l ch ancier initial Nous avons donc modifi cet ch ancier nous avons all g certains livrables et report une partie du travail pour 2008 30 Objectifs atteints OU non encore r alis s et raisons Au 15 11 07 les livrables suivants ont t r alis s La documentation technique a t r dig e en anglais Livrable 1 elle sera finalis e en d cembre 2007 Le module Annotation Gene Ontology a t impl ment Livrable 3 A et B Formulaire de demande SPIRALES 2008 page 8 32 spirales ird fr Le module G nomique Comparative Livrable 4 en cours de conception La phase de d veloppemnt est report e sur 2008 suite aux diff rents retards L am lioration de la version actuelle d EST db Livrable 2 La gestion des mise a jour de clusterisa
42. e lipoxyg nase peroxydase lipase et les g nes correspondants sont en cours d analyse fonctionnelle Les recherches s orientent vers la caract risation de facteurs de transcription de type AP2 impliqu s dans la voie de signalisation d pendante du jasmonate Pour les deux plantes plusieurs milliers d ESTs sont maintenant disponibles dans GenBank mais ne repr sentent pas encore l int gralit du g nome transcrit L apport de la g nomique comparative est donc essentiel a l identification de nouveaux g nes et a la caract risation de leur fonction Ainsi par exemple comme d j pr cis dans le programme 2 lint gration des ressources g nomiques de la famille des Solanaceae proche de celle des Rubiaceae dont fait partie le caf ier permettra sans aucun doute d identifier des orthologues de g nes cl s de la r sistance des plantes aux parasites En particulier un g ne de r sistance aux n matodes a t clon chez la tomate alors qu aucun g ne n est encore connu chez A thaliana faute de r sistance aux n matodes chez cette esp ce mod le Par contre on pourra s appuyer sur les connaissances de la famille AP2 chez A thaliana pour isoler leurs orthologues chez le cotonnier Les ressources bioinformatiques qui seront d velopp es l IRD faciliteront ces recherches et l annotation des nouvelles s quences Programme 6 Palmier a Huile Equipe Ar cac es IRD UR 192 Palmiers Le palmier a huile famille Arecace
43. e calcul et de fortes comp tences en mati re de bioinformatique et statistique Dans le cadre de ce programme de recherche formation sur lh v a deux chercheurs Thais l un de l Universit de Mahidol et l autre de l Institut BIOTEC Bangkok suivent une formation 2006 2008 en Mast re de Bioinformatique l UM2 avec stage pratique l IRD montpellier sous la responsabilit de Christine Tranchant Outre l aide qu il procurera au programme de recherche Hevea ce programme de formation cofinanc par le MAE et le Minist re des Universit s Tha landais a pour but terme d initier un r seau d agro bioinformatique Tha landais en coop ration avec l quipe de bio informatique GeneTrop de l IRD Montpellier A cet effet la plateforme bio informatique est d ores et d j accessible par nos partenaires tha landais via le web notamment l application EST db D Liste des publications Les publications soulign es sont celles ayant un rapport direct avec EST db Adam H Jouannic S Morcillo F Verdeil JL Duval Y Tregear JW 2007 Determination of flower structure in Elaeis Guineensis do palms use the same homeotic genes as other species Annals of Botany 100 1 12 Adam H Jouannic S Orieux Y Morcillo F Richaud F Duval Y Tregear JW 2007 Functional characterization of MADS box genes involved in the determination of oil palm flower structure J Ex Bot 1 15 BUSTAMANTE PORRAS J CAMPA C PONCET V NOIROT M
44. e polymorphisme de Formulaire de demande SPIRALES 2008 page 11 32 spirales ird fr s quence Dans les deux cas l analyse du polymorphisme de s quence concerne deux chelles taxonomiques l chelle intra sp cifique et l chelle inter sp cifique et plusieurs dizaines de fragments g nomiques D s l acquisition des premi res donn es sur les Tritic es une interface WEB permettant le stockage et l organisation des donn es de s quence a t mise en place travers l encadrement de stages d Informatique base de donn es Tritipol Cette interface a aujourd hui t clon e pour les donn es de s quence du projet Medicago base de donn es Eagle un troisi me clonage est en cours pour accueillir des donn es de s quence obtenue chez la Vigne Vitis vinifera et formes sauvages apparent es dans le cadre d un projet similaire aux deux projets ci dessus Ces bases de donn es ont t con ues pour permettre aux diff rents partenaires des projets de r cup rer les s quences et l ensemble des informations relatives l origine de la donn e extraction d ADN protocole d amplification informations sur les amorces Nos premi res analyses de donn es montrent aujourd hui que ces interfaces pourraient tre largement am lior es a travers l ajout d une interface permettant le calcul de diff rentes statistiques r sumant le polymorphisme et la mise en place de liens avec d autres bases de donn es
45. edings of the 21st International Conference on Coffee Science ASIC Montpellier Fernandez D Santos P Agostini C Bon M C Petitot A S Silva M C Guerra Guimar es L Ribeiro A Argout X and Nicole M 2004 Coffee Coffea arabica L genes early expressed during infection by the rust fungus Hemileia vastatrix Molecular Plant Pathology 5 527 536 Ganesh D Petitot A S Silva M Alary R Lecouls A C and Fernandez D 2006 Monitoring of the early molecular resistance responses of coffee Coffea arabica L to the rust fungus Hemileia vastatrix using real time quantitative RT PCR Plant Science 170 1045 1051 Giraud E Moulin L D Vallenet V Barbe E Cytryn J C Avarre M Jaubert D Simon F Cartieaux Y Prin G Bena L Hannibal J Fardoux M Kojadinovic L Vuillet A Lajus S Cruveiller Z Rouy S Mangenot B Segurens C Dossat W L Franck W S Chang E Saunders D Bruce P Richardson P Normand B Dreyfus D Pignol G Stacey D Emerich A Vermeglio C Medigue And M Sadowsky 2007 Legumes Symbioses Absence of Nod Genes in Photosynthetic Bradyrhizobia Science 316 1307 1312 Hocher V Auguy F Argout X Laplaze L Franche C and Bogusz D Expressed sequence tag analysis in Casuarina glauca actinorhizal nodule and root New Phytologist 2006 169 681 688 Jaubert M Lavergne L Fardoux J Hannibal L Vuillet L Adriano J M Bouyer P Pignol D Giraud E Verm glio A 2007 A singul
46. emaines d but mars 2008 gt Am lioration de l interface de lancement du pipeline d analyse d ESTs lancement du pipeline a partir des s quences format fasta et pas uniquement des chromatogrammes 3 semaines fin mars Formulaire de demande SPIRALES 2008 page 19 32 spirales ird fr 2008 gt Am liorations du pipeline 3 semaines fin avril 2008 Possibilit de lancer plusieurs pipelines en parall le Sauvegarde dans la base de donn es EST db des param tres de lancement du pipeline qui sont indiqu s dans l interface de lancement de pipeline pour un projet d ESTs gt Am lioration de la structure de la base de donn es EST db 2 semaines d but mai 3 semaines fin mai 2008 gfy 2008 Ajout d attributs dans la base de donn es Traduction en anglais les noms des tables et des attributs qu elles contiennent en vue d une diffusion large gt Am lioration des interfaces de consultation 3 semaines fin mai 2008 Modification de la page All statistics affichage des param tres de lancement du pipeline affichage du nombre de s quences class es dans chaque cat gorie GO lien vers les s quences no hit Affichage du nombre d EST contig et du pourcentage de singletons banque Modification de la page Search by keyword recherche par mots cl sur les blast et sur les terme GO Cr ation d une page export ontology Exporter toute l ontologie avec le nombre d ESTs et le nom des
47. emande d appui de l quipe Informatique scientifique de la DSI pour le d veloppement et ou la r alisation du projet avec estimation du temps homme n cessaire La DSI suite au comit d valuation pourra pour quelques projets et sur quelques sites Noum a Dakar Montpellier et dans la limite des moyens humains de la DSI disponibles convertir ces demandes d appui ou de financement de prestataire de service en temps homme c est dire par une intervention directe du pool informatique scientifique 25 Demande d un d p t Subversion SVN Description des besoins pour ce projet SPIRALES une demande formelle et d taill e avec signature de la charte sera n anmoins n cessaire dans un 2nd temps D finition SVN http fr wikipedia org wiki Subversion_ logiciel 26 Demande d h bergement s l d acc s un des serveur s 1 de d veloppement et de tests pour la dur e du projet 2 de pr production et de recette pendant ou l issue du projet 3 d exploitation l issue du projet Description des besoins pour ce projet SPIRALES technologies capacit une demande formelle et d taill e avec Formulaire de demande SPIRALES 2008 page 6 32 spirales ird fr signature de la charte sera n anmoins n cessaire dans un 2nd temps L application sera h berg e sur le serveur de production de la plate forme bio informatique de Montpellier 27 Appui de
48. induire l organog n se nodulaire chez Aeschynomene Giraud et al Science 2007 La dispense de facteurs Nod pour l tablissement du couple symbiotique Aeschynomene Bradyrhizobium soul ve de nombreuses questions quelles sont la ou les mol cules signal induisant l organog n se nodulaire Peut on faire un parall le entre les m canismes mol culaires utilis s par les bradyrhizobia photosynth tiques et ceux mis en uvre par d autres organismes symbiotiques tels que Frankia qui induit la nodulation chez des non l gumineuses Pour r pondre cette derni re question nous recherchons dans cette interaction originale la pr sence d l ments connus r cepteurs facteurs de r gulations de voies de signalisation d crites dans le cas de la symbiose fixatrice d azote mais nous souhaitons galement d velopper une approche sans a priori pour l identification d acteurs mol culaires originaux Dans cette optique nous avons obtenu le soutien du G noscope pour le s quen age de 56 000 ESTs partir de deux esp ces d Aeschynomene dont le traitement bioinformatique sera r alis l IRD Ces deux esp ces d Aeschynomene appartiennent deux groupes d inoculation crois e distincts et correspondent deux processus d infection l un d pendant des facteurs Nod l autre ind pendant des facteurs Nod L analyse comparative des s quences produites partir de ces deux esp ces devrait donc permettre de mettre en exergue
49. informatique http www mpl ird fr bioinfo de la nouvelle version d EST db bd Diffusion de la m thodologie cahier des charges aux partenaires et au sein de l IRD du code des nouveaux modules Annotation en grande fonction et G nomique comparative analyses r alis es par toutes UR d veloppant des projets de g nomique domaine animal ou v g tal Analyse des donn es biologiques plantes disponibles et publications des r sultats des analyses dans les revues ad quates par les chercheurs 106 Observations particuli res Remarque 1 La somme demand e pour 2008 20000 HT est sup rieure celle que nous avions estim e en 2007 En effet compte tenu du cahier des charges initial du temps n cessaire pour d velopper les outils temps que nous avions sous estim en 2007 nous avons r estim le co t et d cid de faire une demande correspondant l obtention du produit fini transf rable Par ailleurs il est important de remarquer que les UMRS concern es par ce projet ont apport 10000 euros en 2007 et apporteront une somme identique si les budgets 2008 sont valid s Enfin un recrutement bioinformatique a t demand pour renforcer le personnel Formulaire de demande SPIRALES 2008 page 31 32 spirales ird fr de la plateforme L ensemble de cette dynamique montre l importance de cette plateforme pour les UMRs plantes et la n cessit de disposer de cet outil et de pouvoir le transf rer aupr s de
50. initial Elles sont surlign es en gris A Situation g n rale du projet Copie de 2007 Depuis plusieurs ann es les quipes plantes IRD appartenant diff rentes UMRs URs d veloppent des projets de g nomique concernant des plantes tropicales d int r ts majeurs pour les pays du SUD Coffea Hevea Ar cac es Casuarinac es et s articulent essentiellement autour de 2 plantes mod les enti rement s quenc es Arabidopsis thaliana et Oryza sativa La production en masse de donn es g nomiques et prot omiques et la n cessit de leur analyse a conduit la mise en place d une plateforme bioinformatique plante IRD Resp C Tranchant Dubreuil Une cha ne ou pipeline d annotation d ESTs utilisant diff rents logiciels bio informatiques gratuits Blast Stackpack conjugu s des algorithmes puissants est maintenant disponible Les donn es brutes plac es en entr e du pipeline ainsi que les donn es produites par le pipeline sont stock es dans une base de donn es EST db ce qui permet de g rer et d exploiter les donn es produites sur les diff rentes plantes tropicales Diff rentes quipes ont d j valoriser l utilisation du pipeline au travers de publications scientifiques Voir Paragraphe Liste des Publications Plusieurs quipes IRD plante se sont maintenant engag es dans des projets de g nomique comparative et la r alisation de ces programmes n cessite le d veloppement d une nouvelle cha
51. ion qui illustrent les d tails de ces communications Le pipeline d analyse d EST fait appel plusieurs autres outils bioinformatiques cit s ci dessus Phred VecScreen Matcher Blast d une mani re ordonnanc e 67 Si votre outil int grera ou fera appel des outils d autres d veloppeurs d crire bri vement 3 sc narios d utilisation Rapports d erreurs et d avancement 68 De quelle mani re votre outil montrera la progression du traitement aux utilisateurs Qu est ce qui sera signal Un email est envoy au d part du traitement l utilisateur puis un autre une fois le traitement termin Entre temps rien ne permet l utilisateur de savoir o en est l analyse Formulaire de demande SPIRALES 2008 page 25 32 spirales ird fr 69 Comment votre outil notifiera t il a l utilisateur l apparition d une erreur et quelles informations seront affich es dans le message d erreur Les principales erreurs qui sont notifi es l utilisateur sont des erreurs pouvant appara tre au d but de l analyse cr ation des r pertoires temporaires et pour une analyse d EST classique r cup ration des chormatos Si des probl mes sont rencontr s durant cette phase un email sera envoy l utilisateur pour lui dire la les erreur s exemple Le repertoire X n a pas pu tre cr e Probl me de copie des chromatos Pour faciliter l intervention les erreurs sont num rot es pour po
52. ire les fondements et lister les r f rences les plus pertinentes Le projet est bas sur 2 principes Ajout de nouvelles focntionnalit s Gene Ontology et G nomqiue Comparative afin d avoir un outils de traitement des ESTs complets Ces modules sont n cessaire pour r pondre aux xigences des publications internationales Finalisation de la documentation technique d EST dbafin de rendre transf rable au sein et hors de l IRD de fa on gratuite Ce point est essentiel dans le contexte IRD puisque diff rents partenaires du Sud sont demandeurs Calendrier budget et risques 44 Calendrier du projet montrant les t ches cl s et les dates d ch ances Les dates d ch ance sont donn es titre indicatif car cela d pendra d une part de l acceptation du projet et de la mise disponibilit des cr dits A R alisation des actions pr vues en 2007 et report es sur 2008 1 mois fin janvier 2008 gt Finalisation du d veloppement d EST db documentation technique a mettre jour apr s les derni res modifications gt Am lioration d EST db lancement du blast 2 fois an gt G nomique comparative Phase de d veloppement B R alisation des actions 2008 gt Am lioration du module Project _ GO annotation 3 semaines fin f vrier 2008 Annotation des contigs gt Am liorer la version actuelle de l application EST db ajout de pages d aide et ou d un manuel utilisateur 2 s
53. isateurs cibles L analyse des donn es issue du s quen age est un r sultat publiable en soi Des publications d j r alis e le montrent Dans un deuxi me temps la validation des r sultats obtenu in silico est n cessaire par des techniques biologiques Biologie mol culaire Par ailleurs la possibilit d avoir en sortie les s quences sous format fasta est tr s utile car elle offre les possibilit s de les traiter ult rieurement sans effort particulier alignements contre des banques personnels d autres pipelines comme le SSR pipeline de recherche de microsatellites etc 61 Existent ils des m tadonn es ou y a t il production de m tadonn es d crivant les lots de donn es en entr e ou sortie Si oui comment sont elles g r es et entrepos es Sont elles Formulaire de demande SPIRALES 2008 page 24 32 spirales ird fr bas es sur des standards Le pipeline utilise plusieurs bases de donn es standardis es disponibles sur Internet ncbi ebi gene ontology Ces donn es seront mises jour plusieurs fois dans l ann es et sont directement stock es sur le serveur 62 La description ou le r f rencement des donn es est il sera t il bas sur un ou des r f rentiels ou th saurus Si oui lesquels Le module annotation Gene Ontology est bas sur l utilisation des standards d ontologie biologique OBO L annotation est bas e sur la mise en rapport de diff re
54. l adoption de votre outil Les donn es de d part sont issues d un s quen age et n cessite donc un budget sp cifique pour cela C ut indicatif 30500 euros 10000 s quences en utilisant les ressources de la genop le Languedoc Roussillon qui pratique des tarifs plus bas que les soci t s priv es Certains des projets pr sent s ont financ leurs s quen age d autres ont pu obtenir des projet type Genoscope qui leur permis d obtenir leur s quence sans apporter un financement particulier Les prix sont de plus en plus accessibles et les projets sont de plus en plus nombreux Notre outil sera vraisemblablement de plus en plus sollicit 58 Les donn es seront elles test es ou valid es par l outil en entr e Si oui comment Les fichiers bruts de chromatogrammes ab1 ou scf sont analys es en entr e du pipeline tout d abord par le logiciel Phred si le format du fichier extension chimie etc n est pas celui reconnu par Phred ce fichier sera ignor par le pipeline 59 Validerez vous ou avez vous d j valid scientifiquement les donn es en sortie de votre outil Si oui d crire comment cela se fera ou a t fait Oui Cf Liste des publications 60 D crire l utilit imm diate des donn es en sortie de votre outil et les n cessaires conversions post traitements ou analyses ult rieures requis Comment l effort requis impactera t il l adoption de votre outil par les util
55. les Dans ce projet nous nous int ressons la comparaison de s quences et l identification de s quences orthologues intra et inter familles Dans ce but l annotation homog ne et coh rente des diff rentes banques permettra des recherches simplifi es de nouvelles s quences et constituera un syst me de r f rence Les travaux en g nomique comparative via la cartographie compar e macro synt nie entrepris dans notre quipe pourront tre affin s partir de l analyse de s quences de BAC micro synt nie Programme 4 Tritic es et Medicago Equipe Diversit INRA UMR DIA PC Les travaux de notre quipe ont pour objet l analyse de la diversit des plantes cultiv es et des formes sauvages apparent es et la compr hension des m canismes volutifs qui expliquent les patrons de diversit observ s Dans ce contexte nous avons engag depuis quelques ann es l analyse du polymorphisme de s quence pr sent au sein de deux groupes taxonomiques importants pour l am lioration des plantes la sous famille des tritic es qui contient les formes cultiv es de bl et leurs esp ces prog nitrices et le genre Medicago qui contient la principale esp ce mod le pour les l gumineuses M truncatula ainsi que la luzerne cultiv e Ces travaux s inscrivent dans le cadre de l analyse i de l impact du processus de domestication sur la diversit des plantes cultiv es et ii de la recherche de trace d effets s lectifs dans l
56. lgorithme est que sa conception est bas e sur un mod le statistique Celui ci a t tabli d apr s les m thodes statistiques de Karlin et Altschul 1990 1993 qui s appliquent aux comparaisons de s quences sans insertion d l tion L unit fondamentale de BLAST est le HSP High scoring Segment Pair Un HSP correspond a une r gion de similitude la plus longue possible entre deux s quences ayant un Formulaire de demande SPIRALES 2008 page 17 32 spirales ird fr score sup rieur ou gal a un score seuil Un deuxi me score MSP Maximal scoring Segment Pair a t d fini comme tant le meilleur score obtenu parmi tous les couples possibles que peuvent produire deux s quences Les m thodes statistiques de Karlin et Altschul sont appliqu es pour d terminer la signification biologique des MSPs et par extrapolation la signification des scores HSPs obtenus lors de la comparaison http www ncbi nim nih gov Tools C Comp tences La plate forme bio informatique est administr e par le SIL de Montpellier et le service bio informatique Ce service se compose d un ing nieur d tude en bio informatique et de personnels contractuels stages vacation CDD 36 Difficult s rencontr es jusqu a pr sent 6 Description du projet SEULEMENT SI d veloppement d application IS m thodes solutions et moyens Cette partie question 37 a 96 concerne les nouveaux projets finalis s de d veloppement d applicati
57. ls requis pour faire fonctionner votre outil Mat riel Tout d veloppement sera r alis sur la plate forme bio informatique d di a la g nomique v g tale dont l infrastructure est la suivante HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH HHH e 2 serveurs de calcul de production DelITM PowerEdgeTM 6650 4 processeurs Xeon 2 7 Ghz amp 8 Go de RAM e 1 serveur de d veloppement Un syst me de stockage RAID Dell EMC 1 To de stockage Un serveur de fichier La configuration optimale du serveur permettant e g son installation Noum a sera d finie avec le SIL apr s la finalisation de l application Outils et bases de donn es sur le serveur e Blastall program version 2 2 10 e Gene ontology files component ontology function ontology process ontology gene _ontology_edit obo e Gene association files for gene ontology annotation uniprot_sprot dat gene _association Compugen_GenBank go show paths to root pl Matcher program Phred program version 0 020425 c StackPack program version 2 2 0 Sequences databases for blast runs nr nt and swissprot Vecscreen program Genbank Swiss Prot TIGR Rice Database Sur les postes des clients e Un navigateur Web e g Mozilla firefox ou IE e Un tableur pour charger les reports Excel Excel ou Calc de Open Office 54 Comment ces choix influeront sur l appropriation de votre outil par les utilisateurs cibles
58. nos partenaires et plus largement si n cessaire Remarque 2 C Dubreuil Tranchant tant en cong maternit nous avons r dig ce compte rendu et ce projet sans elle Certains d tails n ont donc pu tre renseign s mais d s son retour elle pourra fournir toutes les informations suppl mentaires si n cessaire Formulaire de demande SPIRALES 2008 page 32 32 spirales ird fr
59. ns humains affect s au projet Total des moyens humains affect s au projet par les unit s et partenaires exprim en total de jours homme ou ETP Equivalent Temps Plein cf d finition et exemple la question 17 Un IE responsable du projet qui assure l encadrement bio informatique C Dubreuil Tranchant ou rempla ant Groupe de travail Animateur V Hocher compos de chercheurs pour l encadrement biologique expression des besoins des chercheurs suivi du projet test des outils mis en place Soit 6 mois quivalent temps plein Prestataire de service 2 personnes pendant 6 mois o 1 chef de projet o 1 d veloppeur 23 Co t total estim du projet toutes ann es confondues Estimation du co t total du projet toutes ann es SPIRALES confondues cr dits SPIRALES moyens fournis par l unit et cofinancements acquis hors ressources humaines 60000 HT 24 Ressources humaines ext rieures mobilis es ou demand es O Comp tences mobilis es ou souhait es profil type BB Intervention d un de prestataire s de service o Mobilisation d un de stagiaire s sous r serve de comp tences fortes en informatique scientifique au sein de l quipe porteur du projet et de capacit s de l quipe d gager du temps pour assurer un r el encadrement BB Demande d appui de l quipe Informatique scientifique de la DSI pour l appui m thodologique et le suivi de projet O D
60. nts fichiers des fichiers faisant lien entre ID nt ou ID nr et ID GO des fichiers ontology et le fichier gene_ontology obo permettant partir d un pool d EST d annoter chaque s quence lorsque cela est possible Interop rabilit 63 Quels sont les ventuels standards ou normes utilis es Les standards W3C en termes de publication Web XHTML CSS L ontologie biologique Gene Ontology 64 Votre outil est il pr vu pour tre utilis de mani re interactive par les utilisateurs par d autres outils ou programmes communication entre outils sur la base de requ tes ou autres ou les deux L outil est utilis dune mani re interactive par les utilisateurs que ce soit les recherches dans la base de donn es ou encore le lancement du pipeline Il ne sera pas utilis par d autres outils automatiquement sauf probablement par le moteur de recherche du portail des ressources g nomiques des caf iers cette int gration sera analys e dans un autre projet Spirales de la plateforme bioinformatique de Montpellier 65 Si votre outil pourra tre utilis dans les 2 cas de mani re interactive et de mani re automatis e par d autres applications d crire les caract ristiques et fonctionnalit s non accessibles pour chaque mode d utilisation Pas encore d fini 66 Si votre outil pourra communiquer de mani re automatis e avec d autres programmes crire bri vement 3 sc narios d utilisat
61. ojet g nomique g n re une masse importante d informations sous la forme d ESTs Avant d aboutir son annotation chaque EST doit subir une s rie de traitements n cessitant l utilisation de diff rents logiciels Compte tenu du volume important d informations et de traitements un pipeline est n cessaire pour automatiser l analyse de chaque EST A l issue du s quen age des ESTs les chromatogrammes g n r s sont analys s afin d obtenir la s quence nucl ique e La s quence ensuite doit tre analys e afin de masquer les bases de mauvaise qualit et celles appartenant au vecteur puis s lectionner uniquement les parties r ellement informatives Afin de supprimer la redondance au niveau des s quences et de d terminer l agencement des s quences une phase de contiguage est n cessaire Puis les s quences sont annot es blast GO L tape finale est de comparer un pool d ESTs avec celui produit sur une autre plante tropicale ou avec les donn es publiques module g nomique comparative Les r sultats de chaque tape de ce traitement sont archiv s dans une base de donn e et l ensemble pipeline base de donn e est consultable et utilisable au travers d une interface Web Structure du pipeline voir le sch ma ci dessous Le pipeline ou la cha ne de traitements est un programme perl qui va permettre de combiner l ex cution de plusieurs logiciels l analyse des r sultats g n r s et de r aliser d
62. on Accelerator Castelnau Le Lez retenue comme prestataire par le groupe de travail Finalisation du cahier des charges et de l ch ancier Juillet 2007 D but de la prestation A noter 1 07 07 15 07 07 15 jours d change entre Vergely et C Dubreuil Tranchant pour expliquer le fonctionnement d EST DB car C Tranchant devait partir en cong maternit et ne pouvait assurer l encadrement d l Vergely ASA apr s le 1 08 07 En documents joints le cahier des charge IRD l tude d ASA et l ch ancier initial B Les diff rentes tapes du projet Livrable 1 Finaliser le d veloppement de l application EST db Documentation du code en anglais Documentation technique infrastructure de l application en anglais Manuel d installation Livrable 2 Am liorer la version actuelle de l application EST db Interface de consultation pour les clusters Gestion des identifiants des contigues lors de la mise jour d un projet de clusterisation Formulaire de demande SPIRALES 2008 page 7 32 spirales ird fr Livrable 3 D veloppement et int gration d un nouveau module d analyse pour l annotation fonctionnelle automatique des s quences avec une base de donn es contenant la nomenclature Gene Ontology GO 3a Conception d finition pr cise du fonctionnement du module Veille technologique des outils existants dans le domaine public o Outils d annotation o Bases de donn e
63. on IS ainsi que les demandes de continuums portant galement le d veloppement d application IS La demande peut tre tre accompagn e de tous documents utiles pr sentation du projet global ou descriptif du projet rapport de phases pr liminaires tude de faisabilit dossier d expression des besoins ou cahier des charges devis d taill 37 Nom de votre outil EST db 38 Si votre outil existe d j quel est l URL du site internet ou des documents qui le d crivent Ou si l outil a t d crit dans un article fournir les r f rences L application est disponible en intranet sur http bioinfo estdb consultation des donn es et lancement du pipeline Elle est galement ouverte pour des partenaires ou IRD expatri s en consultation sur http www mpl ird fr bioinfo site de la plateforme bioinformatique comportant un lien vers EST db acc s soumis l authentification apr s demande d acc s et signature d une charte Cf document joint documentation scientifique Innovation 39 Ecrire 3 sc narios qui illustrent comment votre outil sera ou a t utilis dans votre communaut scientifique ou domaine d activit s 1 Utilisation pour l analyse d EST blast annotation fonctionnelle Gene Ontology De nouveaux projets sont concern s Cf Programme 2 2 Utilisation pour la g nomique comparative et les tudes de phylog nie alignements des g nomes ou de banques EST
64. on technique et un manuel d installation documentation en anglais Enfin il me semble vident que l int gration d un module connect et donc se servant de mod le la r f rence mondiale Gene Ontology constitue un plus ind niable qui donnera ce produit une valeur internationale incontest e Je donne donc un avis tr s favorable pour ce projet Serge HAMON DU UMR188 11 Implantation principale de l unit Centre IRD de Montpellier 12 Site de d roulement du projet Centre IRD de Montpellier 13 Site administratif 4 partir duquel se feront les d penses budg taires Centre IRD de Montpellier 14 Projets inter unit ou inter organismes H Projet inter unit s H Projet inter organismes 15 Liste des unit s ou organismes partenaires du projet UMR DIA PC IRD Montpellier UMR 186 RPB RD Montpellier RDO RDO Ni IRD UR 192 Palmiers IRD Montpellier RDO i RDO 16 Liste des intervenants impliqu s de mani re effective dans la r alisation du projet autant de fois que n cessaire Christine DUBREUIL IE UMR DIA PC IRD Montpellier Chef de projet Encadrement TRANCHANT bio informatique Cr ation d un groupe de Pavel Animardur y Fochen pout encadre man ENS suv ou PA POMPES appe Diana FERNANDEZ UMR 186 RPB IRD Montpellier P 0 ogiques Fabienne MORCILLO UR 192 Palmiers IRD Montpellier Tim TRANBARGER UR 192 Palmiers IRD Montpellie
65. place du syst me EST db 2001 il n existait aucun pipeline g n rique d analyse d ESTs except des applications payantes et relativement ch res Nous avons donc opt pour d velopper notre propre programme qui enchaine plusieurs analyses r alis s par des logiciels bio informatiques gratuits aux algorithmes robustes A Il heure actuelle d autres laboratoires ont d velopp leur propre pipeline mais aucun ne distribue leur outil Notre objectif est justement de rendre notre application suffisamment convivial pour le distribuer gratuitement apr s signature d une charte Nous avons d j plusieurs demandes d quipes IRD ou ext rieures Les nouvelles fonctionnalit s que nous avons d velopp ou souhaitons d velopper n existent pas en tant que telles Il s agira de rechercher et d adapter des outils existants afin qu ils s int grent dans le syst me EST DB et qu ils r pondent au mieux nos besoins L objectif une fois de plus est de pouvoir le distribuer afin d viter que le travail soit refait 42 Si vous proposez des am liorations un outil existant combien d utilisateurs ont d j t l charg s ou obtenus une copie de la version actuelle Aucun puisque l objectif de ce projet est de rendre cet outils transf rable documentation interface WEB facile d claration APL 43 Le projet propos est il bas sur de nouvelles conclusions scientifiques ou m thodes innovantes Si c est le cas d cr
66. pproche par similitudes qui est r alis e par le programme d alignement local Blast Formulaire de demande SPIRALES 2008 page 21 32 spirales ird fr Recherche de 2 s quences Sh ma actuel du pipeline et de Masquage du similaires Identification Qualit Vecteur st Assemblage dans les bases des bases des et clustering de donn es la base de adaptateurs publiques 2 p F He ES d donn e EST db Fa quence ualit quence ontigs ee S sue brute de la des singletons Semmen D Ce sh ma ne one D ADN i s quence inserts clusters ies pubes prend pas en compte les Interrogation modifications pr vues dans ce projet Connexion Phred Phred Vecscreen StackPack Blast et Matcher Application Web Cf aussi la documentation technique o un sch ma plus d taill montrant l architecture est pr sent 51 Lister les m thodes r f rentiels d analyses de conception et de d veloppement utilis s pour laborer l outil Analyse et conception notation UML Unified Modeling Language D veloppement Perl CGI XHTML CSS Javascript Syst me de gestion de bases de donn es MySQL 52 Lister les langages de programmations et les outils de d veloppement envisag s Pr ciser le type de syntaxe qui sera utilis e pour la documentation du code Langages de programmations et outils de d veloppement utilis
67. r Herv CHRESTIN UR 060 Clifa IRD Tha lande Fabienne CARTIEAUX UMR LSTM IRD Montpellier Philippe NORMAND _ DR___ UMR 5557 Ce projet est le continuum d un projet d marr en 2007 Le cahier des charges tabli en 2007 dont nous pr senterons le bilan est r alis via un prestataire de service en bioinformatique 2 intervenants sont impliqu s Formulaire de demande SPIRALES 2008 page 4 32 spirales ird fr Isabelle VERGELY Soci t ASA Chef de projet Beno t PARRA Soci t ASA D veloppeur 17 Disponibilit implication de chacun des intervenants effectifs exprim e en de temps homme ou en jours homme ETP total ou pour une p riode Ex Dupont forte disponibilit 50 ETP sur la dur e du projet Martin tr s faible disponibilit 0 5 jour mois L essentiel est de donner un ordre de grandeur et non pas une valuation mon taire s agit il de 4 jours de travail 4 jours ETP pour l ann e 15 jours ETP ou 40 jours ETP un jour par semaine ou de s impliquer temps complet 9 200 jours ETP Organisme Disponibilit Implication Nom Christine DUBREUIL Forte disponibilit 1 jour sem TRANCHANT Val rie HOCHER IRD Moyeenne disponibilit 0 5 jour sem Florence AUGUY IRD Fable disponibilit 1 jour mois Perla HAMON IRD Fable disponibilit 1 jour mois Alexandre DE KOCHKO IRD Fable disponibilit 1 jour mois Diana FERNANDEZ IRD Faible disponi
68. r sultats dans des fichiers de sortie http www phrap org phredphrapconsed html Vecscreen Cet outil disponible sur NCBI permet d identifier rapidement des segments de s quences nucl iques d origine vectorielle Il recherche la position du vecteur dans une s quence en utilisant le programme Blast automatiquement param tr pour une d tection optimale des contaminations http www ncbi nlm nih gov VecScreen Stackpack Ce logiciel poss de un programme r alisant le clustering l assemblage de s quences pr sentant de courtes r gions chevauchantes Il regroupe 3 algorithmes l algorithme agglom ratif D2 cluster plus rapide que blast est utilis pour le clutering initial les s quences doivent tre longues et seules les grandes similarit s sont d tect es L algorithme du programme phrap aligne rapidement toutes les s quences d un cluster entre elles mais les informations sur la variation l int rieur m me du cluster sont insuffisantes pour tablir une s quence consensus Le programme craw intervient dans ultime tape pour analyser l alignement et d terminer la s quence consensus Ce logiciel est d velopp en python et toutes les informations manipul es par ce logiciel sont stock es dans une base de donn es Mysal http www sanbi ac za Dbases html Blast BLAST Basic Local Alignment Search Tool est un programme de recherche de similarit d velopp au NCBI Genbank L int r t de l a
69. riode de test afin de valider la fonctionnalit des nouveaux modules avant leur transfert sur la cha ne de traitement 81 O sera h berg le code source de votre outil durant son d veloppement puis durant sa maintenance H bergement durant le d veloppement serveur de test http bio info estdb H bergement durant le fonctionnement serveur de production http bioinfo estdb 82 L outil sera t il plac dans une plateforme collaborative ou au sein d une communaut de d veloppement de projets open source si oui lesquels Non d fini pour le moment Formulaire de demande SPIRALES 2008 page 27 32 spirales ird fr Licence et distribution 83 L utilisation de l outil sera t elle soumise une licence pour les utilisateurs qui l installeront sur leurs propres machines S agira t il d une licence libre Le code source de l outil sera t il prot g ou compl tement ouvert d crire l ventuel co t le type de licence et toutes autres ventuelles obligations Non seule la signature d une charte sera demand e Cette charte stipulera l origine ainsi que la liste des concepteurs de l outil et la propri t intellectuelle Ce point sera cependant pr ciser avec C Dubreuil Tranchant 84 Existe t il des parties ou modules de votre outil qui sont prot g s par des brevets ou des marques Non 85 D crire comment l outil sera distribu ou rendu accessible aux u
70. s disposant de la nomenclature GO Comparaison des outils trouv s afin d identifier le plus adapt pour le pipeline existant D finition des l ments r sultant du processus d annotation devant tre inclus dans la base de donn es EST db 3b Phase de d veloppement et de validation pour Phases de conception de d veloppement pour o Le fonctionnement du module o Le stockage de r sultats dans la base de donn es EST db o La consultation de ces informations o Test du module par les utilisateurs et int gration de ce module au pipeline Livrable 4 D veloppement et int gration d un nouveau module analyse g nomique comparative 4a Conception d finition pr cise du fonctionnement du module Partie non Veille technologique des outils existants dans le domaine public encore faite Mode de visualisation pr sentation des r sultats Devrait tre El ments r sultant de l analyse devant tre inclus dans la base de donn es EST db faite pour fin 29 Respect de l ch ancier et rappel de l ch ancier Novembre D cembre Documentation et packaging de l application EST db E version actuelle b Version contenant en plus le module annotation fonctonnalle GO e Version contenant en plus las am liorations de fonctions intiales du pipeline Am lioration des fonctions initiales du pipeline des interfaces et de la base de donn es ESTdb a D veloppement et int gration
71. tilisateurs lister les sites web si n cessaire L application EST dbsera int gr e dans le site Web de la plateforme bioinformatique de PIRD http www mpl ird bioinfo Les donn es de la base de donn es EST dbseront consultables sur le web A la demande que se fera par email les codes sources seront mis a la disposition des demandeurs sous forme de fichier compress avec une notice d installation Installation 86 La proc dure d installation sera t elle automatis e par un programme ou un script ou l outil devra t il tre install manuellement Pr ciser les OS et distribution L outil devra tre install de mani re manuelle en suivant la documentation cr ee cet effet OS linux Distribution non pr cis e 87 Est ce que le programme ou script d installation d tectera et signalera les logiciels requis manquants Non car pas de programme d installation automatique 88 Est ce que le programme ou script d installation permettra la d sinstallation de l outil Non car pas de programme d installation automatique 89 Si l installation n est pas pris en charge par un programme ou un script existera t il une notice d installation Oui c est en cours de r daction ce point fait partie int grale du projet 90 De quelle mani re la complexit de la proc dure d installation limitera l adoption l utilisation de l outil par les utilisateurs cibles
72. tion est en cours Les autres points demand s sont report s sur 2008 suite au retard expliqu pr c demment 31 Livrables produits outils documentations m thodes URLs fournis l quipe IS L objectif du projet est d obtenir un outil EST db transf rable et utilisable Il sera donc fourni l quipe IS d s 1 sa finalisation et sa validation par C Dubreuil Tranchant et le groupe de travail 2 son d p t l Agence de Protection des Logiciels 3 la validation de l autorisation de diffusion par les DU des UMRs IRD impliqu es 32 Moyens humains et services de la DSI mis contribution en 2007 personnes ressources du pool IS d p t SVN h bergement sur serveur formation Y Pournin SIL B Granouillac DSI 5 Description des besoins Cette partie questions 33 36 concerne tous les nouveaux projets tude de faisabilit projet finalis de d veloppement d une application IS ou autre La demande peut tre tre accompagn e de tous documents utiles pr sentation du projet global ou descriptif du projet rapport de phases pr liminaires tude de faisabilit dossier d expression des besoins ou cahier des charges devis d taill 33 Objectifs scientifique Ce projet est un continuum de 2007 Il a donc d j t d crit mais pour des questions de commodit s relecture possible par les valuateurs nous avons re copi certaines parties du projet
73. ue de s quences Il s agit d une approche par similitudes qui est r alis e par le programme d alignement local Blast Bases de donn es Swiss Prot est une base de donn es de s quences prot iques qui poss de un haut niveau d annotations tel que la description des fonctions prot iques les structures des domaines les modifications post transcriptionnelles L ensemble des donn es qui sont ins r es dans Swiss Prot sont v rifi es manuellement par des curateurs qui rajoutent les informations dans la base consultable sur le web ou sous forme de fichiers plats par FTP http us expasy org sprot Genbank est une base de donn es de s quences nucl iques publiques regroupant 32549400 s quences en f vrier 2004 http www ncbi nim nih gov Genbank GenbankOverview html TIGR Rice Database est une base d annotation automatique 90 actuellement de la s quence compl te du g nome du riz IRGSP La plupart des annotations ne sont pas v rifi es comme sur Swiss Prot m me si le processus de curation manuel est en cours actuellement Les donn es sont consultables via leur site web ou sous forme de fichiers XML par FTP http www tigr org tdb e2k1 osa1 Logiciels Phred Le programme Phred d velopp en C est un logiciel de base calling qui se base sur la m thode de Fournier pour lire les 4 courbes du chromatogramme Il appelle une une les bases leur assigne une valeur de qualit et crit les
74. ultats g n r s et de r aliser d autres fonctionnalit s r pondant des crit res propres au laboratoire Les donn es brutes et les donn es g n r es sont ensuite stock es dans une base de donn es MySQL A l issue du s quen age la s quence d ADN est repr sent e par un chromatogramme qui va tre analys par le pipeline Le logiciel de base calling utilis est Phred qui va permettre d obtenir les s quences nucl iques des ESTs Puis les r sultats de Phred sont trait s les bases de mauvaises qualit s sont masqu es et les s quences de mauvaise qualit sont limin es Les s quences appartenant au vecteur sont ensuite d tect es a l aide du logiciel Vecscreen puis elles sont masqu es et supprim es Les s quences de petite taille sont limin es Chaque s quence d EST repr sente un fragment d un g nome mais certaines d entre elles peuvent tre redondantes ou recouvrantes Le contigage des s quences va permettre de r duire le nombre de s quences annoter d obtenir des s quences plus longues et donc r aliser une annotation plus fiable Ceci est r alis par le logiciel Stackpack A l issue du contigage les ESTs appartiennent ou non un contig L tape suivante est l annotation des s quences qui doit renseigner sur la fonction des prot ines putatives ventuellement associ es Une des m thodes les plus sures pour la d termination des g nes est la comparaison de la s quence analyser avec une banq
75. uvoir se rep rer chronologiquement dans l encha nement des op rations 70 Avez vous mis en place un processus de gestion des erreurs et de correction par l quipe de d veloppement et comment Pour le moment il ny a pas de processus sp cifique hormis l envoi de email mis en place pour g rer les erreurs Le seul moyen de savoir o le programme est bloqu c est de regarder jusqu ou les fichiers temporaires ont t g n r s Par exemple si le blast de s quence t effectu mais pas leur annotation on sait que le probl me ce situe entre ces 2 tapes Documentation 71 Quelles sont les diff rentes documentations pr vues nature et format de la des documentation s cible vis e sp cifications fonctionnelles sp cifications techniques docs API d veloppeurs La r daction d une documentation technique d crivant l outil EST db est un des objectifs de ce projet Cette documentation servira de r f rence pour l installation et l utilisation de l outil Une notice aux utilisateurs est aussi en cours de r daction 72 Lister les sujets ou principaux chapitres qui appara tront dans la les documentation s de votre outil Cf Document joint Documentation technique Multilinguisme traduction 73 Lister les langues parl es par vos utilisateurs cibles Fran ais Anglais Espagnol Portugais 74 Lister les langues dans lesquelles votre outil votre documentation et

Download Pdf Manuals

image

Related Search

Related Contents

Samsung ES25 Käyttöopas  Wagan 1250 watt User's Manual  THermo Insert - Lohberger Heiz  Autómatas Programables - Panasonic Electric Works  Eau, assainissement, hygiène et habitat dans les prisons  User manual Marad Lite, version 3  HP Compaq Elite 8300 USFF  

Copyright © All rights reserved.
Failed to retrieve file