Home

Manuel de l`utilisateur de Wapam

image

Contents

1. BoM Type de s quence Fi Nombre maximal d erreurs Illustration 3 Autre exemple de saisie de donn es dans l interface web recherche dans une banque personnelle Une page de mise en attente affiche un indicateur de progression de compilation et de passage des s quences comme indiqu sur l illustration 4 eu autornata pattern dm 20 Data received waiting for filtering c2mn Illustration 4 Progression de la compilation des processeurs de Kdisk FPGA avant la filtration des s quences Les r sultats sont alors ceux repr sent s dans l illustration 5 Manuel d utilisation de Wapam version du 16 10 2006 Page 5 14 Bio informatique k T Jump to sw O4USM9 104K_THEAN 7 in n Maximum sequences length 3 Result 1 to 1500 of 2000 prog_name vapam prog_version 0 8 21 datetime 2006 10 13 14 25 30 name no named pattern email no named pattern pattern D ILV x 1 3 4 strict origin tmp 278960 1 stan dg RDISK37f386fbeb536f2ee89ec3f76d17ead8 wfa sequences name sequence type protein alert parameters WFA no named pattern WFA Pattern D ILV x 1 3 A strict WFA 7 states initial is 0 final is 6 8 transitions threshold 0 gt A R N D 0 E G HI L E M EES IT W Y V Z ua estesa LE EE EE I I I 2 3 0 g 2 4 Q g 0 1 1 1 1 1 2 1l 1 1 2 3 0 g 3 4 o0 p 4 3 0 g 3 5 1 1 Chromosome bros US MT O4K_THEAN 104 kDa miconsmes rhoptr antigen precurs
2. Bioinformatics Manuel de l utilisateur de Wapam Table des mati res I VVapam une recherche de motifs par automates pond r s 3 2Tutornel un exemple simple d utlisat On 2 822 D he tin 3 CSA CR tem msnmeteatuembemmnybtmmststuses 3 CARS ATOS AS RAS ee a een eo de ae 6 Entr e et sortes de donnees de WADANMR 2 mes scnacte 2e A kaeaea ao 7 Bonne CC E a E A E E E E 7 Formulaire pour rechercher plusieurs motifs 7 Donnees OE SO a a ee 8 E E TA a d e a a l De AE A E EEA 8 Format A A PR 9 FOR GS E be 9 R marque s r le nombre COTE SMS es drates aasaaen nee anne tata een 10 4Quelques d tails sur le fonctionnement de Wapam ss 10 Les automates DONS OR a a ni De ete ec ete 10 NV ADA CCN AD RON A dd en ere nn E el ne 12 P OO a E 13 Boo a a e E E E E 13 R E E E E E E E E E E ES TE E EE ER OE EEE E E EE 14 Manuel d utilisation de Wapam version du 16 10 2006 Page 1 14 Index des illustrations Illustration 1 exemple de saisie de donn es dans l interface web oueaaaooo2 uunaaaiaaaaanananaraians 4 Illustration 2 Autre exemple de saisie de donn es dans l interface web recherche dans un g nomes Illustration 3 Autre exemple de saisie de donn es dans l interface web recherche dans une banque E EE l E E T E E E AEA teca N A EA EE 5 Illustration 4 Progression de la compilation des processeurs de Rdisk FPGA avant la filtration des Se E 8 E E E E E A E E N E O E A 5 Il
3. compilation m de l automate filtre sur 30 cartes Illustration 14 Achitecture mat rielle de WAPAM Rdisk est une architecture sp cialis e constitu e de plusieurs dizaines de cartes actuellement 31 Chaque carte contient un processeur reconfigurable FPGA coupl un disque dur Les automates pond r s sont directement cabl s sur les FPGA ce qui permet une valuation simultan e des tats Ce cablage utilise autant d lements mat riels que de transitions d tats dans l automate Les processeurs utilis s ont une surface pouvant cabler des automates ayant jusqu une centaine de transitions Les 31 cartes se partagent le balayage de la banque ou du g nome 1 3175 par carte L ensemble du prototype Rdisk a t con u pour filtrer rapidement les bases de donn es les disques durs tant directement reli s aux processeurs FPGA Rdisk tant un prototype de recherche il n est pas toujours en service Si vous avez besoins de calculs intensif en recherche de motifs contactez la plateforme webmaster genouest org pour que nous mettions en place un traitement adapt de vos donn es ou de vos motifs Manuel d utilisation de Wapam version du 16 10 2006 Page 12 14 Performances L illustration15 pr sente une comparaison des temps de recherche de motif entre l impl mentation logicielle de Wapam et l acc l ration mat rielle Wapam Rdisk moyenne sur 50 motifs pris al atoirement parmi un ensemble de
4. 3331 motifs Pour ne pas surcharger les serveurs la recherche peut tre arr t e d s qu il y a plus d un certain nombre de r sultats auto stop Dans tous les cas une recherche avec Wapam avec ou sans erreurs prend le m me temps d ex cution Sur la version logicielle le temps d ex cution est lin aire par rapport la taille de l automate et donc du motif Pour Wapam Rdisk tous les motifs sont trait s dans le m me temps tant qu ils sont accept s par Rdisk c est dire tant qu il n y a pas plus qu une centaine de transitions Wapam logiciel Wapam Wapam Rdisk Wapam Rdisk autostop 2000 pr compilation 1 motif 2605 s 2003 s 125 235 3331 motiis 100 jours 77 jours lt 3jours lt 1jour Illustration 15 Comparaison des temps de recherche de motif estimations L acc l ration apport e par Rdisk est encore plus importante partir du deuxi me lancement lorsque les motifs ont d j t compil s car Wapam Rdisk se souvient des automates pond r s compil s pr cedemment La modification du seuil d erreur ne demande pas une nouvelle compilation Besoins sp cifiques Nous sommes votre disposition webmaster genouest org pour collaborer sur des t ches particuli res comme par exemple e ajouter d autres banques de donn es e r aliser des automates pond r s r pondant des objectifs particuliers e mettre en place sur le cluster ou sur Rdisk des calculs intensi
5. brin plus e La position de d but et la position de fin de la s quence affich e dans les r sultats et non celle du motif e le co t ou nombre d erreurs par rapport au motif initial e La s quence dont on peut s lectionner la longueur d affichage dans le champ texte maximum sequences length en haut de la page par d faut 30 e La longueur r elle de la portion de la s quence affich e ISLIRGGRSEYGAAL 996 sw P136711C06 HUMAN Complement component C6 precursor plus 441 1481 Jo 6 RNIPCAVTKRNNLRK KQSP A si 1997 sw P13671 CO6_HUMAN Complement component C6 precursor plus 553 593 0 S n es QEEDCTFSIMENNGQ El 4 HH Bio informatique Illustration 8 Exemple de r sultats avec l option each match Dans cette s quence le motif appara t deux fois aux positions 481 et 593 Format XML Le format XML illustration 9 est un format standard cf http www w3 org XML 1999 XML in 10 points fr html permettant d enregistrer des donn es de fa on ce qu elle puissent tre relues facilement par un humain ou un programme Vous en aurez peut tre besoin si vous souhaitez traiter les donn es automatiquement par un script que vous souhaitez crire vous m me En r alit le format Web est produit partir du format XML lt xml version 1 0 encoding UTE 8 gt lt result prog _ name wapam prog _version 0 8 21 datetime 2006 10 12 15 56 09 name no named _ pattern email no_ named pat
6. motif est transform en circuit sp cialis Chacun des 31 processeurs reconfigurables qui composent Rdisk sont ensuite param tr s avec ce circuits La s quence est divis e en 31 morceaux qui sont trait s dans chacun des processeurs 2 Tutoriel un exemple simple d utilisation Utilisation avec Rdisk Manuel d utilisation de Wapam version du 16 10 2006 Page 3 14 Bio informatique MANUEL D UTILISATION Exemples de donn es Formulaire pour rechercher plusieurs motifs Etape 1 Votre email Nom du motif S Motif D ILV x 1 3 A N Mon motif est nucl ique p s Utiliser le l acc l rateur RDISK 21 disponible sur quelques banques ou g nomes version beta Vous devez re g n rer l automate apr s un changement de cette option Etape 2 a Automate WFA no_named_pattern WFA Pattern D ILV x 1 3 A strict 7 states initial is 0 final is 6 8 transitions default threshold 0 gt A R N D C Q E G H I L K M F P 2 5 0 0 0 0 0 2 4 0 0 0 0 0 0 al 1 0 1 1 1 I 2 1 1 0 0 0 2 3 0 0 0 0 0 3 4 0 0 0 0 0 4 5 0 0 0 0 0 5 6 0 1 1 1 1 Dj Rechercher dans une base de donn es ou un g nome qu s quences perso Illustration 1 exemple de saisie de donn es dans l interface web Nous souhaitons rechercher le motif Prosite D ILV x 1 3 A dans la bases de donn es prot iques SwissProt Il faut alors g n rer l automate en appuyant sur le bouton correspondant L automate repr sentant ce motif se trouve dans l illu
7. 8 391 0 AILRRDIYDRTPILTUGRGHVTLLGDSVHAMQPNMGOGGCMAIEDGYQLALELDR sw 035600 ABCA4 MOUSE Retinal specific ATP binding cassette transporter ATP binding cassette sub family A member 4 RIM ABC transporter RIM protein RmP pl Illustration 10 Exemple de la sortie au format CVS Remarque sur le nombre de r sultats Nous avons limit le nombre de r sultats en sortie de Wapam par genocluster 2000 par Rdisk 500 En effet une requ te avec un trop grand nombre de r ponses appara t difficilement interpr table 1l est alors pr f rable que l utilisateur biologiste d affine sa recherche Il est toutefois possible d augmenter ces seuils en contactant webmaster genouest org 4 Quelques d tails sur le fonctionnement de Wapam Les automates pond r s WFA Un automate caract risant un motif sera repr sent par l ensemble des positions du motif reli s entre elles par des transitions illustration 11 L automate est pond r c est dire que chaque transition est tiquet e par une lettre qui peut tre lue selon l alphabet de la s quence bases nucl ique ou prot ique et par un poids La s quence est progressivement enfil e dans l automate et chaque position le poids de sa transition est additionn au score Ce poids refl te l ad quation d une partie de la s quence cible banque ou g nome avec la lettre lue cette position dans le motif Par d faut ce poids est gal 1 si la lettre n
8. anuel d utilisation de Wapam version du 16 10 2006 Page 9 14 Bio informatique Dans le menu Donn es s lectionnez Convertir Choisissez l option d limit et appuyez sur suivant Indiquez comme s parateur la virgule et comme indicateur de texte le guillemet M A DP Cliquez sur terminer 10 Vous n avez plus qu formater votre tableau comme bon vous semble Sequence Strand begin no named pattern end no named pattern cost no named pattern sequence no named pattern length no named pattern sw Q9Y5P8 2ACC_ HUMAN Serine threonine protein phosphatase 2A 48 kDa regulatory subunit B PP2A subunit B PR48 isoform plus 226 269 0 KKTPTSIEYWFRCMDLDGDGALS sw P41570 6PGD_CERCA 6 phosphogluconate dehydrogenase decarboxylating EC 1 1 1 44 plus 175 218 0 GEGGAGHFVEMVHNGIEYGDMOLICEAYQIMRALGLSQAEMATEFERMNS EELDSFLIE sw 096375 ABA2 CAPAN Zeaxanthin epoxidase chloroplast precursor EC 1 14 13 90 Xanthophyll epoxidase Beta cyclohexenyl epoxidase plus 345 388 0 AILRRDIYD sw P93236 ABA2_LYCES Zeaxanthin epoxidase chloroplast precursor EC 1 14 13 90 plus 353 396 0 AILRRDIYDRPPTESMNGRGRVTLLGDSVHAMOQPNLGQGGCMAIEDSYQLALELERACSRSAEF sw Q40412 ABA2_NICPL Zeaxanthin epoxidase chloroplast precursor EC 1 14 13 90 plus 347 390 0 AILRRDIYDRPPTESNGRGRVTLLGDSVHAMQPNLGQGGCMAIEDSYQLALELDRALSRSAES sw 081360 ABA2_PRUAR Zeaxanthin epoxidase chloroplast precursor EC 1 14 13 90 PA ZE plus 34
9. avec ou sans erreur s dans des g nomes complets dans des banques de donn es et dans des banques personnelles maxi 80M L interface Web permet aux utilisateurs de lancer leur requ te sur le cluster de machines genocluster mis disposition par la plate forme ou d utiliser l acc l rateur Rdisk Rdisk est une architecture sp cialis e con u par l quipe de recherche S YMBIOSE pour r duire consid rablement le temps de recherche du motif dans les s quences cibles La premi re particularit de Wapam est qu il recherche des motifs exprim s en automates pond r s WFA voir le chapitre 4 Les automates pond r s peuvent tre g n r s partir de motifs Prosite Chaque s quence est enfil e progressivement dans cet automate Il en ressort un score seuil qui permet d valuer l ad quation de la s quence avec le motif Typiquement un score simple c est le nombre d erreurs de substitutions par rapport un motif Prosite S1 le score passe au dessus d un certain seuil le motif est d tect la position courante exemple si une seule substitution est tol r e le score seuil sera gale 1 et le motif sera d tect si le score est sup rieur ou gal 1 Une recherche avec Wapam avec ou sans erreurs prend le m me temps d ex cution L autre particularit de Wapam est son couplage avec la machine prototype Rdisk qui permet une acc l ration mat rielle du calcul Lors d une tape de compilation l automate du
10. ble de modifier manuellement l automate Par exemple la substitution de D par N R ou A en premi re position peut co ter 3 au lieu de 1 Illustration 13 gt A R N D C Q 2 5 0 dd 0 o 0 p 2 4 0D o o o 0 g 1 3 3 3 AJ 1 1 2 1 1 1 1 1 2 3 0 oo 0 3 4 E 5 0 4 5 0 o o o 0 p 5 6 l1 1 1 1 1 G H K W 0 0 g g 0 g 0 0 0 g 0 0 0 0 g 0 0 g 0 0 0 0 0 0 OS ES nt a 1 1 NES PS 1 I1 t A 0 HE NI cl SE Ad dl 1 0 0 g 0 0 g 0 0 0 g 0 0 0 0 g 0 0 g 0 0 0 0 0 g 0 0 g 0 0 0 0 0 0 0 0 0 RS h 1 1 NS NC ES Illustration 13 Exemple d automate modifi la main Manuel d utilisation de Wapam version du 16 10 2006 l LS SG Dl pe Page 11 14 Bio informatique La plateforme dispose d autres outils pour g n rer des automates pond r s g n ration de poids la BLOSSUM utilisation de matrices poids position PWM Contactez webmaster genouest org pour des questions ce sujet Wapam et Wapam Rdisk Wapam peut tre utilis de deux fa ons Illustration 14 soit il est lanc sur genocluster comme tous les autres logiciels de la plate forme et la recherche se fait sur un noeud du cluster soit il est coupl avec l architecture Rdisk qui parall lise la recherche sur un ensemble de cartes logiciel Cluster de PC Wapam C motifs pe En re utilisateur serveur web serveur web a DE en automate PRE mat riel VVapam Rdisk
11. ent avec le motif chaque sequence qui match Habituellement vous choisirez eatch match en particulier lorsque la recherche se fait dans un g nome Formulaire pour rechercher plusieurs motifs Accessible par un lien qui est en haut gauche du formulaire Il permet de lancer Wapam it rativement sur un ensemble de motifs ensemble de motifs dans un format texte et non au format Word Les autres param tres d entr e sont identiques Dans ce cas d utilisation e les matrices des motifs ne sont pas modifiables manuellement e Les r sultats sont exclusivement envoy s par mail soit un mail par r sultat soit un seul mail pour tous les r sultats Les r sultats sont alors enregistr s dans un unique fichier Pour avoir des renseignements sur le lancement d un ensemble de motifs ou pour mettre en place un traitement avec de nombreux motifs contactez webmaster genouest org Manuel d utilisation de Wapam version du 16 10 2006 Page 7 14 Bio informatique Donn es de sortie Les 3 formats de description des r sultats contiennent exactement les m mes donn es mais elles sont pr sent es diff remment Format Web HTML Le format HTML vous permet de visualiser vos donn es dans un tableau dans votre navigateur internet illustration 7 Jump to sw Q9YSP8 2ACC_HUMAr que n Maximum sequences length Result 1 to 1278 of 1278 prog name vapam prog version 0 8 21 datetime 2006 10 12 15 56 09 name no
12. est pas la m me substitution et 0 s1 c est la m me Le motif est reconnu lorsque l tat final est actif avec un score sup rieur ou gal au score ou seuil d erreur fix Par exemple si une erreur est tol r e le seuil sera gal 1 Manuel d utilisation de Wapam version du 16 10 2006 Page 10 14 Bio informatique Sur l illustration 11 pr sentant un exemple d automate pond r chaque rond est un tat chaque fl che est une transition OO ge O O x je Illustration 11 un automate pond r du motif D ILV x 1 3 A Les automates utilis s par Wapam sont sous la forme suivante illustration 12 Par exemple si la portion de s quence qui passe dans l automate passe de l tat O 1 en lisant un D le co t sera de 0 sinon le co t sera de 1 T states initial is 0 final is 6 8 transitions default threshold 0 gt F N D C Q E G H I L E 5 T W V 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 d 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Il I l Ll 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3 0 0 0 0 i 0 0 0 0 0 0 0 0 0 0 D 0 0 0 D i 0 3 a 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 EE Illustration 12 Exemple d automate repr sentant un motif Prosite D ILV x 1 3 A Les poids peuvent tre plus g n raux que le simple d compte 0 1 il est possi
13. fs grand nombre de s quences de motifs d automates lancements it r s analyse de r sultats nous pouvons param trer finement Wapam pour obtenir les meilleurs temps de calculs sur votre application e vous fournir un acc s Wapam en ligne de commande sur genocluster Manuel d utilisation de Wapam version du 16 10 2006 Page 13 14 R f rences Merci de citer la r f rence suivante dans vos travaux utilisant Wapam St phane Guyetant Mathieu Giraud Ludovic L Hours Steven Derrien St phane Rubini Dominique Lavenier and Fr d ric Raimbault Cluster of re configurable nodes for scanning large genomic banks Parallel Computing 31 1 73 96 2005 Manuel d utilisation de Wapam version du 16 10 2006 Page 14 14
14. luster Les r sultats sont les m mes que dans l illustration 5 Manuel d utilisation de Wapam version du 16 10 2006 Page 6 14 Bio informatique 3 Entr e et sorties de donn es de Wapam Donn es en entr e Les param tres remplir sur le formulaire Web sont les suivants e Donner son email est optionnel mais conseill Certaines recherches peuvent tre assez longues vous risquez donc de fermer votre navigateur et ainsi de perdre le lien sur la page r sultat Dans tous les cas le fichier r sultat est sauvegard 5 jours sur nos serveurs e Le nom de motif est galement facultatif Il vous permet de diff rencier vos requ tes lorsque vous en lancez plusieurs e Si votre moti est nucl ique vous devez le pr ciser e Choisir d utiliser Rdisk ou non La machine sp cialis e Rdisk permet d acc l rer les calculs voir ci dessous C est un prototype de recherche qui peut tre souvent hors service e D finir les s quences cibles La plate forme met disposition environ 200 g nomes et une vingtaine de banques de donn es Des g nomes et bases de donn es peuvent tre rajout es la demande webmaster genouest org Si on utilise Rdisk ce choix est beaucoup plus limit mais l encore nous pouvons faire des rajouts la demande Vous pouvez galement importer vos s quences personnelles e Choisir le type de r sultat toutes les occurences de motifs chaque match ou juste les s quences qui match
15. lustration 5 Affichage des r sultats de l exemple en HTML snssssssssssssssssssssessssssssssssssssssssssesreee 6 Illustration 6 Positionnement du job lanc dans la file d attente des t ches de genocluster 6 Illustration 7 Exemple de la sortie HTML avec l option a each sequence matcheds 8 Illustration 8 Exemple de r sultats avec l option each match Dans cette s quence le motif appara t deux fois aux positions 481 et 593 u2aaai1422uunanaaiiisammnananiaianunanariaiananniiiananenn a 9 Illustration 9 Exemple de la sortie au format XML ss 9 Illustration 10 Exemple de la sortie au format CVS 10 Illustration 11 un automate pond r du motif D ILV x 1 3 A 2euuoueeaa lluna 11 Illustration 12 Exemple d automate repr sentant un motif Prosite D ILV x 1 3 A 11 Illustration 13 Exemple d automate modifi la main 11 Illustration 14 Achitecture mat rielle de WAPAM esse 12 Illustration 15 Comparaison des temps de recherche de motif estimations 13 Manuel d utilisation de Wapam version du 16 10 2006 Page 2 14 1 Wapam une recherche de motifs par automates pond r s Wapam est un outil de recherche de motifs d velopp au sein de l quipe de recherche SYMBIOSE et mis en ligne sur le site de la plate forme OUEST genopole Wapam peut rechercher rapidement des motifs prot iques ou nucl iques
16. named pattern email no named pattern pattern MA TI E strict origin tmp 263430 1 batch1 q RDISKe97618c9b01832193cfb3ebdc118202f wfa sequences_name sequence_type protein alert parameters WFA no named pattern WFA Pattern MA TIJ E strict VFA 5 states initial is 0 final is 4 4 transitions threshold 0 gt A R N D C Q E G H I L KMF PSTHNWH Y V Z Pa Begin P 0 E ET ET SE SE EL EL LL I LL LL LI AL 1 2 0 1 3 1 3 1 1 1 1 LL LA 2 1 1 1 AL 1 1 1 1 2 a 1 1 1 1 1 1 1 1 13 QG 1 3 1 1 1 1 Q 1 1 1 1 1 3 i 1 E 1 Ar G I E a aAa Aa LT Aa a Aa a L 1 E I nonamed patem 9 llo KKTPTSIEYWFRCMD 2 LVKPRTEGKITLQDL 8 llo GEGGAGHFVKMVHNG IEITRDILNYQDDRG 8 lo AILRRDIYDRPPTFS 7 EEE i i SRSAESGSPMDVISS AILRRDIYDRPPTFS 4 sw P93236 ABA2_LYCES Zeaxanthin epoxidase chloroplast precursor EC 1 14 13 90 plus 353 SRSAEFGSPVDIISS Illustration 7 Exemple de la sortie HTML avec l option a each sequence matched CTI Le nombre de r sultats affich s sur une page peut tre d termin en remplissant le champ texte Result per pages en haut de la page par d faut 1500 Les donn es r cup r es illustration 7 sont e Le nom du chromosome ou de la s quence Vous pouvez aller directectement au chromosome ou la s quence qui vous int resse en cliquant sur le champ jump to en haut de la page e Le brin pour l instant la recherche ne se fait que sur le
17. or pi 04 bocobhboo boscscsbhbos boscebhbos Locobkos bocebhbos bocebhbos I iPo coco rasa P o tas Hugo tas l Hogar I bobo boocobbos bocobbon Locornoo bocobbon bocebhbos no named pattern af ener le SETGEFEEFERFDSF M RSESFOGLTTYRE H a 740 7 aa w PSVRATLVLEDTGUE sw P15711 104K_THEFA 104 kDa micrane me Mhoptry antigen precurar pi 04 die iaia NE SS A HPO i Ed SESIN 115 ghbulin sed storage protein 2 precurar 118 gkbulin sed storage protain I iapha gbbulini flEontains 115 globulin saed storage protein 3 acidic chain 15 qgl bulin sed storage protein I acidic chaini plus IMVYFGGAETYQUVHRS I i I SEDLVAVSINCVYHHL 115 gbbulin sed storage protein 3 basic chain 118 gbbulin saed siormgs protein I basie chainil Illustration 5 Affichage des r sultats de l exemple en HTML EH TT l I 18 LI on a LI Utilisation sans Rdisk Les saisies sont les m mes que dans l illustration 1 1l suffit de ne pas cocher la case Rdisk L illustration 6 montre le nombre de jobs en attente sur genocluster La requ te est plac e dans cette file d attente avant d tre ex cut e sur un des noeuds du cluster de machines U A pattern dm D o Data received starting the scan The job wapam id 276960 is waiting with priority 0 00000 there is 7403 waiting jobs on 7450 Illustration 6 Positionnement du job lanc dans la file d attente des t ches de genoc
18. stration 1 Il est important de noter que si une modification de param tres est effectu e alors que l automate est g n r 1l faut le g n rer une nouvelle fois Ici nous avons choisi d utiliser Rdisk Illustration 1 Exemple de saisie de donn es Il est possible de modifier l automate par exemple pour donner plus de poids une transition voir le chapitre 4 Nous aurions pu aussi choisir de rechercher ce motif dans un g nome comme dans l illustration 2 Dans ce cas il faut pr ciser l organisme et le ou les chromosome s vous pouvez s lectionner plusieurs chromosomes avec la touche maj et s assurer que l option a each sequence matched est s lectionn e Manuel d utilisation de Wapam version du 16 10 2006 Page 4 14 Bio informatique s Rechercher dans une base de donnes ou un Ce g nome s quences perso s Base de donn es ai d Organisme Anopheles gambiae s Chromosome si chroR Illustration 2 Autre exemple de saisie de donn es dans l interface web recherche dans un g nome Enfin il est possible de r aliser une recherche de motif dans une banque personnelle Illustration 3 Attention votre banque ne doit pas d passer 80M et les s quences sont au format FASTA an Rechercher dans une C base de donn es ou unl g nome ES s quences perso P Base de donn es s Organisme P Chromosome si i Fichier de s quences FASTA Max Vudd lguilot ExemplesLogiciels defensines fasta Browse
19. tern pattern MA TIJ E stric lt occurrence sequence sw Q9Y5P8 2ACC_ HUMAN Serine threonine protein phosphatase 2A 48 kDa regulatory subunit B PP2A subunit B PR48 isoform complement lt pattern name no named pattern begin 226 end 269 cost 0 gt lt sequence type protein gt KKTPTSIEYWFRCMDLDGDGALSMFELEYFYEEQCRRLDSMAT EALP FQDCLCOMLDLVKPRTEGKITLODL lt sequence gt lt pattern gt lt occurrence gt lt occurrence sequence sw P41570 6PGD CERCA 6 phosphogluconate dehydrogenase decarboxylating EC 1 1 1 44 complement plus gt lt pattern name no named pattern begin 175 end 218 cost 0 gt lt sequence type protein gt Illustration 9 Exemple de la sortie au format XML Format CSV Le format CVS illustration 10 permet d importer vos donn es dans n importe quel logiciel tableur comme Excel ou Open Office Calc Il est lui aussi traduit partir du format XML Le format CSV utilis par WAPAM est le suivant e le s parateur de champs est la virgule e le s parateur de texte est le guillemet Pour r cup rer un document CSV dans Excel 1 Sur l interface web de WAPAM cliquez sur le bouton droit de la souris sur le lien Description des r sultats au format CSV enfin cliquez sur Enregistrer la cible du lien sous Dans Excel Fichier Ouvrir S lectionnez tous dans type de fichier S lectionnez le type de fichier CSV et validez CRE RE ES S lectionnez toute la colonne A M

Download Pdf Manuals

image

Related Search

Related Contents

blue dewar thesis  SERVICE BULLETIN    aiii tarifa industrial 2015 aiii tarifa industrial 2015    Penpower Junior User Manual  Mode d`emploi www.juwel-aquarium.com  

Copyright © All rights reserved.
Failed to retrieve file