Home

Initiation à la génétique des populations naturelles

image

Contents

1. 329 Sommaire 7 Ava nt propos Ce document devrait permettre aux d butants et personnes non familiaris es avec la g n tique des populations de pouvoir effectuer leurs propres analyses ou au moins de pouvoir mieux comprendre les conseils des sp cialistes Il a t au d part r dig dans l urgence pour les tudiants d un Master de maladies infectieuses Il a pour vocation d tre utile en premier lieu ce type d tudiants mais il s adresse galement un public plus large s int ressant la structure g n tique des populations naturelles et aux inf rences qu il est possible de faire partir de marqueurs g n tiques variables dans le temps et l espace C est pourquoi tous les retours commentaires et sugges tions susceptibles d am liorer ce travail et d en permettre une meilleure compr hen sion seront hautement appr ci s Les formules math matiques sont nombreuses dans ce manuel Leur compr hension sur le bout des doigts n est pas indispensable Seule la compr hension des grands principes est requise Cependant il est clair que d arriver comprendre la plupart de ces formules dont certaines sont vraiment la base de la g n tique des populations sera d un tr s grand secours pour tous ceux qui souhaitent pouvoir s affranchir le plus possible des sp cialistes et de leurs remarques impatientes parfois d sobligeantes Je me permettrai d insister sur le fait qu il ne fau
2. pas de chevauchement de g n rations L quilibre d Hardy Weinberg Soit un locus deux all les 1 et 2 de fr quences p et p dans une telle population Alors puisque les gam tes se rencontrent au hasard nous pouvons construire le tableau 1 qui d crit la rencontre des gam tes de la fa on suivante Tableau I Tableau de rencontre au hasard des gametes Les g notypes form s sont entre parenth ses Gam tes de type Gam tes de type Pi 1 1 Pi p2 2 1 p p2 1 2 pr 22 Nous attendons donc dans les zygotes ainsi form s les proportions de g notypes pr 2 pi p2 et pz pour 1 1 1 2 et 2 2 respectivement Et puisqu il n y a ni s lection ni mutation ni migration et que la population est infinie pas de d rive al atoire des fr quences all liques ces proportions resteront les m mes chez les adultes de la g n ration suivante En se rappelant que la somme p p est n cessairement gale 1 nous d montrons facilement que les nouvelles fr quences all liques seront donc en appliquant l quation 1 Ta pe 2 ptt Ppa Plt Pol AO 1 1 pit 2piprt pr pt pal 1 1 et donc PaF P 30 Initiation la g n tique des populations naturelles C est ce que l on appelle l quilibre car rien ne bouge de Hardy Weinberg Que se passe t il si nous relachons chacune des hypoth ses du mod le de Hardy Weinberg l une apr s l autre RELAXATION DES HYPOTH SES
3. Fis F Fraterie j 2 BRIT Pity Bts i jti l 5 Pill p Pit Bj CQFD m me si c est plut t moche 312 Initiation la g n tique des populations naturelles ue ADN Acide d soxyribonucl ique mol cule de base de l h r dit En anglais DNA Pour plus de d tails consulter n importe quel manuel de biochimie AIC3 Akaike Information Criterion de son auteur Hirotsugu Akaike AKAIKE 1974 est une mesure de la qualit d ajustement d un mod le statistique estim par rapport aux don n es Sa valeur d pend la fois du nombre de param tres du mod le et de la dispersion des donn es autour des valeurs attendues du mod le Le meilleur mod le est celui qui pr sente le plus petit AJC Plus de d tails sont donn s en r ponse 12 All le Etat h r ditaire dans lequel un locus se pr sente Chez les diplo des chaque individu pr sente deux alleles chaque locus Ces all les peuvent tre identiques homo zygote ou diff rents h t rozygote Allelic dropout pas de traduction simple Ph nom ne qui fait qu un all le n est pas vu en face d un autre cause par exemple d une comp tition pour la Tag polym rase lors d une PCR avec peu d ADN Dans ce cas un seul all le se trouve amplifi et l individu est erron ment interpr t homo zygote Am iotique Processus de reproduction qui se d roule sans intervention de la m iose Apostatique s lection Proc
4. 0 21 MLG chang par g n ration entre deux sous populations Il est probable que la division cellulaire n est pas la bonne mesure du temps de g n rations ici En effet cela signifierait que chaque cellule de trypanosome correspond un individu tant donn le nombre de per sonnes atteintes et surtout le nombre de cellules trypanosomiales contenues par patient cela reviendrait des populations de tailles gigantesques qui ne devraient pas ou peu d river pour des chiffres consulter l article original de Korri et al 2009 Le temps de g n ration correspond donc davantage au temps d un cycle complet ts ts homme ts ts qui prend environ 37 49 jours se r f rer l article de KoFFI et al 2009 pour les d tails d o un nombre maximal de g n rations par an de 10 Soit donc deux MLG chang s par ann e Calculs d effectifs efficaces Nous allons utiliser ici une pirouette dont nous v rifierons la pertinence ensuite l aide de quelques simulations Comme nous avons des chantillons des m mes foyers chantillonn s dans le temps pour Bonon et Dubr ka nous allons tenter d estimer la taille de d rive des MLGs l aide de m thodes temporelles et spatio temporelles Pour Bonon et pour Dubr ka nous utiliserons la m thode de WapLes 1989 avec NeEstimator Pour les foyers guin ens nous pourrons aussi essayer d estimer conjointement la taille efficace et le taux de migration l aide de la m
5. Thierry De Meets Lnitiation a la g n tique des populations naturelles Application aux parasites et leurs vecteurs Lnitiation la g n tique des populations naturelles Application aux parasites et leurs vecteurs IRD ditions INSTITUT DE RECHERCHE POUR LE D VELOPPEMENT Collection actiaues Marseille 2012 Pr paration ditoriale Yolande Cavallazzi Mise en page Desk 53 Maquette de couverture Michelle Saint L ger Maquette int rieure Pierre Lopez Aline Lugand Gris Souris Coordination fabrication Catherine Plasse Photo de couverture IRD L Basco S quencage d ADN Retouche graphique Michelle Saint L ger Photo page 4 de couverture IRD S Ravel G palpalis gambiensis accouplement IRD J L Fr zil Trypanosoma gambiense sur frottis de sang La loi du 1 juillet 1992 code de la propri t intellectuelle premi re partie n autorisant aux termes des alin as 2 et 3 de l article L 122 5 d une part que les copies ou reproductions strictement r serv es l usage priv du copiste et non destin es a une utilisation collective et d autre part que les analyses et les courtes citations dans un but d exemple et d illustration toute repr sentation ou reproduction int grale ou partielle faite sans le consentement de l auteur ou de ses ayants droit ou ayants cause est illicite alin a 1 de l article L 122 4 Cette repr sentation
6. 93 RSR ee eee a dainet 94 Recommandations et astuces pour les utilisateurs de AFC ccccecccseeceeeeceeeeeeeeeceeeeseeeeseueeseeveseueeseaneseas 94 Analyse en composantes principales LAC 96 Analyse canonique des correspondances ACC iii 97 OSEO OES sisri Re Oe oe CET ee ee eee eee 98 Trouver une sous structure cach e ica aient een 98 Estimer des effectifs efficaces inner 101 D finition de l effectif efficace d une population LL 101 M thodes de calcul de l effectif efficace des populations naturelles 102 D tection de goulots d HANOIBINENES isiscnceccuissiioniiisnacsnnastsabesancitnlousensalsalentionddiargrsandulecanbuediividesin 103 Table des mati res 331 Le cas Sp cial ARS alleles US eg ee 105 Presentation generale ccrti a cucda dees dvlecidcactcdneidlnescdeniadocdasecidelncecdneialectenetidseaton 105 D tecter la pr sence d all les nuls 105 Trucs et astuces pour tester la pr sence des all les nuls 106 Le cas tr s sp cial de la dominance des all les courts ccccccccececeeeeceecsteteeteeeeteteeeens 107 PO CO VUE O OUR ee aCe ee RenT Te ee ee ere eet ee nee te Te 107 Du point de vue pratique d tection de la dominance des all les courts 109 Eer dae SE AEA 111 2 APPLICATIONS DES EXEMPLES C ONCRET S ssi csissssiasssissswisinatiseuninasieciinatinsiea seenasslonskeutent 113 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 115 OR eat async EA E va enti 115
7. Analyse hi rarchique c ccccccccccccccceesccccccessesecccceseeeccesnsseeeeceseeeeecscsaeeececcsseeeeesseeeeseenneeeeeseeseeneess 223 Analyses intra et inter ferme iii 225 Homozygotie d s quilibre de liaison intra ferme et diff rentiation globale 225 Analyse des biais de dispersion sexe sp cifiques cccccccecccccseccccsseesceseeeecssseeeccsseeecesueeeetsateseneeens 226 Tests de pangamie iii 228 Recherche d un effet Wahlund iii 234 RS ph one es icone E E TN 234 FP ete tee arcana tise E eset aese antes neta cued races eres E E 236 Conclusion des analyses intra fermes 236 SOS DA OR ARR E OTe eee Ye SPT eee er 236 FEES E a a ni Di 239 Densit efficace et distance de dispersion parents descendants adultes 241 Recherche de la signature d un goulot d tranglement 0 0 ccc ccc etc tsetereneeenes 241 CTS NS sasecastseca search E TA atten EEEE E A oid 244 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 247 OO OR a a a EIE IEEE E E 247 A CS 0 D N E E 247 Le jeu de donn es brutes 2 nent 250 Tester l effet de la technique d isolement des souches 252 Creation d un fichier Fstat et MSA viveccascicisviondianinsacabeiabntbanenea btonabrinawetiaserabbtbhabenraveveabeimimestapeieibis 252 Analyse Fstat par paire de sous chantillons o oo ccccccccccccccceteccececccceteeeeeeecececestteseeeeeeeeestttsaeeseeeeees 253 OS Ui ENIN pac ea cca ects cn
8. R ponses aux questions 305 R ponse 9 Le crit re du baton bris ou broken stick Ce crit re a t d velopp en premier lieu par des cologistes soucieux de comparer la r partition des esp ces avec une r partition al atoire BARTON et Davin 1956 MACARTHUR 1957 pour les premiers Il fut ensuite adapt aux analyses en compo santes principales par FRONTIER 1976 Selon ce principe une quantit donn e 1 correspondant 100 de l information peut tre assimil e un b ton que l on peut subdiviser en S parties en y pratiquant S 1 coupures au hasard Si ces coupures se font au hasard on peut avoir n importe quelle longueur de ces diff rentes parties avec une probabilit d apparition qui doit suivre une loi uniforme Si on classe ces bouts de bois de la plus grande longueur la plus petite sous l hypoth se nulle la plus petite longueur possible sera de 1 S avec une probabilit d apparition de 1 5 La seconde plus petite sera de longueur 1 S 1 S 1 et pour une longueur quel conque on aura S j PU a 2 SSaJTl On obtient ainsi la liste par ordre d croissant des esp rances de la proportion de variance expliqu e par chaque axe sous lhypoth se nulle Par exemple sil y a 15 axes cela donne la suite 0 221 0 155 0 121 0 099 0 082 0 069 0 058 0 048 0 040 0 033 0 026 0 020 0 014 0 009 0 004 qui donne donc les proportions minimales partir desquelles les axes sont significatifs Ici
9. dire n impliquant pas les cellules de la lign e dite ger minale antonymique de germinal Sous dominance Processus s lectif au cours duquel les individus h t rozygotes un locus donn montrent une survie et ou un succ s reproducteur r duit Sous population Voir D me Spermatozoide Gam te m le Stepping stone model Voir Pas japonais Superdominance Voir Overdominance Taq polym rase Enzyme DNA polym rase extraite de l extr mophile Thermophilus aquaticus capable de synth tiser de l ADN tr s hautes temp ratures et utilis e pour les r ac tions de PCR Tore D finit la surface d une figure g om trique en trois dimensions ayant la forme d une bou e ou d un donut pour les plus gourmands TPM Two Phase Model Mod le de mutation combinant le KAM et le SMM avec une proportion variable de mutations g n r es par l un ou l autre des m canismes correspondants Transition Mutation ponctuelle consistant au remplacement d une purine par une autre purine A lt gt G ou d une pyrimidine par une autre pyrimidine C lt gt T antonymique de transversion Glossaire 323 Transversion Mutation ponctuelle consistant au remplacement d une purine par une pyrimidine ou d une pyrimidine par une purine A lt gt T A lt gt C G lt gt C G lt gt T antony mique de transition Underdominance Voir Sous dominance V g tative Mode de reproduction purement asexu e o
10. la moyenne quand toutes les sous populations sont fix es pour l un ou l autre des all les v rifier en r ponse 6 Dans le cas de deux all les cela veut dire qu on a p sous populations fix es pour allele 1 et 1 p pour le 2 Nous avons donc 0 2 p 0 16 a l 2 lA l Cette valeur est n cessairement toujours positive et correspond donc un d ficit en h t rozygotes d au fait que l on calcule le Frs en r unissant des individus qui n appartiennent pas aux m mes unit s On voit bien dans les quations 14 15 et 16 que si les sous populations partagent les m mes fr quences all liques variance nulle ce d ficit est nul pas de d viation par rapport Hardy Weinberg alors que dans les autres cas il est positif et ce d autant plus que les fr quences all liques diff rent entre sous populations jusqu une valeur maximale de 1 quand chaque sous population est fix e pour un des all les pr sents variance maximale On appelle ce ph nom ne l effet Wahlund WaHLuND 1928 c est dire le d ficit en h t rozygotes d la structuration de la population Ce d ficit en h t rozygotes correspond en fait au Fs de WRIGHT 1965 dont la formule en fonction des h t rozygoties et diversit s g niques NEI et CHESSER 1983 est la suivante Al zp fT o Hy correspond l h t rozygotie attendue si tous les individus de toutes les sous Bop 17 populations se croisaie
11. v rifier avec les quations 4 et 5 sinon allez voir la r ponse 3 C est ce qui se passe par exemple chez Taenia solium Kunz 2002 De Meets et al 2003 Si s est entre 0 et 1 il y aura un d ficit plus ou moins important d h t rozygotes Il est tr s important de noter que la m me signature de l autof condation est attendue tous les loci tudi s signature g nomique Le fait qu un organisme soit hermaphrodite et puisse s autof conder n implique pas n cessairement que ses populations ne soient pas panmictiques Par exemple en utilisant des marqueurs microsatellites HURTREZ BOUSS S et al 2004 ont trouv que les populations de la grande douve du foie Fasciola hepatica plathelminthe her maphrodite montraient des fr quences g notypiques conformes l attendu sous panmixie En panmixie on attend en effet que 1 N des zygotes produits le soient par autof condation RousseET 1996 Ce sont plut t les organismes sexes s par s qui ne sont jamais panmictiques enti rement les g nes contenus dans les femelles ne peuvent s associer qu ceux contenus dans les m les Ceci ma vraiment Concepts de base en g n tique des populations 37 d importance que dans les petites populations Chez les esp ces dioiques ou chez les hermaphrodites autoincompatibles on s attend d tecter des exc s d h t rozygotes par rapport l attendu sous les hypoth ses de Hardy Weinberg BALLoux 2004 Des exc s d h
12. De fait ayant fait moi m me partie d quipes de recherche fran aises avec des moyens modestes m me pour la France ce qui est tout dire j ai particip ce jour 10 05 2011 63 travaux de g n tique des populations empiriques donn es de terrain ayant fait l objet d une publication dans une revue dont 17 30 ont utilis des marqueurs isoenzymatiques Le reste des tudes ont utilis des marqueurs microsatellites qui en rapport qualit prix arrivent juste apr s les isoenzymes mon avis Il en r sulte que ce sont les deux types de marqueurs les plus souvent utilis s dans les tudes de g n tique des popu lations surtout les microsatellites maintenant car les allozymes sont aujourd hui plut t d pass s en g n ral et surtout ceux que je connais le mieux Cette derni re raison est sans doute celle qui rend le mieux compte de mon choix qui de toutes mani res na rien de r dhibitoire puisque la presque totalit des informations don n es dans ce manuel sont applicables tous les marqueurs codominants Pour avoir un aper u des autres techniques je ne peux qu encourager le lecteur consulter les revues existantes TAYLOR et al 1999 CATERINO et al 2000 SuUNNUCKs 2000 Boucnoux et al 2004 Les allozymes Les allozymes sont en fait des enzymes du m tabolisme de base des cellules comme la Glucose Phosphate Isom rase ou GPI qui intervient dans la glycolyse Pour visualiser de tels marqueur
13. Micro Checker permet galement d estimer si les donn es sont compatibles avec un b gaiement de la polymerase stuttering et ou une dominance des alleles les plus courts Pour la dominance des alleles courts nous utiliserons galement une m thode plus puissante que celle impl ment e par Micro Checker Nous allons proc der une r gression g n ralis e pour la mise en uvre de laquelle nous utiliserons le logiciel R voir la r f rence complete dans la bibliographie Convertir le fichier pour Micro Checker et ouverture du logiciel Pour commencer avec Micro Checker nous avons besoin de transformer nos donn es au format Genepop qui est compatible avec ce logiciel Ensuite nous allons devoir cr er un fichier sp cial pour les donn es du locus IROB li au sexe sans les m les car sinon Micro Checker risque de go ter moyennement la saveur de cette plaisanterie Cr ons donc un fichier IRO8AllFem txt avec les donn es femelles pour le seul locus IRO8 et un fichier RAutosomAll txt pour le reste des donn es Attention le fichier doit suivre des r gles strictes sinon Micro Checker refusera d analyser les donn es R f rez vous au fichier exemple fourni avec le logiciel et respectez les espaces et tabulations de la fa on la plus scrupuleuse ou utilisez Create Lancez Micro Checker et ouvrez IRAutosomAll txt avec le menu File Si tout se passe bien vous observez l ouverture de votre fichier avec v
14. Run et attendu la fin des permutations deux fichiers sont consulter IRTotBrutSexBias fst donne les Fs7 par paire et IRTotBrutSexBias pp pvl donne les P value du test de randomisation des g no types par paire de sous chantillons Dans ces fichiers il faut garder les valeurs La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 147 correspondant aux paires femelle m le de chaque site ann e Si vous faites cela deux probabilit s sont significatives sur les 12 tests 17 Un test binomial peut alors tre effectu sous R avec la commande suivante binomtest 2 12 p 0 05 alternative greater Le test est unilat ral car on regarde si le nombre 2 n est pas plus grand qu attendu sous l hypoth se nulle Le test donne une P value de 0 12 ce qui n est pas vraiment significatif mais t moigne d un signal possible Le test g n ralis entrepris avec MultiTest et un X 6 donne une P value globale seuil de 0 6015 La notice d utili sation de ce programme est suffisamment d taill e pour ne pas avoir reproduire ici un tuteurage pas pas Pour effectuer le v ritable test de structuration sexe sp cifique il faut remanier quelque peu le fichier initial des donn es afin de le mettre au format requis par Fstat pour l analyse du biais de dispersion sexe sp cifique Biased dispersal menu f rez vous l aide en ligne de Fstat pour construire ce fichier Nous allons nous R f
15. crire 1 2u 1 2m 2N 2N1 2u i 2m Ii 2u 1 2m En d veloppant nous obtenons 1 2m 2u 4um l 2m 2u 4um 21 2m 2u 4um Nous pouvons galement n gliger les termes en um devant 1 ce qui donne T 2m 2u 2N 2M1 2m 2ul 2 1 2m 2u Q ie 2m 24 2N 2Nt AN mi uj 2 1 2m 2u fe 2m 2u AN mt ul JE 2m 2u Nous allons maintenant consid rer que le taux de migration est faible cest le cas ici et le taux de mutation aussi Le taux de mutation moyen des microsatellites est en effet de l ordre de u 10 d apr s la litt rature sur cette question ELLEGREN 2000 Bazzoux et LuGoN MouLin 2002 ELLEGREN 2004 Si nous n gligeons les termes en u et m devant 1 nous obtenons pour Qs 1 Gi AN mt ult 2 74 Nous pouvons maintenant nous servir de ces valeurs d identit l quilibre pour calculer les Frs et Fr l quilibre mutation migration et d rive en utilisant l qua tion 21 du chapitre 2 de la premi re partie de ce manuel l O F Q Q AN m u 2 1 Qs 1 l 4N m ul 2 0 P Qs Qr AN mt ul 2 1 Q 1 0 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 273 ce qui donne l E AN mi ult 2 Is 4 mi u ES AN mi ul 2 F l A m ult 2 Et finalement 2 Er m ul 1 75 l E 4Nm ut 2 Nous retrouvons la fameuse quation Fs7 Fys 1 Fis A partir de la nous pou vons extraire NV et m des valeurs
16. d identit entre d mes sera une fonction d croissante de la distance entre d mes On voit donc bien que puisque Qr se trouve au num rateur mais aussi au d nominateur du F7 la relation entre Fsr et la distance g ographique ne peut pas tre lin aire Par contre comme on peut le voir le rapport Fs7 1 Fs7 ne subit pas ce probl me en effet 88 Initiation la g n tique des populations naturelles Fs l Q l Q Qs Qr 51 l F J Qs Qr 1 Qr Qst Qr 1 Q l Q l Qr A partir de l deux cas de figures sont distinguer en fonction du sch ma de dis persion des organismes tudi s ind pendamment du plan d chantillonnage qui peut suivre un trac en une ou deux dimensions Les sous chantillons sont align s en une seule dimension Certains organismes sont susceptibles de se distribuer en une seule dimension et seront donc chantillonn s comme tels C est typiquement ce qui se passe pour des organismes c tiers comme des bivalves moules des cirrip des balanes et anatifs des patelles des algues fucus v siculeux laminaires ou les organismes vivant le long des cours d eau mouches ts ts lymn es La matrice des distances par paire de sous chantillons est alors compar e celle des 0 1 0 car c est bien l estima teur non biais de Weir et Cockerham qu il faut utiliser Si le test de Mantel est significatif on peut alors utiliser la pente de la droite de r gression du F5
17. expliquent qu une faible partie des d ficits en h t rozygotes observ s Leffet Wahlund explique probablement la majeure partie des d ficits Il provient de deux causes La premi re est inh rente aux syst mes d isolement par la distance d une nature plus ou moins continue et de la nature n cessairement discr te du pi geage des ts ts La seconde raison qui d pend de Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 209 Tableau 29 Estimation des densit s en mouches par m et de la dispersion des glossines en m le long du Mouhoun et moyenn es sur l ensemble des m thodes All Les valeurs correspondantes obtenues par MRR MRR sont galement fournies d apr s BOUYER et al 2009 Site Co A 710277 0 033 1153 H 31210986 0 128 493 C 39 936 102 0 036 1053 D 30 413 625 0 086 596 All 29 02 421 0 071 574 MRR 02 1 245 2 392 la premi re provient de la mauvaise correspondance entre dispersion trophique plus large et dispersion reproductrice accouplements et larvipositions plus restreinte homing Cette information est capitale si nous parvenons un jour d terminer avec pr cision les micro conditions cologiques qui poussent les ts ts revenir se reproduire et larviposer l endroit o elles ont merg Il reste aussi d terminer quelle influence la densit comp tition a sur la dispersion de reproduction afin d valuer si nos estima tions restent valable
18. les populations de bois sont elles plus structur es que celles de pr ou plus pamictiques etc Ce peut galement tre le cas pour comparer des parasites trouv s sur des esp ces h tes diff rentes Les proc dures suivent toujours la m me philosophie Ici le param tre d int r t est moyenn sur l ensemble des sous chantillons de chaque cat gorie Soit x cette valeur moyenne pour les sous chan tillons du groupe 7 Pour un test unilat ral avec deux groupes on calcule juste la diff rence x x2 x tant la plus grande Pour les autres cas de figure la statistique utilis e sera ng 1 ng ls x x 57 x Al geal ou ng repr sente le nombre de groupes 4 comparer Ensuite les chantillons de chaque groupe sont randomis s permutations al atoires des chantillons dans les diff rents groupes en gardant le nombre d chantillon par groupe constant un grand nombre de fois 10 000 et la statistique x1 x2 ou celle d finie en 57 est recalcul e pour chaque randomisation La valeur observ e est ensuite compar e a la distribution des valeurs obtenues par randomisation la P value du test correspondant encore une fois a la proportion de fois quune valeur aussi grande ou plus grande a t observ e au cours des randomisations Cette pro c dure est impl ment e dans Fstat menu Comparison among groups Comme pr c demment l chantillonnage peut ne pas permettre de proc der ce test s
19. population genetics software for exact tests and ecumenicism Hered 86 248 249 Raymond M Rousset E 2003 GENEPOP version 3 4 population genetics software for exact tests and ecumenicism updated from Raymond et Rousset 1995b RAZAKANDRAINIBE F G Durand P KOELLA J C DE Mre s T Rousser E Avara E J RENAUD E 2005 Clonal population structure of the malaria agent Plasmodium falciparum in high infection regions Proc Natl Acad Sci USA 102 17388 17393 R Development core team 2011 R A Language and Environment for Statistical Computing Jn R Foundation for Statistical Computing Vienna Austria http www R project org ISBN 3 90005 1 07 0 Rice W R 1989 Analyzing tables of statistical tests Evolution 43 223 225 RicHTER D Postic D SERTOUR N Live 1 MATUSCHKA F R BARANTON G 2006 Delineation of Borrelia burgdorferi sensu lato species by multilocus sequence analysis and confirmation of the delineation of Borrelia spielmanii sp nov Int J Syst Evol Microbiol 56 873 881 Riptey M 1996 Evolution Second Edition Cambridge Massachusetts Blackwell Science Inc ROBERITSON A Hitt W G 1984 Deviations from Hardy Weinberg proportions sampling vari ances and usent in estimation of inbreeding coef ficients Genetics 107 713 718 Roperick G K 1996 Geographic structure of insect populations gene flow phylogeography an
20. tre test que sous chantillon par sous chantillon manque de puissance que la plupart des all les se suivent 4 un pas sur ce locus et compte tenu de ce que nous trouvons aux autres loci il est possible qu ici aussi les d ficits observ s proviennent d un probl me technique Je peux ajouter ici qu un module package de R appel R Commander dont je n ai appris l existence qu apr s la r daction de ce chapitre permet d acc der aux analyses effectu es dans ce paragraphe l aide de menus d roulants plus conviviaux que le mode commande strict 134 Initiation la g n tique des populations naturelles RECHERCHE D UNE STRUCTURE CACHEE EFFET WAHLUND Introduction Nous allons dans un premier temps continuer de consid rer les femelles et les m les s par ment On sait en effet qu il y a une structure g n tique sp cifique pour chaque sexe dans ce jeu de donn es M me si nous analyserons ceci plus tard il n est pas inutile de poursuivre la recherche d explications des d ficits en h t rozygotes avant d aborder cet aspect Nous allons donc analyser tous les sous chantillons m les et femelles s par es pour obtenir l information sur le plus grand nombre de r plicas possibles Ensuite nous nous concentrerons sur 1996 en r unissant les m les et les femelles pour faire des tests Le but du jeu sera ici d utiliser l information multilocus de chaque individu dans chaque sous chantillon afin de
21. un change de portions plus ou moins grandes et en principe de m mes tailles des chro mosomes homologues pr c dant la formation des gam tes et r sultant en un r as sortiment ou recombinaison intra chromosomique D me Unit d mographique d individus appartenant la m me unit de reproduction ou partageant les m mes param tres de r gulation d mographique par exemple entre lesquels la comp tition intra sp cifique est maximale synonyme de sous population D rive g n tique D crit le processus par lequel les fr quences all liques changent d une g n ration l autre cause d un chantillonnage al atoire des individus gam tes zygotes adultes devant survivre pour participer la reproduction de la g n ration suivante dans une population de taille finie D s quilibre de liaison Exprime une association non al atoire entre diff rents loci souvent pris par paire Beaucoup de facteurs diff rents peuvent influencer le d s quilibre de liaison struc ture de la population syst me de reproduction s lection etc D viance Terme utilis en r gression lin aire g n ralis e GLiM qui d crit la dispersion de r sidus autour des valeurs attendues d finies par le mod le Consulter des ouvrages sp cialis s pour des d finitions plus strictes Dioique Synonyme de gonochorique terme un peu d suet aujourd hui et signifiant que Pesp ce tudi e est s par e en deux sexes
22. un individu donne naissance plusieurs autres individus par simple division mitose ou scissiparit Vigueur hybride Voir H t rosis Voisinage Mod le en Voir Neighbourhood model Wahlund Effet Diminution de l h t rozygotie observ e que produit le m lange dans un m me chantillon d individus h t rog nes g n tiquement Zygote R sultat de la fusion de deux gam tes Le terme uf est aussi parfois usit 324 Initiation la g n tique des populations naturelles n Nexe Tableau 1 Liste des logiciels cit s et ou utilis s leur lien pour t l chargement et r f rences bibliographiques quand elles existent Tableau 1 suite Tableau 2 Les diff rents types d analyses trait es dans ce manuel description th orique telle que d crite dans la partie I Th orie logiciel utilis et application dans la partie II Exemple Excel indique que le test peut tre effectu dans une feuille de calcul de type Excel Analyse D s quilibre de liaison Identifier les tests significatifs ajuster une s rie de tests au seuil Bonferroni Hardy Weinberg dans les sous chantillons Calcul d intervalles de confiance des F All les nuls et stuttering All les nuls et r gression All les nuls et autof condation Ajuster une proportion attendue test binomial exact Dominance des all les courts Structure Panmixie cach e effet Avec autof condation Wahlund
23. une augmentation de PAIC par rapport au pr c dent Ci dessous sont pr sent s le d but et la fin du processus Start AlC 343 61 Bba Sex Site Year Sex Site Sex Year Df Deviance AIC Sex Site Year 4 302 69 338 69 lt none gt 299 81 343 81 Step AIC 338 69 Bba Sex Site Year Sex Site Sex Year Df Deviance AIC Sex Site 1 312 31 334 31 Sex Year 1 303 51 337 51 lt none gt 302 69 338 69 etc Step AlC 332 1 Bba Site Year Df Deviance AIC lt none gt 314 10 332 10 Year 1 322 96 338 96 Site 7 345 43 349 43 Call glm formula Bba Site Year family data data Sex Site Year binomial link logit La derni re ligne pr sent e ci dessus donne le meilleur mod le Suivent des informa tions sur les coefficients associ s aux diff rents facteurs que nous rallons pas utiliser ainsi que des messages d alertes sur la mauvaise qualit des donn es on ne fait pas de miracles Il s agit maintenant d analyser en d tail ce meilleur mod le avec la s rie d instructions pour gagner du temps on peut copier le mod le ci dessus et le coller apr s avoir tap Bba2 lt gt Bba2 lt glm formula Bba Site Year family binomal link logit data data gt anova Bba2 test Chi qui renvoie au r sultat Analysis of Deviance Table Model binomial link logit 172 Initiation la g n tique des populations naturelles Response Bba
24. 119119 233233 1281287 StaaS9sn 177177 000000 1235123 246250 gt 1301399 Staa9SM 170170 148148 123123 250250 14014097 Staa9SM ooo000 gt 146146 119119 2332335 1291319 StaaSSM 178178 gt 153153 119119 gt 235235 gt 13513597 StaagSsM 183183 gt 142144 gt 119119 254254 1351357 StaaSSM 173173 144144 119123 243243 1251364 StaaSsSM 170170 gt 152152 119119 450250 13113497 SteaaSsSa 174174 gt 151151 119119 233233 gt 1251424 StaagsSM 168168 gt 134134 119119 233233 1291424 StaaSsM 174174 gt 145147 119119 233233 1281424 StaagSM 166166 145145 119119 233233 1281349 StaaSsn 174174 000000 117119 000000 1421424 StaaSSM 171171 137137 123123 236236 1261354 StaaSsn 173173 gt 134149 119123 243243 13013397 StaaSS5a 171171 134134 123123 250250 1261339 Staag5M 179179 gt 134134 121121 243243 12514297 StaagsM 169169 O00000 119119 235235 1301319 Figure 26 Format de fichier pour BAPS pour les tiques males du Staadswald en 1995 Le locus IRO8 est cod homozygote chez les m les et cr ez un fichier en tapant son nom et en le placant dans le r pertoire qui vous convient le mieux la o sont vos donn es voir fig 27 Il vaut mieux
25. 170 1702 170 170 170 170 1702 1702 1702 1702 1708 1702 1702 1702 1702 170Z 1702 1742 1702 1702 1702 170 Er Extrait du fichier de donn es de Trypanosoma brucei En ligne figurent les diff rents isolats comme d habitude Les deux premi res colonnes donnent les coordonn es GPS des patients pour Bonon 2000 seulement suivent le nom de l isolat le pays le foyer la m thode d isolement des souches et les huit loci microsatellites sur lesquels ces isolats ont t g notyp s G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 251 colonne Somme o je fais la somme de tous les all les de tous les loci pour chaque isolat et je trie le tableau en fonction de Somme Je cr e une nouvelle colonne Td avec une fonction qui marque 1 quand dans la colonne Somme plusieurs chiffres qui se suivent sont gaux Si la colonne Somme correspond la colonne P de Excel alors tapez SI P3 P4 1 en ligne 3 deuxi me isolat de la colonne Id et copier cette cellule et la coller sur toutes celles du dessous Je cr e enfin une colonne MLG o je num rote dans l ordre les g notypes en mettant le m me chiffre pour ceux qui se r p tent en m aidant de la colonne Id mais en prenant garde que l identit de la somme r sulte bien d une identit multilocus J ai enregis tr ce fichier sous le nom TrypanoBrucei otDataGPS txt o je va
26. 2 In Puo Puer ce qui peut s crire cf page 736 et Box 17 6 dans SoKAL et Rou Lg 1981 G 2Nip hON p 2Nig MONg 2Nop2 In 2Nop2 2N g In Naq 2N In 2N 2N MON EN p 2Mp2 MO2Nip 2Nop2 2N 2N5q2 hON g 2N q 2N In W Cette quantit poss de des propri t s additives ce qui signifie que les diff rents G calcul s pour diff rents loci peuvent s additionner permettant ainsi d obtenir un G global offrant donc la possibilit d un test global R ponse 8 D tails du test de Mantel Soit M et M deux matrices de distances entre les m mes paires d objets m ml ml ml m2 m2 M2 My ml ml ml m2 m2 m2 M 22 gt et M 22 iy 24 M13 M134 MZ M234 ml M2 44 Une mesure de la corr lation entre ces deux matrices peut par exemple tre fournie par Z ml m2 ij Z peut alors tre utilis comme statistique du test de Mantel Il s agit de randomiser un grand nombre de fois 10 pour Genepop les objets contenus dans une des deux matrices en mesurant le Z entre la matrice randomis e et l autre matrice non ran domis e pour chaque randomisation La valeur observ e du Z peut ensuite tre compar e la distribution des Z randomis s D autres statistiques telles que le classique coefficient de corr lation de Pearson ou comme dans Genepop le coeffi cient de corr lation de rang de Spearman peuvent galement tre utilis es la place du Z pour le test de Mantel
27. 338719 2 185195 186192 x 197197 GO 1 pop 2 1241725 338719 185165 196196 197197 169 pop 1241967 338750 DO0000G x 194194 197197 169 pop 1241967 339750 179179 186192 197197 183 popi B 1241967 338750 179105 192192 197197 169 popil 370i OET FIATA m 701 TO 1 0 8 1 Old nie nine En 160 in di Ww FO ji D 0 ian EN amp Ci Figure 56 Extrait du fichier des donn es recod es pour le site A avec les coordonn es GPS des pi ges pour l analyse d isolement par la distance entre individus Chaque individu est s par des autres par un pop et cod par sa longitude puis latitude une et les g notypes aux loci microsatellites Les males seulement en A sont cod s homozygotes pour les loci li s a PX indiqu par un X dans le nom du locus fonction de l ordinateur le processus Markovien prend plus ou moins de temps Le programme vous demande te taper Return soit Entr e Le r sultat est disponible dans A txt ISO On fait de m me avec H C et D Pour changer de fichier de donn es il faut taper C dans le menu g n ral de Genepop Ne soyez pas tonn s si partir de H le test de Mantel d marre sans vous demander votre avis C est comme a C est Genepop Vous vous apercevez que le calcul ne se fait pas pour D En fait cela ne se termine jamais car il y a un probl me dans le fichier et un bug dans Genepop Ouvrez D txt Il faut supprimer
28. C est galement ainsi que le sexe est d termin chez les schistosomes Hirai et LOVERDE 1995 Chez certaines esp ces de n matodes SNABEL et al 2000 chez la plupart des tiques des genres Dermacentor Amblyomma et Rhipicephalus et l esp ce Ixodes holocyclus Kiszewsxi et al 2001 ainsi que chez certains pucerons CAILLAUD ef al 2002 le syst me est du type XX femelles et XO males Dans ces cas ces loci sont tout de m me utilisables en ce qui concerne les tudes de diff renciation ou de diversit g nique selon le logiciel d analyse on les code homozygotes sauf pour l estimation de Fx pour laquelle les donn es ces loci doivent bien videmment tre limin es cod es en donn es manquantes C est ce qui a t fait pour la tique Ixodes ricinus DE MeEEts et al 2002a ou pour les Concepts de base en g n tique des populations 61 mouches ts ts CAMARA et al 2006 Ravet ef al 2007 Il est cependant clair que ce nest pas id al et l utilisation de loci autosomaux devrait id alement tre favoris e Le probleme de l homoplasie Comme nous l avons d j vu les marqueurs g n tiques polymorphes dont nous avons besoin pour analyser nos populations naturelles correspondent rarement des loci nombre infini d all les C est par exemple le cas des allozymes pour lesquels un grand nombre de mutations diff rentes sont confondues dans un seul all le C est aussi vrai pour les microsatel
29. I Ena ihe Aaga Moi ha each Loos aa Massena Epc Uranuel Confidence GX Hes Populaler Abele riens Ces LE FER Figure 23 Sortie de MicroChecker vous indiquant pour le locus et le sous chantillon mentionn la pr sence ou non de probl mes La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 127 Bilan des analyses avec Micro Checker Nous avons constitu un fichier de r sultats avec les fr quences d all les nuls probables l existence ou non de stuttering et de dominance d all les courts Nous ne gardons que la m thode 2 de BROOKFIELD 1996 qui tient compte des donn es manquantes blancs comme des homozygotes nul nul Dans ce fichier nous allons galement ins rer le nombre d individus g notyp s pour chaque locus copi s partir des fichiers de sortie Fstat la fr quence attendue sous panmixie fr quence pr c dente au carr des alleles nuls pour chaque locus dans chaque sous chantillon et sur l ensemble des sous chantillons le nombre de blancs observ s compter les 000000 dans chaque sous chantillon et sur l ensemble l effectif corrig individus g notyp s blancs et enfin le nombre de blancs attendus sous la double hypoth se qu il y a panmixie et que les all les nuls expliquent les Fys en totalit Le tableau 8 donne un aper u du fichier final pour le locus IROS Tableau 8 Synth se des r sultats de Micro Checker pour le locus IRO8 chez les femelles
30. LegLois et al 2003 et Lesiots et al 2004 peut tre r gress contre les distances entre individus directe pour une dimension en Log pour deux dimensions ce qui conduit aux m mes possibilit s d inf rences que celles d crites ci dessus WATTS et al 2007 proposent une statistique e en principe plus puissante lorsque le voisinage 4Do ou 47Do7 est grand Nous verrons cela plus en d tail dans la partie pratique de ce manuel Dans le cas particulier de deux dimensions ROUSSET 1997 montre que le nombre d immigrants pr sents dans un sous chantillon peut directement tre tir de la pente de la r gression F7 1 Fs7 a bLn De Nm 1 2xb Autres distances On peut souhaiter v rifier si la diff renciation entre sites est corr l e une diff rence cologique entre sites ou tester s il existe une corr lation entre diff renciation g n tique des sous chantillons des h tes et des parasites qui les infestent Comme nous Pavons vu pr c demment le Fs7 a t d fini dans le cadre d un mod le en les De fait il ne se comporte pas id alement par paire de populations fortes variances voir BaLLoux et GOUDET 2002 et on lui pr f rera d autres mesures pour les tests de Mantel telles que la distance harmonique chord distance de Cavalli Sforza et Edwards CAVALLI SFORZA et Epwarps 1967 ou la distance d all les partag s sha red allelic distance Bowcockx et al 1994 d j discut en
31. NJTree sur distances harmoniques de CAVALLI SFORZA et Epwarps 1967 est une bonne solution La matrice est obtenue en important TIRTotBAPSClustMalHomoMFSep txt dans Genetix en cliquant sur le menu Distances puis Sur donn es r elles et en s lectionnant Cavalli Sforza amp Edwards On copie la matrice obtenue afin de l incorporer dans un fichier de type MEGA Kumar et al 2004 pour matrice de distances ouvrir le fichier IRTotBAPSClustMalHomoForNJTREENmini3CSE meg avec un diteur de texte pour voir un exemple Afin de limiter le nombre de branches et le poids des clusters ne contenant qu un seul ou deux individus je n ai gard que les clusters d au moins 3 individus L arbre obtenu n en est pas plus lisible pour autant et ce qui en ressort c est que les plus longues branches sont toujours celles s parant les clusters sans que se d gage une quelconque hi rarchie on parle de r teau Ceci plaide davantage en faveur d une micro structuration locale forte avec une diff renciation g ographique faible On peut alors recommencer l ensemble des op ra tions BAPS gt Genetix gt MEGA sur les chantillons de 1996 seuls et en ne s parant pas les m les des femelles Sur l arbre obtenu on ne voit pas mieux une quelconque structure sauf que les clusters tunisiens de plus de deux individus se retrouvent bien ensemble fig 32 avec un cluster du Tessin Cen16 qui comporte d ailleurs deux m les et une
32. Nous pouvons remarquer que le Fs est n gatif ce qui est normal puisque nous avons des sexes s par s Ensuite on a un fort F7 et un F77 beaucoup moins fort comme pr vu mais cependant beaucoup plus important que celui observ entre zones pour nos donn es r elles de ts ts Nous allons refaire un fichier HierFstat en prenant deux zones adjacentes sous populations 5 15 25 35 45 55 Zone 1 et 65 75 85 95 105 115 Zone 2 Zone Sous pop nd Total 0 08133683 0 2849453 0 27293947 Zone 0 00000000 0 2216356 0 20856680 Souspop 0 00000000 0 0000000 0 01679012 On diminue certes de beaucoup le F77 mais pas autant que celui avec les sous groupes d finis par BAPS Les clusters BAPS ne sont donc sans doute pas tr s au point Il reste d ailleurs un F7 gt 0 dans les clusters au lieu d un exc s Il se peut donc que d une part un effet Wahlund combin des all les nuls ainsi qu un isolement encore trop r cent entre zones expliquent le manque de diff renciation observ entre zones alors que l on sait que les passages de mouches d une zone l autre sont quasi impossibles en principe En fait une analyse HierFstat en prenant les pi ges comme sous populations donne Zone Trap nd Total 0 01689790 0 07207679 0 2306512 Zone 0 00000000 0 05612733 0 2174274 Trap 0 00000000 0 00000000 0 1708918 La diff renciation entre sous chantillons pi ges est fortement diminu e par rap port l attendu selon le mod l
33. Sample 8 3 1604 188 18 0536 4 1609 00001339 7 3 Year 1 0 2995 187 17 1540 3 1550 0 07 73192 Signif codes Q Q 001 0 01 0 05 O 1 1 Ici on voit que seul le sous chantillon influence la valeur du Fy all les nuls stuttering variable dans l espace qui n explique que 14 63 de la dispersion 1001 3 1604 21 616 tout en tant tr s significatif On utilise un test F car on a suppos que la distribution des Frs suit plus ou moins une courbe de Gauss donn es continues en cloche sym trique ce qui est s rement inexact mais ne risque gu re de modifier le r sultat dans un sens dramatique Pour les loci suivants nous aurons besoin de distinguer le sexe des tiques Entre temps j ai d couvert l existence du Package R Commander ou Remdr qui en quelques clics de souris permet d effectuer ces commandes automatiquement La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 131 Avec le locus IR25 l analyse du fichier IRTotSexSepFisAllSizeL25 txt est la suivante gt data lt read table IRTotFisAl SizelL25 txt header TRUE gt attach data gt loc25 lt gl mdata formula Fis poly Allele 2 Site Year Sex family gaussian weights Npq gt anova loc25 test F Ce qui aboutit au tableau de r sultat Df Deviance Resid Df Resid Dev F Pr gt F NULL 326 60 844 pol y Allele 2 2 0 123 324 60 721 0 3420 0 71062 Sample 8 3 729 316 56 992 2 591
34. Vet Res 37 633 645 Bowcock A M RUIZLINARES A TOMFOHRDE J Mincu E Kipp J R Cavatii Srorza L L 1994 High resolution of human evolutionary trees with polymorphic microsatellites Nature 368 455 457 BRENIERE S E BARNAB C BossENo M E TIBAYRENC M 2003 Impact of number of isoen zyme loci on the robustness of intraspecific phylog enies using multilocus enzyme electrophoresis consequences for typing of Trypanosoma cruzi Parasitology 127 273 281 BROOKFIELD J E Y 1996 A simple new method for estimating null allele frequency from heterozy gote deficiency Mol Ecol 5 453 455 Brown A H D FELDMAN M W Nevo E 1980 Multilocus structure of natural populations of Hordeum spontaneum Genetics 96 523 536 Brun R Hecker H Lun Z R 1998 Trypanosoma evansi and T equiperdum distribution biology treatment and phylogenetic relationship a review Vet Parasitol 79 95 107 Cantaup M C Boutin M BRAENDLE C SIMON J C 2002 A sex linked locus controls wing polymorphism in males of the pea aphid Acyrthosiphon pisum Harris Heredity 89 346 HA Camara M Kara D KAGBADOUNO M SANON J R QUENDENO P Sorano P 2005 La trypa nosomose humaine africaine en zone de mangrove en Guin e caract ristiques pid miologiques et cliniques de deux foyers voisins Med Trop 65 155 161 Camara M HARLING Caro RiaNo H RAVEL S DuJaRD
35. ___DE HARDY WEINBERG La population est de taille finie Prenons un exemple extr me d une population de taille 2 Admettons qu la g n ra tion 0 les deux individus sont h t rozygotes 1 2 La fr quence des deux all les est donc 2 Ils fabriquent des gam tes qui se rencontrent au hasard pour former 4 1 2 et de zygotes 1 1 1 2 et 2 2 respectivement nous consid rons ici un cas o le nombre de zygotes produit est tr s grand Il faut reconstituer partir de ces zygotes une population d adultes de taille 2 ph nom ne d mographique appel r gulation Jai A de choisir au hasard deux 1 1 2 4 2 d avoir un 1 1 et un 1 2 4 d avoir deux 1 2 2 44 de choisir un 1 1 et un 2 2 2 42 44 d avoir un 1 2 et un 2 2 et 4 d avoir deux 2 2 Ce qui veut dire qu la g n ration suivante j ai 5 8 chances d obtenir une configuration avec des fr quences all liques diff rentes de celles de la g n ration 0 et dans 8 cas de fixer d finitivement la population en 11 ou en 22 C est ce que l on appelle la d rive g n tique Dans une population de taille finie le hasard modifie les fr quences all liques d une g n ration l autre Ceci veut dire que sil ny avait rien d autre mutation migration s lection aucun polymorphisme aucun locus ne pourrait se maintenir dans les populations naturelles Notons que le ph nom ne est d autant plus rapide que les populations sont de petites tailles
36. autres alors que le reste est conforme l attendu sous panmixie Un tel r sultat sera difficile interpr ter biologiquement Ensuite ce test n est r alisable que dans chaque sous chantillon et pour chaque locus s par ment Il my a pas de test global possible et on se retrouve oblig de g rer une multitude de P values exactes certes mais en addition du premier probl me bien difficile exploiter en termes d inf rence biologique M thode de Rousset et RAYMOND 1995 Dans le logiciel Genepop ce n est pas fde WEIR et COCKERHAM 1984 mais c est un analogue de l estimateur de ROBERTSON et Hix 1984 qui est utilis comme statistique pour effectuer le test Comme nous l avons d j voqu cet estimateur est biais mais montre des variances en g n ral plus faibles pour des valeurs faibles Les deux techniques convergent dans la plupart des situations et les diff rences obte nues ne concernent en g n ral que les r sultats un locus dans un ou quelques sous chantillons et mont donc que tr s rarement une cons quence interpr tative ou inf rentielle importante Par cons quent les deux proc dures donnent presque toujours des r sultats comparables Tester la pangamie Tous les tests d crits pr c demment ne sont en fait que des approches indirectes puisque ce nest que la cons quence de la rencontre al atoire des gam tes qui est Tests statistiques 77 test e mais pas cette rencontre 4 pro
37. dire que l information port e par chacun de ces loci est suppos e ind pendante Un d s quilibre de liaison fort risquerait d apporter une redondance forte conduisant un risque d erreur de d cision En fait l ind pendance des loci ne peut tre certaine que si les populations chantillonn es sont de tailles infinies panmictiques et non structur es et ce depuis un grand nombre de g n rations ce qui n est videmment jamais le cas Il y a donc toujours liaison Le principal est que cette liaison ne nuise pas trop a la d tection du signal recherch Le reste est laiss l appr ciation de chacun mais fort heureusement ces tests sont individuellement peu puissants et les proc dures qui y sont le plus souvent associ es Bonferroni rendent la d tection de tels d s quilibres peu fr quente De ma propre exp rience sur les populations clo nales d s quilibres de liaison forts totaux c est plus une diminution de puissance des tests de diff renciation en particulier qu une augmentation qu il faut attendre augmentation des variances d estimation comme cela peut tre illustr par les immenses intervalles de confiance de Fs obtenus par bootstrap sur les loci chez la levure opportuniste Candida albicans voir la figure 1 dans N BAvI et al 2006 LE PROBLEME DES TESTS REPETES Comme nous l avons d j vu le but d un test statistique est d valuer la probabilit avec laquelle le hasard permet d explique
38. inoculation de rongeurs de laboratoire IR par du sang conta min trypomastigotes sanguins peu efficace eu gard au manque de virulence des Tbg1 chez les rongeurs JAMONNEAU et al 2003 la culture in vitro avec le kit d isolation in vitro KIVI beaucoup plus efficace JAMONNEAU et al 2003 ou enfin partir des liquides biologiques sang lymphe des ganglions ou liquide c phalora chidien directement Ici ce sont des extraits directs de sang ou BS blood samples qui ont t compar s aux deux autres Dans ce chapitre nous allons revisiter pas pas les donn es de l article de Korr1 et al 2009 afin d explorer le syst me de reproduction de ce pathog ne tester le biais occasionn par les diff rentes m thodes d isolement estimer la taille de ses G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 249 Bamako BURKINA FASO GUINEE COTE D IVOIRE Bonon LIBERIA Monrovia Abidjan Oc an atlantique Figure 82 Localisation g ographique des foyers de THA tudi s marqu s d une toile populations dans chaque foyer et le nombre de migrants sur un chantillon de 90 souches pr lev es en C te d Ivoire dans le foyer de Bonon et en Guin e dans les foyers de Boffa et Dubr ka fig 82 sur une p riode allant de 1998 2004 Le Jou __DE DONN ES BRUTES Les informations g n rales concernant les donn es sont pr sent es dans le tableau 34 Les
39. l PARENTE M PHYLIP l MSVAR M TMVP l PASOS l SPAGEDI l STRUCTURE l MICROCHECKER l PEDAPP l TFPGA F COLONISE l IDENTIX l PROBMAX3 l FDIST2 l ML RELATE l WHICHPARENTS l NEWHYBRIDS WHICHLOCI l BOTTLENECK Deselect All Select All Output Folder D thierry BouquinGenetPop TP DataTsetseMouhoun Change Output Filename TsetseMouhouMalHomo Back CREATE Figure 54 Second menu de Create pour convertir les donn es en format Fstat et Genepop 194 Initiation a la g n tique des populations naturelles et qui risquent de g n rer des probl mes ensuite Ne gardez que la premi re colonne de ces fichiers qui correspond l identifiant des sous populations PREMI RES ANALYSES IND PENDANCE ENTRE ALL LES DANS ET ENTRE LOCI D s quilibres de liaison au sein des quatre zones Lancez Fstat et chargez le fichier setseMouhouMalHomo Testez les d s qui libres de liaison en demandant le test for each pair of loci in each population et au nominal level 1 100 afin d avoir assez de pr cision Dans le fichier de sortie correspondant nous constatons que seul un test est significatif entre les loci 1 et 2 c est dire entre PgpX11 et PgpX13 avec une P value 0 0044 Cette P value ne reste pas significative apr s correction de Bonferroni 0 00441 21 0 09 et un test significatif sur 21 repr sente environ 5 des tests ce qui est la proportion attendue sous l hypoth se nulle Avec la proc dure binom
40. la figure 25 montre que la relation augmentation globale du Frs avec la taille des all les n est pas compatible avec une dominance des all les courts On peut donc attribuer ce r sultat au hasard et au nombre de tests effec tu s qui augmente la probabilit d obtenir quelque chose de significatif par La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 133 hasard revoir la premi re partie de ce manuel p 82 87 Rappelons que pour ce locus les all les nuls s taient av r s suffisants pour expliquer les d ficits en h t rozygotes observ s Il est plus raisonnable ici de consid rer ce r sultat comme fortuit 110 120 130 140 150 160 Taille des all les Figure 25 Relation entre F et la taille des all les au locus IR39 sur l ensemble des chantillons Les intervalles de confiance 95 ont t obtenus comme pr c demment Les sous chantillons de moins de quatre individus ont t associ s au plus proche Bilan de l analyse des d ficits locaux en h t rozygotes Pour les loci IRO8 et IR39 les all les nuls semblent pouvoir expliquer les forts et variables F observ s Pour IR27 les all les nuls et la dominance des all les courts offrent conjointement une explication satisfaisante Seul le locus IR32 offre des d ficits normes et non expliqu s par les all les nuls le stuttering ou la domi nance des alleles courts Cependant sachant que le stuttering ma pu
41. les plus rares pond ration par 1 p4 Les estimateurs de Weir et Cockerham sont non biais s mais sujets une variance importante alors que ceux de Robertson et Hill sont biais s mais beaucoup moins variables pour de faibles valeurs des F Rousset et RAYMOND 1995 RAUFASTE et BONHOMME 2000 ce qui leur conf re un avantage statistique certain voir plus loin Les estimations multilocus tiennent galement compte du polymorphisme des loci les plus polymorphes auront en principe le plus de poids et du nombre d individus g notyp s par toujours le m me nombre par locus de m me que les estimations multi chantillons pour le F5 Mesures de diff renciation g n tique alternatives au Fsr Les R Statistiques Dans le cas des microsatellites si la mutation suit strictement un SMM voir p 32 il peut alors tre plus appropri d utiliser des mesures qui tiennent compte de la taille des all les Pour valuer la diff renciation entre sous populations SLATKIN 1995 a propos le Ry dont la mesure tient compte de la taille des all les des all les de taille proche ayant plus de chances d avoir un anc tre commun proche Ces statistiques sont estim es d une fa on quivalente aux estimateurs de WEIR et COCKERHAM 1984 sauf que ce sont les tailles des all les et non leurs fr quences qui sont utilis es SLATKIN 1995 Rousset 1996 MicHALAKIs et EXCOFFIER 1996 Le m me principe peut tre appliqu au Fy Rous
42. n tique des populations peuvent apporter une solution tr s efficace Le jeu de donn es concerne des chantillons de Gpg pr lev es dans quatre zones le long de la rivi re Mouhoun fig 52 PREMIER RECODAGE DES DONN ES Les donn es brutes se pr sentent comme dans le tableau 23 La premi re colonne indique le site de pr l vement A H C ou D comme dans la figure 52 Les deu xi me et troisi me colonnes correspondent aux coordonn es GPS des pi ges suivies du nom du pi ge en quatri me colonne du sexe et du nom des individus glossines g notyp s en colonnes cinq et six respectivement Suivent les g notypes des all les aux sept loci tudi s avec une colonne par all le et donc 14 colonnes colonnes 7 21 Vous remarquerez que les loci li s l X poss dent cette lettre dans leur nom comme pour PgpX11 par exemple et que les m les ont t cod s homozygotes pour ces loci ce dont il faudra se souvenir au moment de tester la panmixie Les donn es manquantes sont quant elles cod es par des 0 Pour tous les tests li s l h t rozygotie locale il faut cr er un second fichier TsetseJerCoordGeo amp Trap amp Sex TotDataMalManq xls o les m les sont manquants aux loci li s lX Ensuite nous allons utiliser un nouveau logiciel tr s pratique qui peut convertir facilement nos deux fichiers dans des formats vari s y compris pour les programmes dont nous avons besoin Ce programme s ap
43. p variance maximale possible dans l quation 39 ce qui donne le maximum de poids aux all les dont la fr quence est la moins proche de 0 et 1 tant donn que les estimateurs moyens sur plusieurs loci et ou plusieurs sous chantillons suivent la m me logique ce sont les loci et ou les sous chantillons les plus polymorphes qui auront le plus de poids D autres m thodes de pond ration existent En particulier celle propos e par ROBERTSON et HILL 1984 a connu un certain succ s pour ses propri t s statistiques GoupET et al 1996 ROUSSET et RAYMOND 1995 Ici une pond ration diff rente est impl ment e Si les estimateurs de Weir et Cockerham et Robertson et Hill sont not s avec les indices WC et RH respectivement nous obtenons pour K alleles not deA 14aK 134 2 4 4 2 4 mats D fwc _ SPT a 2 4 we Se 40 i i Dt 441 2 A p 1 At A Aa 2 A 1 AI 2 A SPT a bi 58 Initiation a la g n tique des populations naturelles pour les estimateurs de Weir et Cockerham o nous savons que les termes contiennent une pond ration inh rente donnant davantage de poids aux all les dont la fr quence est la plus proche de 0 5 et 1 ex li p p 2 A Jeu Pas 2 A 1 2 A 1 4K 1 p t 2 A z l y 41 K il At A 0 A Lie palli 2C 204 Ke Vl P A f A EO A pour les estimateurs de Robertson et Hill qui donnent un poids maximal aux all les
44. ponse 10 On comprend ais ment qu une telle population perd sa diversit une vitesse tr s grande D autres facteurs influencent l effectif efficace En particulier la subdivision des populations est susceptible d augmenter l effectif efficace d une population car une population subdivis e conservera en g n ral mieux sa diversit g n tique qu une population homog ne Pour caricaturer une population totale ment subdivis e en sous unit s stables n changeant aucun migrant aura un effectif efficace infini car la diversit g n tique se trouvera rapidement fix e l chelle globale quand chaque sous population se retrouve fix e pour l un ou l autre des all les pr sents et donc quand la diversit est totalement perdue une chelle locale Les lecteurs qui n auront pas encore jet ce manuel au feu trouveront une excellente revue de CRISCIONE et BLOUIN 2005 sur le calcul des effectifs efficaces dans le cas des organismes parasites Enfin il faut galement signaler qu il existe plusieurs d finitions de l effectif efficace avec dans la plupart des situations des cons quences n gligeables sur les valeurs estim es Citons l effectif efficace de consanguinit qui comme son nom l indique mesure la probabilit d identit par descendance des g nes l effectif efficace de variance qui s attache analyser la variation des fr quences all liques leur amplitude plus exactement d une g n ration l autr
45. quation 66 que F54 sera tr s grand Q si Q 0 Si la migration est tr s faible entre sous populations d un m me archipel il est alors probable que celle entre archipels soit au moins aussi faible et donc que Qr 0 et Fyr Q partir de l il est facile de voir que quand la diff renciation est extr me entre les sous populations celle ci sera n cessairement faible en apparence entre archipels En 212 Initiation la g n tique des populations naturelles fait cela veut juste dire que la diff renciation entre sous populations est tr s forte que ce soit entre sous populations du m me archipel ou de deux archipels diff rents et la distinction entre archipels n apporte pas suffisamment d information avec ces outils Ce dernier point peut tre illustr math matiquement par le fait que dans ce cas For Foy C est donc probablement ce ph nom ne qui emp che partiellement de d tecter un quelconque signal entre zones chez les glossines du Mouhoun Le fait que la zone soit perturb e et que donc l isolement puisse tre r cent entre les diff rentes zones peut galement contribuer brouiller l image En effet alors que l isolement par la distance est un ph nom ne qui se met tr s vite en place et devient d tectable en quelques g n rations comme le montrent nos simulations BOUYER et al 2009 le Fsr met un certain nombre de g n rations atteindre l quilibre migration mutation d rive Reprenons c
46. s associ es la notion de diversit g n tique telle que l h t ozygotie de la population consid r e par rapport une population dite id ale Cette population id ale correspondant en fait une population qui perdrait sa diversit g n tique aussi vite que la population consid r e la vitesse de 1 N ou 1 2N par g n ration de telle sorte que l effectif efficace de cette population id ale soit gal l effec tif recens Cette caract ristique n cessite une population de taille constante g n ra tions s par es hermaphrodite avec rencontre au hasard des gam tes pour former les zygotes et absence de toute forme de s lection migration ou mutation titre d exemple consid rons une population de bovins de 100 individus compos e de 99 N 99 vaches et d un seul taureau W 1 La taille efficace d une telle population sera de N 4N NA N 4 voir HARTL et CLARK 1989 86 c est dire 25 fois plus faible qu une population de 100 b tes au sexe ratio quilibr W N 50 On comprend bien que dans le pre mier troupeau la diversit g n tique s rode rapidement D autres facteurs peuvent influencer l effritement g n tique parfois en sens inverse comme ce peut tre le cas dans les populations subdivis es ou structur es Par exemple dans le cas extr me d une sub division totale pas de transfert de g ne entre sous populations on atteint une taille efficace infinie car
47. thode de Wanc et WuiTLock 2003 avec le logiciel MLNe Il nous faut donc dans un premier temps convertir les donn es MLG au format appropri Construction des fichiers pour NeEstimator et pour MLNe Pour la m thode de Waples NeEstimator il faut faire un fichier de type Genepop pour chaque ann e de chaque site pertinent soit cing fichiers Bonon en 2000 2002 2004 Dubr ka 1998 et Dubr ka 2002 comme en figure 89 Pour MLNe nous allons passer par Create car le formatage du fichier est horrible je ne remercierai jamais assez Jason Coombs Le fichier a donc la forme de la figure 90 Il convient ensuite sous Create de charger ce fichier et de lui donner les informa tions comme indiqu dans la figure 91 Create vous demande si c est bon en vous montrant ce qu il a fait et vous dites oui Un nouveau cadre appara t o vous allez cocher MLNE dans Specialized gene 16 Notez que comme PGD Spider ne prend pas en charge cette conversion CREATE est donc ma connais sance le seul logiciel utilisable pour convertir un jeu de donn es au format MLNe G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 261 MLGJ Bon00 7 0140149 Bon0O 0210219 Bon00 7 0220224 Bon00 1 0220424 Bon00 7 02602697 Bon00 5 0260264 Bon00 r5 0260264 Bon00 7 0260264 BonU0s 7 0260269 Bon00 7 0260269 Bon00 73 0260264 Bon00 0260269 Bon0O 0270279 Bon00 7 0340349
48. trop conser vateur Dans ce cas il est plus raisonnable de ne prendre en compte que les loci les plus polymorphes c est a dire ceux pour lesquels les chances de d tecter quelque chose sont les plus grandes Par exemple on peut carter les loci dont un all le atteint ou d passe la fr quence de 90 on peut m me tre plus s v re en fonction des circonstances car de tels loci ne pr senteront qu exceptionnel lement des P values suffisamment faibles alors qu ils contribuent l augmenta tion de la s v rit du Bonferroni Comme sugg r pr c demment ce qui est la plupart du temps recherch c est si les loci ne sont pas trop li s Il n y a de toutes les fa ons pas d agr ment g n ral sur la meilleure proc dure et il est donc laiss libre choix aux empiristes de d cider si une correction plus ou moins s v re ou pas de correction doit tre appliqu e Les tests Multilocus Acapow et BURT 2001 ont t sp cifiquement con us pour tester un effet global tel que celui attendu sous r gime clonal de reproduction Des tudes de simulations DE Meets et BALLOUX 2004 ont sugg r que la mesure la plus pr cise ou plut t la moins mauvaise serait le coefficient de corr lation r AGArow et Burt 2001 Ce coefficient se base sur l indice d association J BROWN et al 1980 MayNarp SmiITH et al 1993 HAUBOLD et al 1998 mais contraire ment ce dernier est ind pendant du nombre de loci tudi s d
49. un clin d il de Metropolis son coll gue Stan Ulam et n est pas sans rapport avec les jeux de hasard ayant cours dans la capitale de Monaco voir METROPOLIS 1987 Il sagit de r chantillonnages al atoires ou pseudo al atoires des donn es La proc dure de permutation correspond la m thode utilis e dans Fstat GOUDET 1995 Il sagit en fait de simuler l hypoth se nulle un grand nombre de fois par exemple 10 000 fois partir des donn es existantes l chantillon Par exemple dans chaque sous chantillon et pour chaque locus les all les de tous les individus sont r associ s deux a deux au hasard pour reformer des individus fictifs obtenus selon l hypoth se de panmixie locale Un Frs obtenu donc par hasard sous Hp est calcul et on recommence la m me chose un tr s grand nombre de fois La propor tion de fois qu un Fy aussi grand ou plus grand que celui observ dans les donn es est apparu au cours du processus correspond la P value du test A tant ici Frs gt 0 Selon un principe analogue la diff renciation Ap les individus se distribuent de fa on al atoire dans les diff rents sous chantillons est test e en assignant chaque individu al atoirement dans les diff rents sous chantillons un Fs obtenu sous A est calcul et le processus r p t La proportion de fois quun Fs7 ou une autre statistique refl tant la distribution des fr quences all liques entre sous chantillons comme no
50. une ACP avec 15 all les donc 15 axes dont le premier axe aurait une inertie inf rieure 22 1 n aurait donc aucun axe significatif selon le crit re du b ton bris Par contre si cette ACP donne les deux premiers axes avec des inerties par exemple de 25 et 22 d iner ties suivies d axes l inertie inf rieure 12 on a deux axes significatifs selon le crit re du b ton bris R ponse 10 Effectif efficace d une population dio que Soit Nret N le nombre de m les et de femelles dans une grande population par ailleurs isol e sans mutation ni s lection g n rations non chevauchantes avec accouplements al atoires pangamie et constance du sexe ratio d une g n ration l autre Dans une telle population pour que deux g nes d un zygote de la g n ration t soit form par deux g nes issus d un m me g ne anc tre il est n cessaire que ce g ne soit pr sent chez la m re et le p re de ce zygote c est dire s il a t pr lev deux fois chez le m me m le de la g n ration 2 ou la m me femelle de la g n ra tion 2 Sachant qu il y a pangamie la probabilit que les deux g nes d un zygote proviennent du m me grand p re est de 1 N et de la m me grand m re de 1 W Dans chacun des deux cas la probabilit de tirer deux fois le m me g ne chez le grand parent pour le transmettre aux deux parents du zygote est de 1 2 et la pro babilit de retirer deux fois ce g ne chez
51. vage ou troupeau d une ferme Cette tique passe donc du stade larve adultes librement d une b te l autre d un troupeau et est donc parfaitement susceptible de propager des maladies telles que l anaplasmose si cette derni re tait introduite sur fle Il appara t que les populations locales de R microplus troupeau sont structur es en fratries ce qui suppose une r ussite h t rog ne entre pontes compatible avec les traitements acaricides r guliers la ponte des femelles tomb es au sol juste avant traitement n est pas affect e les autres disparaissent presque toutes Cette structure g n tique particuli re est accompagn e d une l g re signature d appariement assorti qui peut tr s bien en tre une cons quence les membres d une m me fratrie tant plus synchrones ensemble qu avec les autres Ceci explique les l gers d ficits en h t rozygotes significatifs observ s Il existe un isolement par la distance dont le mod le nous permet d inf rer un voi sinage de taille 276 individus notion particuli rement difficile comprendre s il en est mais qui permet d estimer la surface de dispersion entre adultes et les parents leur ayant donn naissance Cette derni re s av re relativement modeste avec un rayon de l ordre des 300 m par g n ration entre 200 m et 1 km soit au plus 1 2 km par an en moyenne si quatre g n rations par an et pas de retour en arri re Cette dispersion d coul
52. vement faible de Fsr Fs7 1 H 0 05 et sugg re une importante migration entre fermes Analyse des biais de dispersion sexe sp cifiques Trois types d analyses sont possibles ici Soit une analyse par levage pour tester le biais de dispersion sp cifique au sexe entre infra populations huit analyses soit une analyse sur l ensemble des infra populations o il y a des m les et des femelles 33 infra populations en tout soit une analyse sur l ensemble des fermes sans dis tinguer les infra populations soit donc 10 analyses Fstat en tout Il faut repartir du fichier source pour recoder les donn es au format requis fig 68 Notez que les all les doivent tre cod s avec deux chiffres pour ces analyses ay bs 124 Biz C07 D12 D10 412 COS popi F Boul 2 0505p 0606s 0709 F Boul 2 0102 0608 02095 H Boul OL104 0108 0209 M Boul 2 0102 0606 0204 pop F Boul 3 0405 0106 0912 F Boul 3 02045 D606 00S F Annul 2 NANG Ninh nN aw Figure 68 Exemple d un fichier pour l analyse de biais de dispersion sexe sp cifique entre infra populations de B microplus dans l levage de Bouloupari Vous lancez Fstat et vous choisissez le menu d roulant Biased dispersal Cochez les param tres Mean assignment AL Variance of assignment vA et Fst Fs7 qui sont les plus performants comme discut ailleurs p 91 92 de la premi re partie e
53. voir DE Meets et Barroux 2005 N BAvI et al 2006 TESTER LES D S QUILIBRES DE LIAISON Ici plusieurs m thodes sont possibles Globalement elles consistent recombiner au hasard les loci entre eux l int rieur de chaque sous chantillon un tr s grand nombre de fois et de mesurer diff rentes m thodes une statistique La statistique observ e dans chaque sous chantillon est ensuite compar e la distribution obte nue lors des randomisations sous l hypoth se nulle d absence d association statis tique entre loci La statistique peut tre une mesure de d s quilibre de liaison par paire de loci le plus fr quent ou une mesure multiloci utilis e par les chercheurs travaillant sur des organismes clonaux L avantage des mesures multiloci est qu elles fournissent une mesure sur l ensemble des loci alors qu il y a autant de mesures et donc de tests qu il y a de paires de loci potentiellement L Z 1 2 o L est le nombre 80 Initiation la g n tique des populations naturelles de loci pour les mesures par paire Le d faut des mesures multiloci est que leur comportement nest pas encore bien connu dans toutes les conditions voir De Meets et BazLoux 2004 et qu il n existe pas de mesure et donc de test multi chantillons Dans les tests par paire de loci on peut utiliser comme statistique la probabilit d apparition du tableau des g notypes pour les deux loci du sous chan tillon compte te
54. 0 001147949 0 04450201 Host 0 00000000 0 000000000 0 04340389 que l on teste avec les commandes gt test within loci test Host within Farm nper m 1000 224 Initiation a la g n tique des populations naturelles ce qui renvoie une P value 0 132 et gt test between loci rand unit Host test Farm nper m 1000 ce qui renvoie une P value 0 001 Il en ressort que si le niveau h te infra population de parasites explique une part infime et non significative de la variation g n tique le niveau ferme est quant a lui tr s significatif Nous allons donc recommencer en ignorant le niveau infra population ANALYSES INTRA ET INTER FERME Homozygotie d s quilibre de liaison intra ferme et diff rentiation globale Vous allez donc recr er un fichier Fstat mais uniquement avec les fermes locali t s Ce fichier BoophilusAdultsDataCattleFarmFisLD dat nous allons l analyser comme indiqu en figure 67 Il en ressort qu aucun test de d s quilibre de liaison nest significatif P value gt 0 079 ce qui confirme que le r sultat avec les infra populations n tait pas d un manque de puissance caus par les faibles tailles de ces infra populations Le Fy est toujours tr s significativement P value 0 0001 au dessus de 0 Fis 0 044 soit sensiblement la m me valeur qu avant ce qui Fstat for windows Processing BoophilusAdultsDataCattleFarmFisLD dat File Options
55. 0005 C102 0 0874 GpCag 0 8244 Tous les loci 0 0001 Create vous transformez vos deux fichiers Excel en format Micro Checker le pre mier pour les loci li s l X en A le second pour toutes les donn es et on ne regar dera pas le r sultat des loci li s au sexe en A Lancez micro Checker N oubliez pas de pr ciser le pas de mutation correct Bon je vous aide mis part BX104 et GpCag mononucl otides et C102 trinucl otides tous les loci sont dinucl otidiques Les analyses montrent que les all lles nuls expliquent tr s bien tous les r sultats y com pris pour les m les En effet pour les femelles et loci autosomaux de A et pour tous les loci en H C et D il y a plus de blancs observ s qu attendus par la m thode de Brookfield Pour les loci li s PX chez les m les du site A les diff rences ne sont pas significatives Il semble m me y avoir du stuttering pour le locus C102 en D Cependant l effet Wahlund ne peut non plus tre totalement cart ainsi que nous allons pouvoir le v rifier Vous pourrez aussi v rifier qu il ne semble pas exister de dominance d all les courts ici MISE EN VIDENCE D UNE SOUS STRUCTURATION L INT RIEUR ___ DES ZONES A H C ET D Vous pouvez tester en zone A sil existe un biais de structuration sp cifique au sexe entre pi ges titre d exercice et constater qu il my a aucune signature d un tel 196 Initiation la g n tique des populations naturel
56. 10 5 16603 91667 2186 444444 a 1521954 145145 og 5 16603 91667 2186 444444 1 Hoi 150192 10 7 16603 91667 2186 4444446 p Haine 145150 Li a 16603 91667 2186 444444 1 mien 145145 os 4 16603 91667 2186 444444 1 ait 179192 oa 0 16603 91667 1186 444444 5 94454 145192 os 1 16603 91667 2186 444444 5 pin 145192 os 2 16603 9L667s 2166 444444 a3 da D00000 09 3 16609 91667 2186 444444 1 145179 os 4 16603 91667 2186 444444 5 cara 150150 Li 5 16603 91667 2186 444444 1 z 179179 10 1942009 E Fop4 7 16546 0277 2156 722222 1 179179 ii 198198 5 16548 02778 2156 722222 i 1644984 179192 10 9 16548 02778 2156 722222 1 pete 150179 os O 16548 02778 2156 722222 5 Fotos 145179 oo 1 16548 02778 2156 722222 p3 621965 000000 os 2 16548 02778 2156 722222 5 ets 145145 os 3 16548 02776 2156 722222 5 per 000000 oo 4 16548 02778 2156 722222 p5 54100 150185 os aro e e 190196 a s Figure 76 Donn es pour Genepop 4 avec la ligne de titre sans virgule les loci puis les g notypes pr c d s de leurs coordonn es GPS suivies d une virgule Chaque ferme est s par e par un Pop et il ne doit pas rester de colonne ou de ligne vide menu 6 puis le sous menu 6 Nous sommes en deux dimensions donc il faut choi sir le logarithme naturel des distances g ographiques Tapez donc I On vous dema
57. 121121 233246 1381384 Dor 96 F I 175183 gt 130147 119119 246250 0000004 Dor 96 F 1 172174 134134 119119 gt 233250 0000004 Dor 96 F U 173177 gt 141154 119119 235245 1251424 Dor 96 F U 170175 143148 119123 233235 0000004 Dor 96 F U 168174 145147 119119 241241 1421424 Dor 96 F U 167176 135135 117117 250250 1421424 Dor 96 F U 168174 gt 149150 119119 000000 1271284 Dor 96 F U 179182 130130 119119 233233 1291354 Ber 96 F U 173175 149149 119119 gt 233243 1351429 Dor 96 F U 167183 144144 123123 233250 127128 Dor 96 F U 181181 146146 125125 246250 1281284 m 47 Exemple des premiers individus du fichier de donn es pour tester la diff rentiation entre tiques infect es I et non infect es U par Bbss Nous voyons ici les tiques de Dor naz 1996 femelles Fstat for windows File Options Litiities Processing ForPairedBbss dat Biased dispersal Mantelise it Help Fer locus and sample statistics 7 E Alele frequencies T Genotypic trequencies F Number of alleles FF Heis Fstalistics F Wier and Cockerham Fstatistics T Bho st Tests between all pairs of loci Tests between all pairs of loci in each sample Allelic richness Iv Ft per pak of samples F Gene Nominal level for multiple beste C 5100 12100 e 11000 M Fis Ting Global T Hardy Weinberg vathin samples M Hardy Wein
58. 161 1 164 Staadswald 1996 Infini Infini Moyenne totale 268 119 541 g n ration s parant 1996 de 1995 les estimations obtenues par la m thode de Waples donnent des effectifs efficaces proches de 0 ce qui n est pas tr s conforme P P q P la perception que l on peut avoir sur le terrain En reprenant le tableau 16 nous obtenons par cons quent un effectif efficace de 268 en moyenne sur l ensemble des chantillons avec un intervalle de confiance 95 de 119 541 avec des valeurs minimales et maximales de 73 et 700 respectivement Ces nombres paraissent plausibles compte tenu de l effet Wahlund refl tant proba blement un fonctionnement particulier des populations de tiques susceptible d en r duire sensiblement l estimation de leurs effectifs efficaces En reprenant les donn es avec un ou deux individus par cluster BAPS les valeurs obtenues sont plus grandes en moyenne 596 avec un minimum et un maximum de 75 et 1 057 respectivement 11 Sur ces m mes donn es l estimation avec un logiciel alternatif LDNe Warzes et Do 2008 non encore connu au moment de la r daction de ce chapitre et dont l utilisation est d taill e plus loin donne une moyenne de N 223 164 Initiation la g n tique des populations naturelles Extrapolation des densit s et des distances de dispersion des tiques en Suisse Il faut dans un premier temps estimer sur quelle surface se distribuent les tiques Ici c est difficile e
59. 2007 Nous verrons que les niveaux de diff renciation entre popula tions d ricinus se trouvent bien en dessous de cette fronti re Enfin un locus IR27 a montr des vidences de dominance des all les courts Dans la mesure o ce ph nom ne modifie l h t rozygotie et l estimation des fr quences all liques il faudra tre constamment vigilant quant aux r sultats obtenus par la suite Si nous avions un locus de plus sans all le nul j aurais m me conseill de le supprimer Ce n est malheureusement pas le cas Il faudra juste v rifier que chaque r sultat ult rieur n est pas sous la d pendance de ce seul locus L id al aurait t d avoir sept loci comme IR08 mais non li s l X Mais on ne choisit pas et les probl mes de marqueurs chez les parasites et vecteurs repr sentent un souci r current Une autre conclusion importante est qu un d ficit en h t rozygotes non enti rement expliqu par des all les nuls exclut les causes endogamiques croisements fr re s ur autof condation qui tendent augmenter l homozygotie et donc d voiler les homozygotes nuls blancs d une part et sugg re d autre part plut t un effet Wahlund qui augmente la diversit g n tique H sans augmenter l h t rozygotie observ e d o augmentation du F cf quation 19 en premi re partie de ce manuel p 47 Dans le cas d un effet Wahlund il est donc normal que les proc dures de d tection d all le
60. 218 42 213 16 20769 DOT 160 53 10579 tape suivante consiste lancer Genepop 3 Eviter de double cliquer sur le fichier L t t te al G 3 Eviter de double clig le fich genepop bat mais pr f rez ouvrir une session DOS en lan ant une Invite de com mandes dans le menu Accessoires de Windows Dans la fen tre DOS et si Genepop est dans le r pertoire Genepop du disque D tapez D puis Entr e e cc e cc E D A la e puis cd Genepop puis Entr e Vous tes dans le r pertoire Genepop Tapez alors CCo 3 cc de isolde puis Entr e pour lancer le programme d isolement par la distance A l invite tapez le nom complet du fichier de donn es puis Entr e Le logiciel vous demande ensuite quel type de distance non transform e ou Log et quel type de mesure de diff renciation vous souhaitez tester X qui figure dans la matrice ou X 1 X A vous de choisir la m thode appropri e Genepop vous demande ensuite la distance minimale en de de laquelle la mesure de corr lation ne tient plus compte des donn es car en de d un certain niveau la r ponse a en effet ten dance ne plus suivre un mod le clair Rousset 1997 R fl chissez ce que devrait 158 Initiation la g n tique des populations naturelles Donn es brutes F 1 F 0 04 0 002 Ln distance P value 0 184 0 025 x r 0 02 x 0 015 j A X o gt 5 a Ln
61. 23 s lectionnez le locus suivant etc Vous court dans ce premier sous chantillon Analyses des autres sous chantillons des autres loci autosomiques et du locus IRO8 Au centre et en bas cliquez sur le bouton Next Population voir fig 23 pour analyser le sous chantillon suivant en reprenant les m mes tapes d crites en p 125 127 jusqu au dernier sous chantillon N oubliez pas de copier le tableau des fr quences d all les nuls chaque fois dans le menu Tools Nulls across loci fig 23 Ensuite vous ferez la m me chose pour le locus li au sexe IRO8 en ouvrant le fichier correspondant IRO8AlIFem txt Curdahertese bimi yal Homozygote Frequencies C1 95 Frequency of Differences bp CI 95 Popileton Bar_35_F Obsarsad value Population Her 95_F Observed value Looe AZ Mean expected value Locus IAZ5 Mean epeced value LI TH T6 I I 14 Homorygate alale sizes Leeus IRiz 5 mit AS A Probability of observed homcopoce class heje Tots epected homocppotes 2 14 Binaria bated Flank bated Tele obesived homsspoctes 10 130 Lois qua LH oom nii Ant ndicdbict hapaa aeaea al hii kotira 1 LE 1 HS 13115 1355 Na eviter lor stoning aoe due io chiens tif ni 0855 1a 00081 oo Ho residence le large alle spa YA ipii oor Cons lo al cee LOU ngrdicar Nul alles map Ba pasni at Pr s at suggetisd by the genial t ol horscoygoies tor roost sels are chasses
62. 3 4 RAYMOND et ROUSSET 2003 mise jour de RAYMOND et ROUSSET 1995b Genepop 4 Rousset 2008 moins convivial mais qui est le seul propo ser certaines proc dures tr s utiles comme celles testant des isolements par la dis tance entre individus et leur version web Genetix 4 03 tr s convivial en fran ais qui propose des AFC analyses factorielles des correspondances MSA DIERINGER et SCHLOTTERER 2002 pas tr s convivial mais qui propose diff rents calculs de distances g n tiques Il en existe bien s r bien d autres que nous utiliserons dans la 2 partie de ce manuel Applications des exemples concrets mais avec ces trois ci on peut d j faire norm ment de choses Ajoutons que ces logiciels sont t l chargeables gratuitement voir en annexe les liens chose ajouter au cr dit de leurs auteurs Nous revien drons sur d autres logiciels au moment o nous en aurons besoin Mais avant tout il y a Create Coomss et al 2008 qui permet partir d un fichier texte ou Excel avec toutes les donn es brutes de convertir ces donn es dans un for mat ad quat pour la plupart des logiciels de g n tique des populations Au moment o je corrige mon manuscrit Tatiana Giraud m apprend qu il en existe un autre PGD Spider LISCHER et EXCOFFIER 2012 apparemment assez convivial mais que je n ai encore jamais utilis Intervalles de confiance de bootstrap et jackknife Le bootstrap
63. 30 b1C18 F biC18 M 0 1 31 b1C18 F b1C19 M 0 0 32 b1C19 F b1C09 M 0 0 33 b1C19 F bic11 M 0 5556 0 b1C19 F biCI2 M 0 0 I35 b1C19 F biCI4 M o 0 36 b1C19 F biC18 M 0 0946 0 b1C19 F biC19 M 0 1 Figure 72 Aspect du fichier pour le test de Mantel de corr lation entre apparentement et accouplement chez Rhipicephalus microplus de la premi re vache de Canala recherchons un signal sp cifique susceptible d expliquer nos d ficits en h t rozygotes et donc une corr lation positive R gt 0 Nous devrons donc transformer ces P value en les divisant par deux pour celles dont le R gt 0 ou en posant 1 P value 2 pour celles dont la corr lation est n gative Ce n est pas id al mais a doit coller peu pr s Il faut recommencer avec chacune des infra populations de tous les h tes de tous les sites L ensemble des r sultats est synth tis dans le tableau 31 Nous y voyons que le signal m me sil est assez faible est cependant significatif P value 0 0466 en bilat ral Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 231 Fstat for Windows Fie Cris Matelis Blasecd tispersal Witlies Hein Fetatehce Testing and Dinequibaun Comp among gupa of tangisi Geneto Distances Gene divanin andF Sispeice Genap denor Partial Mantel or Regression File D Dala from dislance matrices Wernbiles Dependant anale fa LE KA Seve msidaals desde 2000 Figur
64. 4 f 6 O48 4 amp LE Fuge 349 694444 94452 TT Tie 9501944445 942111111 334055556 SSSEL1I LI rrr S449 61111 949611111 344166607 BAS E Ts SRP 156060 344055556 S540 611 11x 545166667 914555556 99496944445 CS TBs OES Tae 055185 6 068976 nm Oo mH mao om mi 6 05518 04674 0532 by 04182m 04162 05326 05438 05438 06976 fi 1 x x s Fi gure 83 b US SE Ge E 6 o amp EE o AD AD 0 To 9 E T wD 125 116255 120555556s 128833333 0596944445 1247771178 1172222282 120611111s 1205533735 114444444 12802777 09966666T 1146944442 11941666 7 114961111s 1169444445 117972222 9971 59971 9209 bs B209 8997 1s 920s 2209 6 9219s S1H22 31923m B219 S220 be 322066 BPF iw Tao late Bays i a KIVI nes G10 6 2 KIVI man S37 4 1 EIVI mes T66 4 2 gt RIVI mas 402 1 EIVI mas B12372768 KIVI mse DF1 4 EIVI mas Fails 7 2 KIVI mar FS L M KIVI mas G1liys 6 2 EIVI mes GiT 6 1 KIVI mar g24 7 9 EIVI mae GJ 10 25 EIVI mas FT LS EIVI man Gils 6 4 KIVI mes S27 16 13 KIVI mas 3247 2 6 KIVI mes TTl2i 1 EIVI mes Tizz i RI mas 1 1 6 RI mss S7 2 2 RI ma TTZ 4 KIVI mes ST SSSR EIVI pas F17 1 6 EIVI iar 127 975 EIVI m3r TALA 14 EIVI mar T41 4 14 RI mee Si 9 5 AI mas 514 5 1 KIVI mas 14 5 1 RI mss Tres dr ET Ha B4 E120 53 mss B
65. A i p sur l ensemble des L loci D autres m thodes permettent de calculer un indice d assignement Par exemple Prry et al 2004 utilisent une m thode bay sienne avec exclusion de l individu focal Par ailleurs on peut ne pas souhaiter comparer des populations mais plut t des cat gories d individus dans les populations On peut se demander par exemple si les h tes parasit s sont plus ou moins bien assign s que les sains ce qui refl terait une modification du comportement des individus sous l effet du parasitisme On peut d sirer savoir si les individus m les ont le m me comportement que les femelles Il est alors int ressant de s affranchir du biais impos par le degr de polymorphisme contenu dans chaque sous population On utilise alors une version centr e de A7 AT en retranchant de A la moyenne de la population apr s transformation Log pour minimiser impact des trop petites valeurs Favre et al 1997 Il en r sulte que l AZ moyen de chaque sous chantillon est centr sur 0 et que les individus avec un A n gatif correspondent des individus moins bien assign s leur population d origine que la moyenne des individus chantillonn s sur place Cette derni re m thode est celle que l on trouve dans Fstat 2 9 3 GouDET 2002 alors que celle de Piry et al peut tre trouv e dans GeneClass 2 Prry et ALAPETITE 2003 t l char geable http www montpellier inra fr URLB Pour plus de
66. BruceiFoyer AnCleanLoci amp MLGCreate txt Il faut mettre ces donn es au format Fstat et ana lyser les diff renciations par paire de sous chantillons en s lectionnant les loci de fa on pertinente ne pas laisser MLG avec les loci normaux En fait les donn es loci sont d j dans T BruceiFoyAnCI amp Guin CleanLoci dat Pour les MLG il suffit d ouvrir le fichier global et s lectionner le locus MLG avec le menu Options et Loci to use Pour ces deux nouveaux fichiers lanalyse se fait sous Fstat avec la proc dure Pairwise test of differentiation avec 10 000 permutations des individus entre sous populations et les Fst per pair of samples Le r sultat de ces deux ana lyses si vous ne vous tes pas tromp s extraire des fichiers fst et pvl sont compil s dans le tableau 37 La diff renciation temporelle est plus facile a d tecter avec les MLGs Substantielle au bout de deux ann es elle devient tr s importante au bout de quatre ans La d rive 260 Initiation a la g n tique des populations naturelles est donc rapide et sugg re de faibles effectifs efficaces pour les MLGs La structure g ographique est tr s prononc e avec un isolement total entre Guin e et C te d Ivoire et probablement peu d changes entre Boffa et Dubr ka Si on reprend l quation 26 du chapitre 2 de la premi re partie mod le en deux les on peut en d duire un quivalent Nm 1 Fo7 8F 57
67. File Data File Di thieeyBlouquinG ere Popi TPAD ataleodesStrucT ques StructGlobale General 0 Number Lost 5 Number of Individuals 32 Figure 40 Pour lancer l analyse de NeEstimator choisi le format par d faut Allez l onglet Data Files La il n y a qu un seul bouton Load qui vous permet de charger votre jeux de donn es ce que vous faites fig 39 Une fois que vous avez choisi le fichier le logiciel vous demande a quelle g n ration ces donn es correspondent elles Laissez la valeur par d faut 0 car nous nutiliserons pas ici la m thode des moments de Wares 1989 cf p 102 en pre mi re partie et cliquez sur OK Dans le menu d roulant NeEstimator cliquez sur Run fig 40 Ce qui fait appara tre un message qui vous avertit qu avec un seul chantillon on ne peut utiliser les m thodes temporelles Moment based et vous demande si vous souhaitez continuer avec les m thodes un seul chantillon Vous r pondez Oui bien entendu Le r sultat est affich sous forme de tableau que je vous conseille de sauvegarder au format NeEstimator NeA Je conseille aussi de transcrire tous les r sultats dans un tableur au fur et mesure afin de disposer de l ensemble dans un seul fichier C est ce qui est repr sent dans le tableau 16 Ici bien que nous disposions d chantillons espac s dans le temps Bern Gorges du Trient et Staadswald ces chantillons ne sont
68. Flock optimis par contre les r sultats ne donnent pas grand chose d exploitable CONCLUSION DES ANALYSES ___INTRA FERMES 7 L ensemble de nos r sultats sugg re une libre circulation des tiques entre h tes de la m me ferme mais un isolement des fermes qu il convient d analyser plus en d tail voir plus bas Cette libre circulation contredit le mod le classique de fid lit stricte des individus tiques vis vis de l individu h te colonis par les larves et explique bien comment malgr une transmission transovarienne n gligeable R microplus reste un vecteur majeur d Anaplasma marginale une bact rie tr s pathog ne du b tail en zones intertropicales UILENBERG 1976 pathog ne absent de Nouvelle Cal donie Du stade larvaire aux adultes des changes de tiques ont donc proba blement lieu entre individus h tes vraisemblablement lors de contacts physiques entre b tes Ce ph nom ne est coupl avec une structure en fratries combin e des accouplements l g rement assortis g n tiquement Ceci provient possiblement du fait que les larves issues d une m me ponte ont plus de chances d atteindre la matu rit sexuelle en m me temps ce qui coupl avec une variance de survie importante cr e un l ger mais tr s significatif effet Wahlund ISOLEMENT ___PAR LA DISTANCE Comme nous disposons des coordonn es GPS des sites nous allons les utiliser dans le logiciel Genepop 4 Rousset 2008 Les donn es
69. Gadji 11 741 0 69 8 l La Foa 10 80 0 16 8 2 Poquereux 15 107 0 62 11 1 Port Laguerre 20 166 0 40 15 il Sarramea 8 24 0 28 4 1 0 1 0 05 fi el 0 n 0 05 0 14 _ 0 15 S m 0 2 _ 0 25 Non BAPS Flock Flock Fratrie modifi es optimis Traitement Figure 75 Frs obtenus pour le jeu de donn es non modifi es par ferme pour le jeu de donn es clusteris es par BAPS par Flock nombre maximum de clusters et Flock optimis K estimates based on plateau analysis ainsi que pour lattendu pour une structure en fratrie mod le de la R ponse 15 avec les fr quences all liques par ferme Les intervalles de confiance 95 sont obtenus par bootstrap sur les loci sauf pour le Frs des fratries obtenu avec la valeur maximale et minimale observ es sur les moyennes pond r es sur l ensemble des fermes par locus Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 235 Flock Je ne vais pas d tailler ici l analyse car je manque de toutes mani res de recul sur ce programme mais je trouvais int ressant d voquer ici ce nouveau logiciel qui n est de toutes mani res pas tr s difficile utiliser Les r sultats donn s par Flock sont comparables 4 ceux obtenus par BAPS mais avec moins de clusters BAPS a en effet tendance exag rer le nombre de clusters LATCH et al 2006 pour ce qui est du nombre maximal de clusters obtenus tabl 32 fig 75 Pour le minimum de clusters
70. Genetix qui permet l analyse d un seul sous chantillon mais dont les sorties sont moins commodes importer dans Excel vous de voir La colonne Npq qui donne en fait le r sultat du produit MVp 1 p nous servira pond rer notre r gression par la taille des chantillons mais en donnant aussi plus de poids aux all les de fr quences proches de 0 5 les plus polymorphes On fait les m mes fichiers avec les quatre autres loci Nous allons maintenant analyser ces donn es avec le logiciel R Tableau 9 Aper u du fichier de donn es pour le locus IRO8 en vue de l analyse de r gression du Fj en fonction de la taille des all les et du sous chantillon m ne le Tin E 0 02439 Bern 95 0 0455 0 04342975 0 9554545 0 166 Bern J5 E 0 0227 22 0 02218471 0 48806362 0 05 168 Bern 95 E 0 0682 22 0 06354876 1 39807272 0 65574 169 Bern J5 R 0 0682 22 0 06354876 1 39807272 0 02439 70 Bern 25 F 0 0455 22 0 04342975 0 9554545 Ouvrez R et dans le menu Fichier cliquez dans Changer le r pertoire courant et allez dans le r pertoire o vous avez stock vos fichiers de donn es Dans la console de travail de R tapez la suite de commandes chacune suivie d un retour chariot touche Entr e gt data lt read table RTotLO8Mal MangFisAlISizeL08 txt header TRUE 130 Initiation a la g n tique des populations naturelles qui signifie que le tableau de donn es data est
71. Il s agit d un r chantillonnage r p t avec remise On s lectionne au hasard un des r plicats et apr s avoir not sa valeur on le remet et ainsi de suite jusqu obtention 70 Initiation la g n tique des populations naturelles d autant de mesures qu il y a de r plicats dans l chantillon La proc dure est r p t e un grand nombre de fois 5 000 pour Fstat On obtient ainsi une distribution de 5 000 valeurs possibles En excluant les 2 5 0 5 plus petites et les 2 5 0 5 plus grandes de ces valeurs on obtient l intervalle de confiance 95 99 Ces notions seront plus claires avec la description du bootstrap sur les loci et sur les populations Bootstrap sur les loci On r chantillonne au hasard et avec remise les amp diff rents loci disponibles jusqu en avoir amp sur lesquels on recalcule l estimation du param tre Frs ou F7 On recommence l op ration un tr s grand nombre de fois 5 000 fois Notons que puisqu il s agit d un chantillonnage des loci avec remise on peut obtenir plusieurs fois le m me locus On obtient ainsi une distribution des valeurs obte nues sur les 5 000 bootstraps Il ne reste plus ensuite qu regarder les valeurs obtenues de part et d autre de cette distribution pour obtenir un intervalle de confiance Par exemple pour 5 000 bootstraps la valeur obtenue avant les 2 5 les plus fortes et apr s les 2 5 les plus faibles nous donne l intervalle de confia
72. Il y a mutation Cela correspond aux erreurs de copies lors de la duplication de l ADN durant la construction des gametes Il existe plusieurs types de mutation Mutation r currente Une mutation r currente correspond la transformation d un all le donn en un autre all le donn par exemple 1 gt 2 C est le cas de la plupart des mutations d l t res comme l albinisme par exemple qui intervient avec la fr quence taux de mutation de 2 5x10 environ HEDRICK 2003 et ces mutations correspondent en g n ral une perte de fonction Le taux de mutation en est en g n ral assez bas 10 10 et la mutation reverse est en g n ral tr s faible et n gligeable car il faut r parer exactement ce qui a t perdu de l ordre de 10 Concepts de base en g n tique des populations 31 Mod le de mutation en nombre fini d all les ou KAM K Alleles Model La mutation transforme l all le d origine vers n importe quel type d all le parmi les K possibles Si par exemple on regarde le polymorphisme au niveau d une seule paire de base on aura K 4 A T G ou C vous de trouver pourquoi cet exemple n est pas tr s bon sinon reportez vous la r ponse 2 en fin de volume Pour les allozymes on a en g n ral entre 1 et 10 all les visibles Pour d autres marqueurs K peut tre tr s grand cause de ce nombre limit d all les possibles il peut arriver que deux all les soient identiques
73. N 1 2 et N 2 2 Notez que N est n cessairement gal Nj N12 Ma2 Soit p et po les fr quences des all les 1 et 2 respectivement dans l chantillon de N ndividus Il y a 2 all les en tout puisque nous sommes chez des diplo des Il y a 2N et N all les 1 chez les 1 1 et 1 2 respectivement et 2N et Nj all les 2 chez les 2 2 et 1 2 respectivement La fr quence des all les 1 et 2 dans l chantillon est donc 1 p pai t is ae 1 2N N et 1 Dy JIN gA Na Po Poa 2 2N N Notez que ces valeurs sont aussi des estimations des fr quences all liques de la popu lation chantillonn e et que gr ce la codominance du marqueur nous n avons pas eu faire d hypoth se pour estimer ces fr quences all liques en fait si laquelle Lire la r ponse 1 en fin de volume CONFORMIT AVEC LES PROPORTIONS D HARDY WEINBERG Les hypoth ses d Hardy Weinberg Hardy math maticien britannique et Weinberg m decin allemand ont mis le m me mod le de fa on ind pendante Harpy 1908 WEINBERG 1908 Ce mod le 29 commun ment appel Equilibre d Hardy Weinberg sert de base une immense partie des tudes de g n tique des populations Les hypoth ses de ce mod le sont les suivantes taille de population infinie pas de mutation pas de migration pas de s lection neutralit reproduction sexu e avec rencontre au hasard des gam tes panmixie
74. Output fig 70 car votre matrice ne sera pas carr e il faudra donc pr senter les donn es au format colonnes Fstat C est un d tail qui a son importance la proc dure de Fstat est issue de RT de Manly Manty 1997 qui permet d effectuer des tests de Mantel entre matrices non carr es impossible avec Genepop par exemple ce qui est bien commode Ceci vous donne toutes les paires d apparentement que vous devez s lectionner avec la souris comme dans la figure 71 Copiez ces donn es et collez les dans un logiciel qui vous permettra de trier ces donn es Vous allez en effet devoir ne garder que les couples r alis s et potentiels La premi re colonne ne contiendra donc que les femelles et la seconde que les m les Votre fichier interm diaire doit donc ressembler la figure 72 On y voit bien que les donn es ont t tri es par sexe pour le premier et le deuxi me individu de la paire et que seules les femelles ont t gard es pour le premier et les m les pour le second membre de chaque paire Une derni re colonne a t cr e pour donner le statut accoupl 1 ou non accoupl 0 de la paire Ceci est facilement obtenu sous Excel par une formule conditionnelle si coordonn es case 1 coordonn es case 2 1 0 fig 73 Il faut ensuite mettre ce fichier au format acceptable pour le test de Mantel de Fstat Ceci est tr s bien expliqu dans l aide en ligne du logiciel et je ne my attarderai donc Invasio
75. PASTEUR N PASTEUR G BONHOMME E CATALAN J BRITTON DavipiaN J 1987 Manuel technique de g n tique par lectrophor se des prot ines Paris Lavoisier PEEL D OvENDEN J R PEEL S L 2004 NeEstimator Version 1 3 software for estimating effective population size Queensland Government Department of Primary Industries and Fisheries freely downloadable from http www dpi qld gov au fishweb 11629 html PEMBERTON J M SLATE J BANCROFT D KR Barret J A 1995 Nonamplifying alleles at microsatellite loci a caution for parentage and population studies Mol Ecol 4 249 252 Prry S ALAPETITE A 2003 GeneClass 2 A Software for Genetic Assignment and First Generation Migrant Detection Freely downlable from http www1 montpellier inra fr URLB PIRY S ALAPETITE A CORNUET J M PAETKAU D BauDouIN L Estour A 2004 GeneClass2 a software for genetic assignment and first genera tion migrant detection Hered 95 536 539 Piry S LUIKART G CORNUET J M 1999 BOTTLENECK a computer program for detect ing recent reductions in the effective population size using allele frequency data Hered 90 502 503 296 Postic D GARNIER M BARANTON G 2007 Multilocus sequence analysis of atypical Borrelia burgdorferi sensu lato isolates Description of Borrelia californiensis sp nov and genomospecies 1 and 2 Int J Med Microbiol 297 263 271 PRI
76. Prenons par exemple les effectifs g notypiques suivants V 15 Nj 10 et V3 20 issus du g notypage allozymique d une enzyme quelconque d un chan tillon de vers hermaphrodites pr lev s dans un intestin de mammif re En utilisant les quations 1 et 2 nous pouvons calculer les fr quences all liques p 0 44 p2 1 p 0 56 D o nous pouvons tirer en utilisant 6 N 10 Pont fi _N_ 1 _15 10 20 0 55 H 2p p 21 0 441 0 56 e Ce r sultat se traduit par le fait qu il manque 55 des h t rozygotes attendus sous l hypoth se de panmixie Sion fait l hypoth se que ce d ficit vient de l autof condation Concepts de base en g n tique des populations 41 on peut utiliser les quations 3 et 7 pour estimer le taux d autof condation conduisant au F7 observ En effet on voit bien qu en combinant ces deux qua tions on obtient 5 A E s 5 D o on tire facilement que 2F pe 8 HFa Nous avons ici un premier exemple d inf rence possible l aide de marqueurs mol culaires La connaissance du d ficit en h t rozygotes en supposant que ce dernier ne vient que du r gime de reproduction et qu on est l quilibre g noty pique permet d estimer la proportion d autof condation pratiqu e par la popula tion tudi e Ceci a par exemple permis d estimer ce taux d autof condation dans les populations de lymn es tronqu es escargot aquatique h t
77. THA est provoqu e par Trypanosoma brucei rhodesiense Tbr pour laquelle les premiers sympt mes neurologiques peuvent appara tre au bout de quelques semaines seulement Ce sch ma id al n est pas tou jours tr s clairement suivi in situ et de nombreux variants cliniques sont trouv s pour les deux formes en cons quence de facteurs li s l h te au parasite l environne ment socio conomique ou cologique voire m me une combinaison de tous ces param tres ou d une partie d entre eux MACLEAN et al 2007 Sans traitement les deux formes de la THA conduisent une issue fatale GARCIA et al 2006 WHO 2006b bien que des enqu tes pid miologiques sugg rent de plus en plus lexis tence de porteurs sains capables de contr ler l infection voire m me de la juguler Garcia et al 2006 Apr s la flamb e du d but du xx si cle la THA semblait largement radiqu e dans le courant des ann es 1960 Elle a cependant r merg dans les ann es 1980 en corollaire d une baisse significative de la surveillance de d placements de populations de guerres et de catastrophes naturelles Aksoy et al 247 Glandes salivaires Trypomastigotes Episodes sexu s Trypomastigotes Intestin moyen procycliques Multiplication asexu e Trypomastigotes m socycliques Epimastigotes Trypomastigotes m tacycliques Trypomastigotes 1 hs a Ma Trypomastigotes m tacycliques Mult
78. Terms added sequentially yrst to last Df Deviance Resid Df Resid Dev P gt Chi NULL 857 358 68 Site 135 12 850 322 96 8 197e 06 Year 1 8 86 849 314 10 2 920e 03 La conclusion est donc qu en ce qui concerne Bba seuls le site et l ann e importent Ils expliquent respectivement 1001 35 72 358 68 10 et 1001 8 86 358 68 2 de la d viance totale En proc dant d une mani re identique pour Bbg nous observons qu aucune des variables n explique les donn es alors que pour Bbss en plus du site qui explique 28 de la d viance totale P value lt 0 001 le sexe des tique explique 3 de la d viance P value 0 007 Enfin pour Bbundet le site seul explique 15 de la d viance totale P value lt 0 001 Comme je lai d j signal plus haut la dispersion des r sidus ne suit probablement pas une loi binomiale et la variance est probablement diff rente de P 1 P Pour v rifier cela il faut calculer le param tre Var u X 1 p qui est ici inf rieur 1 sous dis persion en particulier pour Bbss On peut le calculer facilement avec la fonction qua sibinomial voir r ponse 13 Comme seul Bbss a donn quelque chose de significatif pour le sexe des tiques nous allons v rifier cela sur cette bact rie Sous R apr s avoir charg le fichier de donn es si ce n est d ja fait nous allons taper les instructions suivantes gt Bbss lt gl m data formula Bbss Sex Site family quasi binomial li
79. Test de Wilcoxon pour donn es appari es NJ Tree sur distances g n tiques Structure g n tique sexe sp cifique Combiner Binomial g n ralis des tests ind pendants Z de Stouffer F hi rarchiques Isolement par Entre populations la distance Matrices Entre populations GPS Entre individus GPS p 65 80 p 82 p 76 p 70 ps ell p 107 po p 83 p 107 p 98 p 98 pe p 83 p 62 p 88 Fstat Genetix Multilocus Excel Fstat Genepop Genetix Fstat Micro Checker R RMES R R BAPS Flock INSTRUC R MSA et MEGA Fstat MultiTest Excel HierF stat R Genepop 3 Genepop 4 Genepop 4 p 118 195 220 225 256 p 120 147 182 195 p 118 195 219 225 256 p 120 223 235 256 bp MAD USE D 166011097222 p 128 148 174 177 195229 226 pelo Gy p 135 199 234 p 234 p 143 186 197 p 144 254 283 p 147 150 226 p las s r20 222 233 243 p181 p 153 156 210 223 157 p 236 p 200 Annexe 327 Tableau 2 suite Table des mati res RO D en nee EERE 9 POR DOUCE ssh ccc stn cee enn ees a eset encn i gc een ans AA 13 1 CONCEPTS TH ORIQUES ET STATISTIQUES 17 Qu est ce qu un marqueur g n tique 2 19 OO RS Te Ee PCT eee eee 19 Marqueurs cytoplasmiques ni 20 Marqueurs nucl aires ON Seater a ENESE 22 Marqueurs NUCIEAIPES COGOMMMAN TS ccs cree ene ran eemes A aie e
80. arbre est repr sent en figure 98 On peut tout d abord y voir une certaine disparit avec l arbre pr sent en figure suppl mentaire de Korri et al 2009 Ceci est d au fait que nous avons utilis MSA pour calculer les distances harmoniques de Cavalli Sforza et Edwards Je me suis aper u r cem ment que Genetix ne calcule en fait pas la distance harmonique mais une version plus ancienne Ensuite on peut galement remarquer que les souches Tbgl sont toutes ensemble y compris celles de r f rence avec une souche de notre chantillon tr s divergent par rapport aux autres Nous remarquons galement que les souches de r f rence Tbg1 qui proviennent du Congo et du Cameroun se groupent avec les souches de C te d Ivoire et jamais avec la Guin e Ceci est mettre en parall le avec la tr s forte divergence d j mise en vidence plus haut entre les souches guin ennes et les autres Enfin on voit nettement que les autres sous esp ces Tbb Tbr ne cor respondent rien de concret g n tiquement et qu en particulier Tbg2 lui m me tr s h t rog ne n a aucun rapport g n tique avec Thg1 CONCLUSION Apr s avoir exclu un locus manifestement d fectueux nous avons pu d montrer que la technique d isolement ne s lectionne pas des g notypes tr s particuliers en ce qui concerne les g notypes obtenus avec les microsatellites Il appara t donc que lappa rente s lection de g notypes isoenzymatiques prend davantage
81. cette hypoth se sous le diminutif Hp L hypoth se alternative ou H peut tre ind finie par exemple le Frs est diff rent de 0 ou au contraire d finie ou orient e exemple le Fs est plus grand que 0 Dans ce dernier cas on parle de test unilat ral qui comme nous le verrons est en g n ral plus puis sant que le premier ou test bilat ral sauf si on se trompe de direction voir plus loin 4 J utiliserai cet anglicisme tout au long de ce manuel car il est devenu d usage courant comme week end mail ou web 67 Qu est ce qu un test statistique Un test statistique consiste en un calcul plus ou moins compliqu de la probabilit avec laquelle le hasard et seulement lui nous permet d expliquer la d viation obser v e dans un chantillon par rapport ce qui est attendu sous Ho Prenons un exemple tr s simple Je tire deux fois pile ou face Je peux soit obtenir deux piles avec la probabilit 2 soit un pile et une face avec la probabilit 1 2 et deux faces avec la probabilit 2 Je joue et obtiens deux faces Nous allons proc der trois tests statistiques Test unilat ral 1 H la pi ce est bien quilibr e ce que j ai observ n est pas significativement diff rent de l attendu 12 H la pi ce n est pas bien quilibr e j obtiens plus de faces qu attendu Test unilat ral 2 H la pi ce est bien quilibr e ce que j ai observ n est pas signifi
82. cliquer sur GO et laisser le logiciel travailler bien gentiment A Detection of bottlenecks Exit Mutation model FIAM W SMM F TPM Add data Ge ji I gt ET umintemtafo 4 TT ES i es Iterations 11000 ET Statistical Tests sign test V standardzed differences test FF Wilcoxon sign rank test IV Mode shat GO Figure 80 Panneau d entr e de Bottleneck 242 Initiation a la g n tique des populations naturelles Quand c est fini au bout d un petit quart d heure sur ma machine cliquez sur le bouton Save results as text file et nommez le fichier de r sultats et enregistrez le sous son nom cliquez ensuite sur Close puis sur Exit Ce qui vous int resse dans le fichier r sultat correspond aux lignes one tail for H excess pour IAM TPM et SMM En effet en cas de goulot d tranglement r cent il est montr que la perte d all les se fait plus vite que la baisse de diversit g n tique H de Nei Il en r sulte que la diversit g n tique observ e sera plus grande que celle attendue eu gard au faible nombre d all les maintenus si ce nombre d all les refl tait un quilibre entre mutation et d rive Le logiciel explore compte tenu de la distribution des all les chaque locus cette diversit attendue si on tait l quilibre les auteurs l appellent Ha et compare la valeur ainsi estim e de ce param tre avec la diversit g n t
83. contenu dans le fichier nomm et que la premi re ligne contient le nom des colonnes N oubliez pas que les donn es manquantes se notent NA en majuscules et non 000000 gt attach data qui signifie que ce tableau doit tre charg en m moire gt loc8 lt gl m data formula Fis poly Allele 2 Sample Year family gaussian weights Npq o loc8 est le nom d un mod le lin aire g n ralis utilisant le tableau data et dont la r gression tente d expliquer la valeur du Fys en fonction de la taille des all les selon un polyn me d ordre 2 ou quadratique qui s est av r e plus proche de ce qui se passe dans le cas qui nous int resse du sous chantillon d origine et de l ann e Le sexe n a ici aucune importance puisqu il my a que des femelles Nous ne testons leffet d aucune interaction entre variable car en fait je ne vois aucune raison pour qu il en existe Pensez respecter les majuscules s il y en a car R les reconna t comme telles Tapez enfin gt anova loc8 test F qui renvoie une analyse de variance utilisant la statistique F se r f rer un livre de statistique pour approfondir ces notions et donne le r sultat suivant Analysis of Deviance Table Model gaussian link identity Response Fis Terms added sequentially yrst to last Df Deviance Resid Df Resid Dev F Pr gt F NULL 198 21 6160 polyAllele 2 2 0 4021 196 21 2139 2 1174 0 1232242
84. d tails sur les indices d assignement on pourra consulter MANEL et al 2005 LES DESEQUILIBRES DE LIAISON Comme mentionn pr c demment il est indispensable de travailler partir de Pinformation recueillie sur plusieurs loci Un probl me suppl mentaire peut alors survenir sous la forme d une corr lation entre les all les de diff rents loci Nous allons maintenant nous int resser au polymorphisme a deux loci Si ces deux loci polymorphes au moins deux all les chacun sont ind pendants dans une population qui suit les hypoth ses de Hardy Weinberg on s attend a l quilibre retrouver une association al atoire entre les all les des deux loci Comme en g n ral on n a pas Concepts de base en g n tique des populations 65 acc s la phase des gam tes on regarde cela au niveau des g notypes des individus diplo des Donc si D H et R et Dz Hy et R sont les fr quences des g no types 11 12 et 22 aux loci 1 et 2 respectivement on supposera pour simplifier qu il ny a que deux alleles et donc trois g notypes par locus on s attend alors trouver des fr quences de g notypes aux deux loci suivants f 11_11 DD f 11_12 D H f 11_22 DR f 22_11 RD f 22_12 R Hy 22_22 RR Si les fr quences bilocus observ es diff rent de celles d crites dans le syst me d qua tions 43 on dit qu il y a d s quilibre de liaison Il s agit d un d s quilibre statis t
85. dans DELAYE et al 1998 PERS CHEN LA Figure 15 Localisation des sites d chantillonnage des tiques Ixodes ricinus en Suisse et abr viations du nom des sites Les sites marqu s avec un ast risque ont t chantillonn s en 1995 et 1996 116 Initiation la g n tique des populations naturelles Tableau 6 Extrait du fichier de donn es IRTotBrut txt Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern Bern CLC 95 DS 95 95 25 J5 95 95 95 95 J5 95 95 I5 I5 95 95 95 J5 5 15 95 95 E lt Z U Y Y 2 A w m A W w a A A A A a A A a Bern95F_005 Bern95F_007 Bern95F_011 Bermy rats Bern95F_018 Berm gt F 2020 Bern95F_022 Berm 5 F 027 Bern95F_028 Bern95F_029 Bern 951032 Bern95F_037 Bern95F_038 Bern95F_039 Bern95F_040 Bern95F_042 Bern95F_043 Bern95F_044 Bern95F_045 Bern95F_048 Bern95F_049 Bern95F_050 Bern95M_006 Bern95M_008 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 170183 174174 172185 Pere 165178 165173 168171 171175 169175 166176 175185 175185 175185 183183 168174 174178 USS 174176 IAS IVINS 168170 169169 W Weg 150150 137146 000000 136142 137146 145148 134134 147147 140145 128145 134134 147147 135147 134134 141147 146146 000000 130130 145145 147147 000000 150151 134147 137148 123123 a 119119 WOT TEES EIS HO
86. de Frs et For AN mt uFict Ft 1 4Nimt u Fapt 2Fop 1 lt gt AN mt u Fp 1 Fy AN mt u Fr 1 2Fy Nous posons que m gt gt u et donc 4NmF 1 Fr 4NmF 1 2F Nous nous retrouvons donc avec deux valeurs pour Nm in l Fy m 4F s 76 Np L 2Esr 4F Nous savons d apr s les simulations de DE MEEts et BALLoux 2005 que c est le Fy qui donne les meilleurs r sultats c est donc cette formulation que nous retiendrons Les r sultats du calcul des Nm figurent dans le tableau 38 Ils ont n cessit le calcul d un F7s avec son intervalle de confiance 95 de bootstrap dans chaque foyer valeurs moyennes calcul es sur l ensemble des sous chan tillons Pour Boffa un seul sous chantillon si on utilise Fstat qui ne sait pas 274 Initiation la g n tique des populations naturelles travailler sur un seul sous chantillon il faut ajouter un deuxi me sous chan tillon fictif de m me taille que Boffa et fix 111111 pour tous les loci Deux sous populations Avec seulement deux sous populations comme on peut raisonnablement penser que ce soit le cas en Guin e avec Boffa et Dubr ka et en C te d Ivoire avec Bonon et Sinfra KaBa ef al 2006 les quations 70 71 et 73 deviennent g 1 mt m 1 2mt 2m 1 2m1 m 77 4 1 g 1 1 2ml m 2ml m 78 Il n y a cependant pas de fa on simple de r soudre le syst me d quations 73 ici et il faut passer par une r
87. de confiance 95 de Foy et Foy seront Cl Fs7 Fer t 95 ypStdErrLoci Fs7 Cl F 77 Fsry ale to o5 ypstdErrLoci Fs77 avec yL 5 1 4 et yP 8 1 7 correspondant aux degr s de libert des proc dures de jackknife sur loci et populations respectivement En utilisant le tableau 3 nous obtenons alors 05 y1 2 776 et t0 95 yp 2 365 d o l on tire que CI F57 0 004 0 008 et CI Fsr 0 002 0 002 En r gle g n rale je pr f re utiliser le bootstrap car il ne fait pas d hypoth se mais si je souhaite obtenir des intervalles de confiance du Fs pour les diff rents loci je suis bien oblig de le faire avec un jackknife sur populations Comme pour le bootstrap il faut au minimum cing r plicats loci ou populations P P q rep pop pour qu un jackknife soit effectu par Fstat Mise en garde Comme nous l avons vu le nombre de r plicats r chantillonner doit respecter une valeur minimum Il est n cessaire qu il y ait au moins cinq loci et ou sous chan tillons pour que ces proc dures soient effectu es Il est galement n cessaire que ces r plicats soient suffisamment variables un locus monomorphe ou presque pas variable ne pourra pas offrir un r plicat digne de ce nom m me si Fstat effectue la proc dure sans probl me c est dire sans vous pr venir qu il y a potentiellement un souci Tests statistiques 73 Tableau 3 Valeurs du pour diff rents degr s de libert 7 1
88. des all les courts Il existe une proc dure de d tection de la dominance des all les courts dans le logi ciel Micro Checker appel e ici large allele drop out Mais cette proc dure ne teste le ph nom ne que dans chaque sous chantillon pris s par ment Il en r sulte un manque de puissance On peut tester l existence d une dominance d all les courts sur l ensemble des sous chantillons en utilisant une approche de r gression Tests statistiques 109 Tableau 5 Distributions de fr quences des alleles utilis es pour tudier la relation entre Fj et taille des all les dans le cadre d une dominance des all les les plus courts voir la figure 14 ela 0 1000 0 0250 0 6000 0 0025 0 0100 0 3000 112 0 1000 0 0550 0 2000 0 0025 0 0025 0 1000 117 0 1000 0 1000 0 1000 0 0050 0 6000 0 0600 119 0 1000 0 1600 0 0500 0 0100 0 0025 0 0300 121 0 1000 0 3000 0 0200 0 0100 0 0200 0 0100 125 0 1000 0 1700 0 0100 0 0200 0 0050 0 0100 125 0 1000 0 1000 0 0100 0 0500 0 1000 0 0300 127 0 1000 0 0500 0 0050 0 1000 0 2000 0 0600 129 0 1000 0 0270 0 0025 0 2000 0 0500 0 1000 131 0 1000 0 0130 0 0025 0 6000 0 0100 0 3000 Tout d abord pour le locus tudi il faut r cup rer le F de chaque all le dans IS q chaque sous chantillon Fstat ne le fait malheureusement pas automatiquement Il faut cr er autant de fichiers Fstats qu il y a de sous chantillons et dans chacun de quu y ces fichiers il faut cr er une population
89. deux individus de la m me sous population pour le m me locus pris au hasard alors nous avons Q 1 H et Qs 1 H et donc E Qe Q Q Q 10 Ps l Qs l Qs Qui correspond la d finition la plus g n rale du Fy RoussET 2004 POPULATIONS STRUCTUREES EFFET WAHLUND ET STATISTIQUES F L exemple du mod le en les Les populations naturelles d tres vivants ne sont pas distribu es de fa on homog ne sur l ensemble de la biosph re elles sont subdivis es Un tr s grand nombre de mod les de populations structur es existe Le but de cette notice n tant pas de passer en revue tout ce qui existe en g n tique des populations une dizaine de volumes de 500 pages chacun nous nous focaliserons ici sur le mod le en les de Wright WRIGHT 1951 Nous allons supposer que la population qui nous int resse est sub divis e en 7 sous populations de taille V chacune avec 7 tr s grand chaque g n ra tion chaque population meurt en envoyant une infinit de propagules dans le milieu Chaque sous population est ensuite recolonis e par ces propagules avec une propor tion m qui vient d ailleurs et 1 7 qui revient sa population d origine ils n ont pas boug en fait Cela revient dire que chaque sous population est constitu e chaque g n ration de Nm immigrants et de 1 m N r sidents et o les immigrants pro viennent de chacune des 7 sous populations avec la m me probabilit 1 7 elles ont t
90. deux jeux de donn es un pour le femelles et un pour les males avec les donn es clusteris es par BAPS que j ai personnellement nom m s IRTotBAPSClustMalMangIRO8Females dat et IRTotBAPSClustMalManq IRO8FMales dat respectivement et o on aura pris soin d liminer le locus R08 du fichier des m les Quand on a fait ceci pour les femelles et les m les on obtient le jeu de donn es pr sent dans le tableau 17 La corr lation entre le nombre de blancs et le Fy peut tre analys e par un test de corr lation de Spearman test non param trique Ce test est facile r aliser sous R Si le fichier dedonn escorrespondantau tableau 17 s appelle AllelesNulsClustersBAPS txt alors il suffit de lancer R et de se placer dans le r pertoire contenant ce fichier menu d roulant Fichier Changer le r pertoire courant Tableau 17 Donn es pour la r gression entre le nombre de donn es manquantes g notypes blancs et la valeur des Frs pour les diff rents loci chez les m les et les femelles pris s par ment Femelles IR08 10 0 030 IR25 50 0 256 1R27 22 020 IR32 47 0 253 IR39 45 0 076 Males IR25 51 0 368 IR27 21 0 010 IR32 74 0 473 IR39 30 o Ws Ensuite il faut taper les instructions suivantes gt data lt read table AllelesNulsClustersBAPS txt header TRUE gt attach data gt cor test data NBlancs data FiS alternative two sided met hod Spear man 166 Initiation a la g n tiq
91. diff rents syst mes de reproduction Cela signifie qu il ne faut en aucun cas tre esclave du r sultat fourni par ces m thodes et garder la t te froide en toute circonstance D une mani re g n rale BAPS est beaucoup plus facile d utilisation et beaucoup plus rapide mais produit davantage de clusters que ce qu il y a en r alit LATCH et al 2006 INSTRUCT Gao et al 2007 fonctionne comme STRUCTURE mais avec prise Tests statistiques 99 Axe 2 14 1 5 1 0 5 0 0 5 3 1 5 a 0 5 Axe 1 16 Echantillon total A B Echantillons A et B s par s Locus Gpg1962 Moyenne sur les loci Figure 13 R sultat de PAFC sur les g notypes microsatellites des Glossina palpalis gambiensis de Nyafaro au Burkina Faso apr s retrait d un certain nombre d individus trop excentr s voir p 96 Les deux grands groupes A et B d finis selon l axe 2 de PAFC permettent de recalculer le d ficit en h t rozygotes F5 et de constater une chute entre celui mesur pour tous les individus regroup s et celui estim dans les groupes A et B consid r s s par ment Les pourcentages d inertie de chaque axe sont aussi repr sent s voir SOLANO et al 2000 pour plus de d tails en compte de l autof condation Il ne marche qu en ligne http cbsuapps tc cor nell edu InStruct aspx ce qui peut poser un probl me pour les pays mal connect s Enfin il s agit d un domaine en pleine volution et lorsque c
92. disponibles ici sont celles bas es sur l h t rozygotie et les d s quilibres de liaison o nous serons oblig s de consid rer l absence d all les nuls et d effet Wahlund Ces ph nom nes que nous savons probables pour ces chantillons de mouches ts ts auront tendance produire des surestimations de NV pour les m thodes bas es sur lh t rozygotie et des sous estimations pour les m thodes bas es sur les d s quilibres de liaison Nous utiliserons trois m thodes La m thode didentit intra et inter locus de Vitalis et Couvet ViTaLis et Couvet 2001a b c est impl ment e par le logiciel Estim qui accepte le format Genepop pour le fichier de donn es La m thode des d s qui libres de liaison de BARTLEY ef al 1992 est modifi e comme d crit dans l aide du logiciel NeEstimator La m thode des exc s en h t rozygotes se fait tr s sim plement en utilisant l estimateur de Weir et Cockerham du Fx dans la for mule N 1 2F s Fi 1 Frs BALLoux 2004 qui ne donne bien entendu un r sultat valide que si Fis lt 0 Pour ce faire les effectifs par pi ge tant bien insuffisants nous allons devoir regrouper les mouches de diff rents pi ges en fonction de leur proximit voir fig 52 Ceci ne va pas arranger l effet Wahlund mais nous n avons pas le choix Ces regroupements sont synth tis s dans le tableau 27 trois premi res colonnes Les pi ges isol s ne contenant qu une seule mouche ne s
93. donn es brutes sont contenues dans le fichier IrypanoBruceiTotDataGPS txt qui en plus des donn es des 90 isolats cit s plus haut donne les g notypes d un certain nombre de souches de r f rence de Tbg1 de Tbb de Tbg2 des Tbb trouv s chez l homme en C te d Ivoire GrBson 2007 et de Tbr Les donn es se pr sentent comme suit fig 83 250 Initiation la g n tique des populations naturelles Tableau 34 Nombre d isolats Nicolas de Trypanosoma brucei gambiense chantillonn s dans les diff rents foyers et ann es de l tude La surface occup e la taille de la population humaine les pr valences et le nombre pr sum de personnes infect es Pr valence Population sont galement indiqu s Pays C te dIvoire Guin e Surface km Population Nat Bonon Boffa Dubr ka 2000 2002 14 2004 17 2002 20 1998 5 2002 7 2 400 1 600 30 000 25 000 25 000 0 004 0 0118 0 0075 120 295 ey Nous avons besoin de rajouter une information manquante a ces donn es les g no types multilocus MLGs qui est une information extr mement utile en g n tique TIBAYRENC et al 1991 TIBAYRENC 1998 1999 TIBAYRENC et AyALA 2002 DE MEEGS et al 2006 En ce qui me concerne je le fais sous Excel Je charge le fichier sous Excel Je cr e une des populations clonales TIBAYRENC et al 1990 Lo 4 4 4 4 4 4 4 4 4 4 4 4 4 4
94. ees 22 E E AEE AA E ie 23 Pas de tache o des train es non interpr tables sont pr sentes sur le gel 24 Les taches r v l es de tous les individus se retrouvent toutes au m me niveau 24 Les taches r v l es ne sont pas retrouv es au m me endroit 25 en ou 25 Commentaires s r les allozyme Sessera en E E EN 25 EE SEE a E T A N E E A E A OTA 26 Concepts de base en g n tique des populations 29 Calcul des fr quences all liques a partir d un chantillon eesseeieerssn 29 Conformit avec les proportions d Hardy Weinberg ssessisisisieisiseieiesrisiririererennn 29 Les hypoth ses d Hardy Weinberg sisi 29 L quilibre d Hardy Weinberg iii 30 Relaxation des hypoth ses de Hardy Weinberg 31 La population est de taille finie vain siisinsssaiesteressnnvesstroneaweaielinnaieanieneanversebineniviiaaiipacvedsebnliecesvianvenatin ci RO pie anche inten peti osieco E E ERA 31 Mutation r currente 1 23 otairce tarendnediednnctebitiegnusaateanhncGesbeseiaunoieusadul seadinnsdacahetendtnadecenadtunedeuinidianicieqdencieeteds 31 Mod le de mutation en nombre fini d all les ou KAM K Alleles Model 32 IAM ou Infinite Allele Model iii ieieieeeeereeeeeeeeeeeeeneeene 32 SMM ou Stepwise Mutation Model iii 32 Conclusion sur la TURE UO a siitduetincesddssoveahorunendsndineddatandieeddecek bonduedsdiiesdeetagabindawkedasiadevnidbeivretedadnesee 32 DOO VO isc lero sd te
95. efficace par la surface de dispersion Do 21 96 Il nous faudrait maintenant une estimation ind pendante de la densit des tiques sur par celles pour pouvoir estimer la distance moyenne s parant des adultes reproducteurs de leurs parents ___EFFECTIFS EFFICACES Ici trois m thodes sont disponibles la m thode de Barroux 2004 sur les Fis la m thode de Wares et Do 2008 en principe plus fiable que la m thode de Bartley et plus commode impl menter bas e sur les d s quilibres de liaison et celle de ViTaLis et COUVET 2001a c bas e sur les corr lations all liques intra et inter loci Pour les trois m thodes nous allons utiliser le fichier complet avec un sous chan tillon par ferme sous un format Genepop extension gen comme dans la figure 77 Pour estimer les F par sous chantillon avec leur bootstrap nous allons utiliser Genetix BELKHIR ef al 2004 qui offre une proc dure directe par menu d roulant Ouvrez Genetix allez dans le menu Fichier puis Importer Cliquez dans le bou ton Genepop et tapez gen dans la case Nom du fichier comme indiqu en figure 78 Ouvrir Regarder dans E Ne cr Er p lm BoophilusAdultsDataCattleFarm gen Mes documents C FSTAT r cents z a a J Bureau sy f GENEPOP Mes documents Poste de travail Favotis r seau Mom du fichier gen LA Owi Fichiers de type Fichiers Text tut Annuler Texte avec s
96. est Tests statistiques 79 propos dans Fstat qui utilise un test bas sur le G C est le test le plus puissant qui existe mais parce qu il est probable qu aucune population ne soit en conformit avec une panmixie parfaite je conseillerai de ne jamais appliquer ces proc dures et de leur pr f rer celles utilisant les g notypes ne supposant donc pas la panmixie Par ailleurs le test exact ne peut tre effectu que locus par locus ce qui impose une proc dure suppl mentaire pour obtenir un test global voir plus loin le paragraphe sur les tests multiples Ajoutons enfin que les logiciels cit s traitent les donn es haplo des en d doublant chaque all le homozygotie artificielle totale Dans ce cas le test all lique est impossible ou alors doit tre fait sur la moiti des individus si c est possible TESTER LA PANMIXIE GLOBALE Ceci est fait en r associant au hasard les all les des individus de l ensemble de l chantillon un tr s grand nombre de fois On mesure le Fry sur l ensemble des loci Pour le reste la proc dure est identique celle pr sent e pour tester la significativit du Frs Il peut sembler redondant de tester le Fyr apr s avoir test le Fs et le F57 mais dans certains cas cela peut s av rer utile En particulier un Fry nul associ d autres cri t res voir plus loin peut tre diagnostique d une esp ce strictement clonale et for tement structur e en de nombreux d mes
97. est le cas du syst me Rh sus HARTL et CLARK 1989 Dans ce syst me les Rh Rh sont en moyenne d favoris s par rapport aux Rh Rh ou Rh Rh car les femmes Rh Rh ont plus de chance de perdre un enfant quand ce dernier est Rh Rh Le maintien d un tel polymor phisme dans les populations humaines est assez surprenant Tant que le polymor phisme persiste la signature d un tel processus est un d ficit en h t rozygotes par rapport aux attendus de Hardy Weinberg chez les adultes et donc un exc s d homo zygotes pour le locus concern et seulement lui Avec deux all les 1 et 2 de fr quences respectives p et p2 cela donne les fr quences g notypiques p1 pip2Frs 2p1p2 l Fis et po piprF ys pour 1 1 1 2 et 2 2 respectivement avec Fis le d ficit en h t rozygotes voir plus loin Super dominance L non plus le terme n est pas tr s heureux mais c est ainsi Ici ce sont les homo zygotes qui sont moins favoris s ou avantage de l h t rozygote Dans ce cas la population tend converger vers un quilibre stable des fr quences all liques au locus concern et seulement lui Il existe encore une fois peu d exemples naturels de ce ph nom ne Les plus connus sont la r sistance la malaria des patients h t rozygotes pour la dr panocytose ou an mie falciforme R prey 1996 Il y a deux all les au locus responsable Le premier all le dit sauvage et le second dit mutant Les
98. est tr s rarement connu mais peut tre appr hend dans certaines circonstances L exemple du pile ou face ci dessus est typiquement un cas o B est n cessairement tr s grand puisque m me si la pi ce est truqu e on ne pourra jamais le d tecter en ne faisant que deux essais gt Les valeurs du Fis peuvent s carter de 0 en se montrant fortement n gatives ou fortement positives Tests statistiques 69 LE PRINCIPE DES RANDOMISATIONS Dans la plupart des situations rencontr es en g n tique des populations naturelles si ce nest toutes il ne sera pas possible de proc der au calcul des probabilit s exactes telles que dans l exemple du pile ou face Cependant l utilisation de programmes informatiques va nous permettre sans beaucoup d effort d estimer avec une excellente approximation ces P values Il s agit de proc dures de r chantillonnage ou randomi sations Ces proc dures se regroupent en deux grands types Celles du premier type visent obtenir un intervalle de confiance de l estimateur tudi par exemple le Frs l autre vise simuler des populations suivant l hypoth se nulle afin de pouvoir compa rer la valeur observ e celles qu on peut attendre sous Ho obtenues par simulation La plupart des tests d crits dans ce manuel sont disponibles dans le logiciel Fstat 2 9 3 GOUDET 2002 mise jour de GOUDET 1995 qui est tr s convivial D autres logiciels sont aussi utiles Genepop
99. estimer le d ficit artificiel d h t rozygotes observ par rapport aux attendus panmictiques H E amp 1 65 wp le 2 Dans la figure 14 il mest pas inint ressant de constater que la relation entre taille des all les et leur d ficit en h t rozygotes n est ni lin aire ni monotone et d pend de 108 Initiation la g n tique des populations naturelles pi uniformes Pien cloche pi d croissants ____ pi croissants pi randomis s pi uniformes s u pl en cloche pi uniformes pi en cloche pi d croissants ____ pi croissants pi randomis s pi uniformes sass pl en cloche spi d croissants spi d croissants pi oan pi croissants pi randomis s pi randomis s Taille des all les Taille des all les Figure 14 Evolution du F s en fonction de la taille des all les pour une gamme de taille microsatellites allant de 111 131 paires de bases pour diff rentes distributions de fr quences des all les voir le tableau 5 et pour diff rentes valeurs de dominance des all les courts a la distribution des fr quences des all les le tableau 5 d crit les diff rentes distributions utilis es mais globalement on s attend quand m me observer une d croissance de F en fonction de la taille des all les On constate aussi que ce ph nom ne modifie galement l estimation des fr quences des all les Du point de vue pratique d tection de la dominance
100. fa on consanguine ce qui pourrait expliquer le d ficit en h t rozygotes observ Rappelons que selon l quation 66 voir aussi r ponse 11 le taux de croisement fr res s urs n cessaire expliquer un Frs 0 044 se d duit de 4F S _ 0 16 lt 3F Pour explorer le r le possible d un appariement entre apparent s nous allons tester sil y a pangamie appariement au hasard dans nos donn es Nous allons utiliser pour ce faire la m me technique que celle d velopp e par PRUGNOLLE ef al 2004b Il s agit d un test de Mantel de corr lation entre deux matrices une matrice d cri vant l apparentement entre chaque paire d individus de sexes diff rents et une matrice d crivant le statut appari 1 ou non appari 0 des individus tant donn qu il y a une diff renciation g n tique substantielle entre fermes nous devrons entreprendre quatre tests s par s un par ferme Cependant comme certaines fermes poss dent norm ment d individus g notyp s Port Laguerre o le test de Mantel de Fstat ne marchera pas et par souci dhomog n it nous travaillerons par individu h te autant de tests que d h tes disponibles sur l ensemble de l chan tillonnage Nous allons mesurer l apparentement entre individus avec le logiciel ML Relate KALINOWSKI et al 2006 t l chargeable librement http www montana edu kalinowski Software htm Ce logiciel prend directement des fichiers Genepop Construise
101. fac teur technique d isolement afin en cas de non significativit de pouvoir ignorer ce facteur et travailler sur de plus grands sous chantillons TESTER L EFFET DE LA TECHNIQUE D ISOLEMENT ___DES SOUCHES 7 Cr ation d un fichier Fstat et MSA Nous allons utiliser ici les proc dures F7 par paire de sous chantillons et les tests de diff renciation par paire de sous chantillons sous Fstat et aussi cr er un dendrogramme Nous ne pouvons pas utiliser HierFstat ici car le facteur technique d isolement est 252 Initiation la g n tique des populations naturelles un facteur crois ou orthogonal et non pas hi rarchis comme cela est requis pour HierFstat voir la discussion ce sujet dans DE MEEts et GOUDET 2007 Il faut donc cr er ce fichier avec par exemple Create il s agit juste d une suggestion N oubliez pas de cr er une nouvelle colonne qui informe sur le foyer l ann e et la m thode d isole ment BonOOKI pour Bonon 2000 KIVI et de trier selon cette colonne Quand cela est en ordre on lance Create pour convertir le fichier au format Fstat et MSA qui nous servira construire une matrice de distances g n tiques N oubliez pas de sup primer la colonne suppl mentaire inutile du fichier lab que Create va cr er Vous pouvez galement raccourcir les noms de fichiers 4 votre convenance Analyse Fstat par paire de sous chantillons Il faut charger ensuite le fichier dat sous
102. femelle Ceci ne contredit pas que l effet Wahlund pourrait tre issu de la pr sence dans chaque site d individus issus des m mes pontes Ceci implique une forte variance du succ s de survie entre pontes de nombreux individus issus seulement de quelques pontes acc dent l ge adulte voir CHEVILLON et al 2007a pour un r sultat similaire sur la tique du b tail 10 Je me suis rendu compte sur le tard que Genetix contenait quelques bugs dans ce module et je conseillerai d utiliser plut t MSA pour le calcul de distances bien qu ici cela mait pas chang grand chose raison pour laquelle j ai laiss l analyse telle quelle Pour l utilisation de MSA se r f rer la seconde partie de ce manuel p 254 144 Initiation la g n tique des populations naturelles Figure 32 Dendrogramme ex cut selon la m thode du NJTREE sur les distances harmoniques de Cavalli Sforza et Edwards entre paires de clusters BAPS de taille sup rieure ou gale a 3 dans chaque sous chantillon des tiques de 1996 Les clusters tunisiens sont indiqu s en rouge Commentaires sur l analyse des fichiers par BAPS Contrairement ce qui pourrait tre sugg r la lecture du manuel d utilisation de BAPS les clusters obtenus ne pr sentent pas ici une structure panmictique mais conservent un d ficit important d h t rozygotes sauf pour IRO8 Nous verrons avec les analyses suivantes que ces clusters refl tent probablement en gr
103. fichier texte doivent se pr senter comme dans la figure 76 Genepop 4 doit tre copi dans le r pertoire de travail Cliquez deux fois sur le logiciel Une fen tre s ouvre o il vous est demand de taper le nom du fichier de donn es En ce qui me concerne il sagit de BoophilusAdultsDatalsoldistFarm txt Si tout se passe bien il vous demande de e lt 4 cc D e oe cliquer sur la touche Return ou Entr e en fran ais Il vous faut ensuite choisir le 236 Initiation a la g n tique des populations naturelles pe Dats B microplus pour 1is0oldist 2 Bizg 3 C074 4 D12 5 piog 6 A124 7 cosy A Pop 9 16603 91667 2186 444444 5 145192 os 0 16603 91667 2186 444444 nu 179179 104 L 16603 91667 1186 444444 NA 179192 os 2 16603 91667 2186 444444 145192 os 3 16603 91667 2186 444444 rancia 179179 a 4 16603 91667 2186 4444446 ons 145179 1i 5 16603 91667 2186 44444d 5 oat 175179 104 6 16603 91667 2166 4444445 1 194198 145192 mip 7 16603 91667 2186 444444 a 145145 og B 16603 91667 2186 444444 5 pci 179179 1i S 16603 91667 2186 4444445 REA 145179 10 0 16603 91667 2186 444444 p5 aii 145192 os 1 16603 91667 2186 444444 5 taaa 179192 os 2 16603 91667 1186 444444 gt 194398 145176 os 3 16603 91667 2186 444444 1 RO 145192 og 4 16603 91667 2166 444444 EPA 179179
104. individus sont atteints d une maladie g n tique grave survie et reproduction tr s compromises les individus sont normaux mais les individus sont en moins bonne sant que les sauf dans les populations soumises une forte pression par Plasmodium falciparum l agent le plus virulent de la malaria Dans ce dernier cas les ont des taux de survie inf rieurs celui des qui eux m mes survivent mieux que les qui sont tr s malades quelles que soient les conditions il y a super domi nance Notons que ces modes de r sistance sont co teux en termes de zygotes produits puisqu une grande partie des individus produits chaque g n ration sont homo zygotes et donc moins bien adapt s Une chappatoire ce travers peut provenir du syst me de reproduction s il fait en sorte qu une majorit d h t rozygotes soient issus de la reproduction Ceci se traduirait par un co t au niveau reproductif choix du conjoint et les individus h t rozygotes produits sont tous condamn s une descen dance imparfaite La signature de ce ph nom ne sur des marqueurs g n tiques est bien videmment la pr sence d exc s d h t rozygotes par rapport aux attendus de 34 Initiation la g n tique des populations naturelles Hardy Weinberg pour le seul locus concern par cette s lection bien videmment et ventuellement pour les loci les plus li s au g ne sous s lection auto stop La s lection fr q
105. l aide en ligne de Fstat p t fichier N Il focaliser sur les chantillons 1996 uniquement Une fois ce fichier constitu il faut lancer Fstat cliquer sur le menu Biased dispersal et y charger le fichier requis Il faut ensuite s lectionner le test Two sided on n a en principe pas de pr jug pour l instant et cocher toutes les options comme dans la figure 33 Vous remarquerez dans la figure 33 que les cases du Frs et du H sont coch es comme les autres alors que cela n a aucun sens En effet puisque nous avons cod les m les Bias dispersal tests ME File Help Data file being processed is IRTotBrutSexBiasd C One sided test Letter for the most philopatric group IF Letter for the other group M M Mean assignment Hest V Variance of Assignment M Fst M Fis M Relatedness M Ho QHs Figure 33 Menu et cases cocher dans le menu Biased dispersal 148 Initiation la g n tique des populations naturelles homozygotes au locus R08 il y aura n cessairement une diff rence m le femelle ce niveau Cependant quand cette option n est pas coch e on perd une partie de l information sur H dans le fichier de sortie Il conviendra donc dans ce fichier d ignorer les r sultats sur H et Frs Le logiciel cr e cing fichiers trois fichiers dat au format Fstat les donn es totales les femelles les m les le fichier de permutations et le fichier res des r sultats le plus uti
106. la diversit g n tique se trouve comme gel e au niveau de la popula tion totale m me si totalement perdue dans chaque sous population chaque sous popu lation se retrouve rapidement fix e dans un tat g n tique Une excellente revue sur le calcul des effectifs efficaces chez les parasites peut tre consult e pour ceux qui souhaitent approfondir davantage cette question CRISCIONE et BLOUIN 2005 Qu est ce qu un marqueur g n tique 21 l h t rozygotie de marqueurs codominants se montre un auxiliaire pr cieux J ai donc d lib r ment choisi de ne pas traiter davantage cette famille de marqueurs MARQUEURS NUCL AIRES DOMINANTS Avec des marqueurs dominants les individus h t rozygotes donc diplo des sont vus comme homozygotes pour un des deux all les pr sents chez l individu Cet all le est alors appel dominant par rapport l autre all le qui invisible l tat h t rozygote est qualifi alors de r cessif Ici le ph notype ne refl te pas fid lement le g notype Une des familles les plus connues de marqueurs dominants correspond aux RAPD Randomly Amplified Polymorphic DNA Des paires d amorces courtes d ADN sont utilis es afin d amplifier par PCR des portions al atoires d un ADN cible chaque fois qu une compl mentarit est trouv e Par cons quent chez les esp ces diplo des les individus pour lesquels aucune compl mentarit n existe seront caract ris s par une absence de pro
107. la g n tique des populations d ricinus en Suisse 165 Interactions avec les micropathog nes transmis 169 OO ecco deen nte th EE E EEEE EENE 169 Pr sentation des donn es iii 170 Distribution des diff rentes borr lies dans les femelles et m les d l ricinus n 170 Co occurrence des diff rentes esp ces de borr lies 174 Occurrence des diff rentes esp ces de borr lies et g n tique des tiques 179 Diff renciation entre tiques infect es et non infect es cece ceecccceeecceseeeeeseeeeeeeeeeeeeseeeeesseeceeaaeeeeeneeees 179 Diff renciation entre tiques infect es par diff rentes borr lies cc cece cc ceeccce se cceceeeeceeseeeceeueeeeeueeeeeeaaeees 182 Biais de structuration sp cifique associ au pathog ne cecccseecccsseecceseeeeeeseeeeeseeceeseesceeeeeeeeeseeeeeaaeees 182 Biais de structuration sp cifique au pathog ne et au sexe 186 Conclusions sur les borr lies et ricinus en Suisse 187 Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 189 AAAULELE IC ALLO PP sate cuenta onsen aacenoespeniia eanae tua mesinsoee lt euue tunes Oonstircnae rattan anstiee tonal aan A 189 Seino Eca T a a a el a 189 Premier recodage GCS CONICS orrae E E E 191 Premi res analyses ind pendance entre all les dans et entre loci 195 D s quilibres de liaison au sein des quatre zo
108. la mise en place d un test global sur l ensemble des loci comme on le retrouve dans Fstat nl np na Ge PP Nula 2 46 1 kel il Nu Pi o indique le locus et nl est le nombre total de loci amp les sous chantillons et up le nombre total de sous chantillons z l all le et za le nombre total d all les au locus dans la population k Njz est le nombre de fois que l all le 7 du locus amp est rencontr dans la population N est le nombre d all les deux fois la taille du sous chan tillon chez des diploides du locus dans le sous chantillon amp et p est la fr quence moyenne de l all le du locus dans tout l chantillon C est donc cette statistique qui est calcul e sur les donn es observ es et pour chaque randomisation des indivi dus entre sous chantillons Test exact all lique de Rousset et Raymonp 1995 Il existe une autre solution pour tester la diff renciation entre d mes mise au point par Raymon et Rousset 1995a Il s agit d un test purement all lique qui fait donc l hypoth se d une ind pendance totale des all les dans les individus panmixie parfaite Pour que ce test soit valide il est donc indispensable que les g notypes soient en parfaite conformit avec les attendus sous Hardy Weinberg car ce sont les all les qui sont ici randomis s entre sous chantillons Ce test est propos comme test all lique dans Genepop Une proc dure quivalente le test assuming HW
109. la plus vagile Ensuite l appartenance une cat gorie m le ou femelle est re distribu e au hasard pour chaque individu de chaque sous chantillon en gardant les individus dans leur sous chantillon et en conservant la m me proportion de chaque cat gorie m me sexe ratio et la statistique est mesur e Cette randomisation est r p t e un grand nombre de fois afin d obtenir une distribution des valeurs possibles sous Hp pas de diff rence de disper sion laquelle la valeur observ e est compar e Les tests peuvent tre unilat raux ou bilat raux Dans ce dernier cas ce sont les valeurs absolues des diff rences dans 53 et 55 ou le ratio de la plus grande sur la plus petite valeur de chaque randomisation qui sont utilis s Ces mesures et randomisations sont toutes impl ment es dans Fstat menu biased dispersal Ces proc dures ont t utilis es avec succ s pour mettre en vidence dans les populations suisses de la tique xodes ricinus un biais de dispersion sexe sp ci fique les femelles repr sentant le sexe peu ou pas dispersant DE MEEUs et al 2002a et un biais de dispersion pathog ne sp cifique les tiques infect es par le spiroch te Borrelia afzelii dispersant tr s peu ou pas du tout DE Meets er al 2004b De m me PRUGNOLLE et al 2002 ont pu mettre en vidence une structure g n tique sp cifique du sexe chez le tr matode Schistosoma mansoni infectant des rats en Guadeloupe Dans
110. le faible nombre de Bbg d tect es rend les choses difficiles interpr ter et tr s signifi catives pour les couples Bbal Bbundet et Bbssi Bbundet Cette derni re observation peut laisser sp culer que ces borr lies ind termin es soient majoritairement des borr lies d oiseaux Bbg et Bbv tr s d ficitaires dans notre jeu de donn es Dans ce cas nous pourrions proposer que les larves et nymphes sensibles se subdivisent en tiques ne se nourrissant que sur une gamme limit e d h tes r servoirs de borr lies sp cifiques Tout d pend de l identit sp cifique de ces Bbundet Les donn es ne permettent pas d exclure l existence d une telle sp cificit en races d h tes La mani pulation de la sp cificit des tiques par les borr lies ne peut pas non plus tre exclue C est aussi cette manipulation qui expliquerait le biais de structuration des tiques infect es par Bba D une mani re g n rale on ne peut que regretter le nombre de donn es manquantes qui limite nos conclusions mais aussi remarquer que malgr cela de nombreuses perspectives nouvelles de recherche ont merg qui illustrent la puissance des outils offerts par la g n tique des populations 188 Initiation la g n tique des populations naturelles Giossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso INTRODUCTION Ce jeu de donn es a fait l objet d un article BOUYER et al 2009 Il permettra de r viser pl
111. le 12 indi vidu 000000 partout sauvez puis recommencez a marche Ensuite on enre gistre les quatre fichiers de donn es sous un autre nom pour les analyses avec par exemple A_e txt H_e txt C_e txt et D_e txt quelle imagination mais o va t il les chercher Nous nous retrouvons donc avec huit fichiers ISO que Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 201 nous pouvons ouvrir avec nimporte quel diteur de texte Vous pouvez aussi remettre le son Nous souhaitons savoir si 4Do gt 10 000 D apr s ce que nous avons vu en p 89 de la premi re partie de ce manuel le voisinage est gal Nb 1 6 4Do Nous souhaitons v rifier si Nb gt 10 000 afin de d cider si c est le param tre 4 ou qu il vaut mieux utiliser C est le cas uniquement pour le site avec la statistique 4 En outre vous remarquerez que la statistique 4 donne de bien meilleurs r sultats avec ces donn es de glossines On sait par ailleurs que ce type de tests est tr s conservateur et que 4 n est pas biais alors que l est WATTS et al 2007 Nous ne consid rerons donc que les r sultats obtenus avec 4 Les r sultats pour les quatre zones et la moyenne sur l ensemble figurent dans le tableau 26 Il y a donc bien un isolement par la distance mais les pentes sont tr s faibles Cela signifie que les voisinages sont tr s laches beaucoup d change entre voisins o grand et ou de grande taille D
112. le parmi les K existants avec la m me probabilit y compris en lui m me Plus K est petit plus fr quente est homoplasie Linkage disequilibrium Voir D s quilibre de liaison Locus D crit une portion de l ADN situ e dans une position sp cifique du g nome Un locus ne correspond pas n cessairement un g ne Logistique Se dit d une distribution de donn es disjointes en vrai et faux ou 0 et 1 voir aussi Gaussienne et Poissonienne M tapopulation Une population compos e de plusieurs unit s sous populations ou d mes Chaque sous population peut tre caract ris e par une probabilit d extinction ou de recolo nisation Les d mes peuvent aussi tre stables comme dans un mod le en les M iose Processus de production des cellules de la reproduction sexu e ou gametes C est au cours de ce processus qu ont lieu la s gr gation des all les chaque locus et la recom binaison entre loci pour aboutir la formation de cellules haploides Microsatellite El ment constitutif de l ADN des eukaryotes Il sagit de courtes s quences r p t es d ADN r parties dans le g nome et la plupart du temps sans fonction connue Mutation Erreur h r ditaire intervenant lors de la duplication de l ADN Monoique Synonyme d hermaphrodite antonymique de dio que Glossaire 319 Moyenne Valeur unique x que devraient avoir les N individus i d une population ou d un chantillon pour que leur to
113. m les par des carr s En fait pour tre pr cis le locus IRO8 avait t trouv h t rozygote pour quatre individus m les sur l ensemble du jeu de donn es M me si cela pouvait refl ter des duplications toujours possibles comme voqu p 118 nous avons choisi d limi ner ces individus car ils pouvaient correspondre des erreurs de manipulations Quoi qu il en soit il va donc falloir recoder les donn es ce locus Pour l analyse des Frs les m les devront en effet tre cod s en donn es manquantes 000000 au La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 123 locusIRO8 Nousallonsdonccr erun nouveau fichier IRTot TestPanmixMalManqIRO8 dat partir du pr c dent et refaire l analyse globale du Fjs Celle des d s quilibres de liaison qui est un test g notypique n a aucune raison d avoir t affect e par ce ph nom ne Dans Fstat nous cocherons donc les m mes cases qu en figure 16 l excep tion de celles concernant les d s quilibres de liaison Dans le fichier de sortie IRTotIestPanmixMalManqlRO8 out nous constatons l image suivante voir aussi la figure 20 rien ne change sauf pour le locus RO8 qui montre les plus basses valeurs de Frs mais qui restent tr s significativement toutes les P values sont inf rieures ou gales au minimum possible 0 0001 au dessus de la valeur nulle attendue sous panmixie Notez au passage que je ne me sers des
114. m me en ce qui concerne la propagation des maladies par les tiques CONCLUSIONS SUR LA BIOLOGIE ET LA G N TIQUE DES POPULATIONS D RICINUS EN SUISSE Il existe un d ficit important en h t rozygotes dans les populations d Z ricinus Frs 0 39 dont une majeure partie 64 est expliqu e par un effet Wahlund important Le F s 0 14 r siduel correspondrait du stuttering de la dominance d all les courts et des all les nuls Pour tester les all les nuls dans les clusters de BAPS on ne peut pas utiliser Micro Checker chantillons trop petits Nous pouvons n anmoins tester s il existe une relation positive entre le nombre de blancs un locus et le Fy ce locus En effet en reprenant les donn es cluste ris es et en s parant les males des femelles en deux fichiers il est facile de comp ter les blancs pour chaque locus avec la fonction SI d Excel Il suffit de cr er La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 165 autant de nouvelles colonnes qu il y a de loci et de remplir chacune avec les instructions de type SI G2 000000 1 0 pour inscrire 1 quand on a un blanc A la fin de chacune de ces colonnes on tape une instruction du type somme L2 L147 pour obtenir la totalit des blancs ce locus sur l ensemble des clusters Le Frs de chaque locus est r cup rable dans les deux fichiers de sortie Fstat de l analyse des
115. m thode simple pour se rendre compte de ce ph nom ne comme nous le verrons plus loin en p 60 Pour obtenir l quation 24 nous avons galement fait l hypoth se d un nombre infini d all les possible IAM Il se peut cependant que le mod le de mutation s carte fortement de cet id al ce qui peut alt rer les valeurs d quilibre des statis tiques F Rousser 1996 Dans le cas dun KAM Rousset 1996 montre que les statistiques F attendues sont les m mes que pour un IAM mais avec un taux de mutation augment de K K 1 Pour l quation 24 cela donnerait 1 bp 25 AN m u 1 D une mani re tr s analogue dans le cas d un mod le en les fini nombre d les 7 petit on montre que l quation 23 devient toujours pour m petit en partant par exemple de ROUSSET 1996 l Ppt a 26 4Nm 1 ne Il est galement utile de remarquer que les quations 23 et 24 sont obtenues sous Phypoth se d un mod le en les infini l quilibre entre migration mutation et d rive Rel cher ces hypoth ses peut alors fortement limiter nos capacit s d inf rences sur le nombre effectif de migrants WHITLOCK et McCautey 1998 Ainsi Pestimation du Nm partir du F7 n est bien souvent qu un quivalent mod le en les C est aussi pour ce genre de probl mes que d autres types de mod les de popu lations structur es ont t imagin s Pertinence du mod le en l
116. n ral mieux adopter l option mononucl otidique pour tous les loci Ensuite parmi les r sultats que propose Micro Checker il faut garder pour chaque locus et chaque sous chantillon la fr quence des all les nuls ainsi que la pr sence ou non de stuttering Il vaut mieux utiliser la m thode 2 de BROOKFIELD 1996 qui tient compte des donn es man quantes doubles nuls La fr quence attendue d homozygotes blancs sera sous l hypoth se de croisement au hasard gale p f On peut comparer par un test binomial cette fr quence attendue aux nombres de blancs effectivement observ s ce locus dans le sous chantillon concern Ce test permet de v rifier si les all les nuls expliquent raisonnablement les d ficits observ s aux loci concern s On peut demander Michel Raymond Isem universit Montpellier 2 le droit d utiliser un petit programme qu il avait con u et qui s appelle Multinom effectuant tous les tests multinomiaux possibles ainsi que puisque qui peut le plus peut le moins le test binomial On peut galement utiliser le logiciel R qui est gratuit avec la commande binom test solution r ellement la plus simple MicroChecker ne peut pas travailler avec des sous chantillons trop petits il ren voie un message d erreur dans ce cas Si la plupart de vos sous chantillons 106 Initiation la g n tique des populations naturelles renvoient un message d erreur d la faiblesse des effectifs il
117. ne anc tre Les deux g nes d un individu pourront tre identiques parce qu ils proviennent du m me grand parent et que ce dernier aura donn deux fois le m me g ne ou un g ne diff rent mais d j identique par ascen dance Ils pourront aussi tre identiques s ils proviennent des deux grands parents si ces derniers ont des g nes identiques par ascendance Comme on peut le voir dans la figure 99 la constitution g n tique d un individu de la g n ration peut suivre 16 v nements diff rents et quiprobables Dans la moiti des cas les deux g nes d un tel individu proviennent d un m me grand parent et dans l autre moiti des cas d un des deux grands parents Quand les deux g nes proviennent d un m me grand parent la probabilit de pr lever deux fois ce m me g ne est de 1 2 pour le premier g ne et la m me chose pour le second soit P memes m me grand parent 1 2 et celle de pr lever les deux g nes diff rents est aussi P diff rents m me grand parent 2 Mais dans ce cas ils ne peuvent tre identiques par ascendance qu avec la probabilit de le coefficient de consanguinit des grands parents de l individu concern Par cons quent la probabilit que deux g nes d un individu de la g n ration soient iden tiques par descendance et proviennent d un m me grand parent sera de m me grand parent P 2 m mes m me grand parent P 2 diff rents m me F Id m me grand
118. nes r sistants anticiper les strat gies de lutte Ce manuel didactique pr sente les principales m thodes de la g n tique des populations naturelles et les mod les de base utilis s pour les inf rences avec des cas concrets d applications destination des tudiants et personnels de sant Plusieurs jeux de donn es sont analys s pas pas dans un CD ROM qui accompagne l ouvrage L LA E k f C L6 Fin r l ba b j Me 1 a f J 4 i a D en 7 1 LE 1e Dee ii r j 9 782709 917322
119. notre propos ici le test binomial n exige pas de conna tre la P value exacte des tests a combiner m me si cela est pr f rable ce qui peut repr senter un avantage certain lorsque l on combine des donn es de la litt rature On pourra trouver une discussion plus th orique de ce type de probl mes dans la litt rature GOUDET 1999 WuitLock 2005 DE MEEts et al 2009 La proc dure de Fisher sera ad quate dans certaines configurations de distribution des P values en U en cloche en L ou en J autres que la distribution uniforme Il est en effet important de faire attention a cela et ne pas tre esclave de ses donn es La pr sence d une P value 0 devrait en toute rigueur interdire l utilisation de la pro c dure de Fisher La proc dure de Fisher r pond davantage la question y a t il au moins un test significatif Le SGM est quant a lui tr s trop conservateur une propri t qui pourrait s av rer utile dans le cadre des m ta analyses sur jeux de donn es publi es o le biais de publication en faveur des r sultats significatifs pourrait tre ainsi partiellement corrig D terminer quels sont les tests significatifs proc dure de Bonferroni Une autre configuration pourrait nous amener rechercher lesquels parmi ces 8 q k tests sont r ellement significatifs Ce peut tre le cas si on recherche un mar queur de sous dominance au milieu de plusieurs marqueurs quels loci sont d ficitai
120. nous avons utilis toute l informa tion concernant la somme des x Par cons quent quand on proc de la somme des xx et que lon arrive au 1 terme on a d j toute l information le n terme apporte une information redondante C est pour cela que l on divise par n 1 degr de libert Si on divise par au lieu de 7 1 on sous estime la variance estimation biais e On voit bien que plus n augmente moins le biais est important Pour les F de Wright que l on peut faire correspondre des rapports de variance le m me type de ph nom ne se rencontre Imaginons par exemple que je suis tr s paresseux et que je n chantillonne qu un individu par sous population Dans ce cas j aurais un individu soit homozygote soit h t rozygote dans chacune de mes sous populations Je ne peux calculer alors un Frs que dans les sites polymorphes c est dire ceux o j ai trouv un h t rozygote avec p p 0 5 En appliquant l quation 19 on calcule F A AP 1 A 22 P S Le biais est ici norme on sous estime le d ficit de 100 puisque en effet on ne peut s attendre rien d autre que cette valeur de 1 qui bien videmment n a pas d autre sens Lestimation non biais e des param tres F est beaucoup plus complexe que pour une simple variance Les estimateurs f 0 et F de Weir et Cockerham WEIR et COCKERHAM 1984 sont des estimateurs non biais s des Fis le Foy et le Fry de Wright respecti
121. of host parasite coevolution Ecol Lett 5 246 256 GANDON S CAPOWIEZ Y Dusois Y MICHA LAKIS Y OLIVIERI L 1996 Local adaptation and gene for gene coevolution in a metapopulation model Proc R Soc Lond B 263 1003 1009 Bibliographie 291 Gao H WiLLiAMsON S BUSTAMANTE C D 2007 A Markov chain Monte Carlo approach for joint inference of population structure and inbreed ing rates from multilocus genotype data Genetics 176 1635 1651 Garcia A Courtin D Soran P Korri M JAMONNEAU V 2006 Human African trypanoso miasis connecting parasite and host genetics Trends Parasitol 22 405 409 GERBER A S Loccins R Kumar S DOWLING T E 2001 Does nonneutral evolution shape observed patterns of DNA variation in animal mitochondrial genomes Ann Rev Genet 35 539 566 Gipson W 2007 Resolution of the species problem in African trypanosomes Int J Parasitol 37 829 838 GOLDSTEIN D B SCHLOTTERER C 1999 Microsatellites Evolution and Applications Oxford Oxford University Press GoupetT J 1995 Fstat version 1 2 a computer program to calculate Fstatistics J Hered 86 485 486 GouDET J 1999 An improved procedure for testing the effects of key innovations on rate of speciation Am Nat 153 550 555 GoupET J 2002 FSTAT a program to estimate and test gene diversities and fixation indices ver sion 2 9 3 2 Av
122. ou de d mes ROUSSET 1997 2000 Estimateurs non biais s des statistiques F Les d finitions pr sent es dans les quations 19 et 21 correspondent aux d finitions param triques des F de Wright Dans la r alit le nombre de sous populations et le Concepts de base en g n tique des populations 51 Figure 8 Repr sentation graphique des mod les en pas japonais stepping stone une a deux b et trois c dimensions Dans ces mod les chaque d me de taille N n change ses Nm migrants qu avec les d mes adjacents nombre d individus chantillonn s par sous population sont tous les deux limit s Le g notypage d individus sur plusieurs marqueurs g n tiques ne peut se faire que sur quelques sous populations et sur un chantillon d individus de ces sous populations 52 Initiation a la g n tique des populations naturelles Nous pouvons ici faire un petit rappel de statistiques de base Pour un chantillon de taille n o on mesure un caract re variable x dont la moyenne est x la variance aura la forme le _ Ix ET x 3 27 N il si et seulement si on a chantillonn et mesur x sur tous les individus de la popula tion On aura alors une mesure param trique de la variance Dans le cas contraire on doit appliquer la formule d estimation de cette variance partir de notre chantillon de taille 7 1 EE 28 n lal s x Ceci vient du fait que pour calculer la moyenne
123. ou pri mers en anglais Pour ce faire soit quelqu un d autre a d j d fini ces s quences et mis au point les techniques de PCR pour l esp ce tudi e ou ventuellement sur une esp ce proche soit vous avez vous m me d fini ces s quences partir d une banque g nomique s quenc e pr existante soit vous avez constitu vous m me une banque g nomique suivie d un screening appropri recherche de s quences microsa tellites l aide de sondes sur le d tail duquel je ne m tendrai pas Le lecteur pourra cependant se r f rer aux protocoles d taill s disponibles sur internet Citons titre d exemple celui de Toonen 1997 qui semble assez complet Admettons que nous ayons ces fameuses s quences amorces notre disposition Lextraction de l ADN de chaque individu est suivie partir d une partie ou aliquote de cet ADN d une amplification par PCR sp cifique gr ce aux amorces de la s quence voulue et du marquage radioactif ou fluorescent du produit d amplification Une lectrophor se sur un support donn gel de polyacrylamide solution tampon va ensuite permettre de discriminer les diff rents all les en fonction de leur taille Il y aura donc autant de bandes ou de pics s quenceur automatique diff rents qu il y a d all les et tous les h t rozygotes auront deux bandes ou deux pics fig 5 Notons que si la s quence flanquante mute au niveau d un des deux primers de telle sorte que lappa ri
124. p p2 et po d Hardy Weinberg Seules les fr quences all liques changent Cette s lection peut cependant modifier le degr de diff renciation entre populations diff rentes aux loci concern s En fonction des cas elle peut diminuer la diff renciation s lection convergente quand la direction de la s lection est la m me d un site l autre Elle peut au contraire augmenter cette diff renciation lorsque la direction de s lection est variable d un site l autre s lection divergente ou disruptive voir par exemple DE MEE S et al 1993 DE Meets et GOUDET 2000 DE Meets 2000 Normalement cette forme de s lection n est perceptible qu aux loci g nes concern s et ceux qui leur sont li s auto stop et pas aux autres marqueurs C est donc un ph nom ne locus sp cifique Concepts de base en g n tique des populations 33 Sous dominance C est le nom qu on lui donne m me si ce n est gu re explicite pour ne pas dire tr s mal choisi Il s agit d une s lection qui d favorise les h t rozygotes Cette forme de s lection conduit th oriquement l limination de l all le le moins fr quent En effet sil y a panmixie l all le le plus rare sera le plus souvent h t rozygote vous n avez qu v rifier cela dans les proportions attendues chez les zygotes et donc le plus souvent d favoris Il existe peu ou pas d exemples de sous dominance L exemple le plus connu qui s en rapproche le plus
125. par la position de quelques individus exceptionnels Il est souvent n cessaire de retirer plusieurs individus de l analyse et parfois m me un grand nombre Dans l chantillon de Nyafaro Burkina Faso dans Sorano et al 2000 pr s de 42 des individus ont d tre ainsi car t s de l analyse afin de pouvoir d celer une sous structure dans les individus restants 60 sur les 97 Analyse en composantes principales ACP Une ACP PCA en anglais suit le m me principe que AFC sauf que ce sont des donn es ordinales continues qui sont utilis es au lieu de donn es disjonctives Ici ce sont des groupes d individus sous chantillons qui seront positionn s dans un hyperespace de K dimensions Les coordonn es de chaque groupe sur chacun des axes principaux peuvent tre utilis es pour des analyses statistiques suppl mentaires telles que des analyses de variance ou autres r gressions comme dans N BAVI et al 2006 C est une proc dure fort utile pour positionner des sous chantillons les uns par rapport aux autres en fonction de leur appartenance un groupe cologique particulier comme des sous chantillons de tiques d oiseaux marins sur diff rentes esp ces h tes comme on peut le voir dans la figure 12 voir aussi McCoy et al 2003 2005 Le logiciel PCA GEN ver 1 2 d velopp par J Goudet librement t l chargeable http www2 unil ch popgen softwares pcagen htm permet cette analyse par tir de donn
126. perturbation seul mais combin la d rive il va cr er une h t rog n it dans la population effet Wahlund voir plus loin qui va se traduire par un d ficit en h t rozygotes proportionnel l intensit de la d rive Cela aura aussi tendance minimiser certaines mesures de diff renciation entre popula tions telles que le F7 voir plus loin LA NOTION DE D FICIT EN HETEROZYGOTES D FINITIONS Comme nous venons de le voir la structure g notypique d une population p 7 2 p po et p7 attendue sous les hypoth ses de Hardy Weinberg peut tre alt r e par cer taines formes de s lection et par le syst me de reproduction Il va donc y avoir d autres fr quences g notypiques observ es D H et R pour les g notypes 1 1 1 2 et 2 2 respectivement pour le cas deux all les Si on ne s int resse qu aux causes dues au syst me de reproduction qui affectent donc tous les loci on voit que ce Les individus les plus h t rozygotes sont probablement ceux qui pr sentent le plus grand choix d all les dis ponibles Dans l un et l autre cas les descendants peuvent esp rer une plus grande h t rozygotie 40 Initiation la g n tique des populations naturelles qui est perdu ou gagn par les h t rozygotes est normalement quitablement restitu aux homozygotes comme sugg r en p 37 quations 4 et 5 D p piprF is H 2p1p2Q Frs 2p1p2 2pipoF is He AF is R
127. pi ges distants de 20 m et le g notypage de davantage d individus par pi ge sur des loci de meilleure qualit devraient permettre des estimations beaucoup plus pr cises encore En particulier la diff renciation entre zones qui est apparue tr s incertaine pourra ainsi davantage tre pr cis e et par cons quent une probabilit de dispersion entre ces zones estim e plus clairement 216 Initiation la g n tique des populations naturelles BT on de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus h t rog n it locale dispersion et goulots d tranglement INTRODUCTION Le jeu de donn es que nous allons analyser maintenant fait partie d un projet finalis en 2010 et publi dans quatre articles Korri et al 2006a Korrt et al 2006b CHEVILLON et al 2007a b DE Meets et al 2010 Nous allons refaire une partie de ces analyses et en ajouter quelques unes Nous pouvons ajouter ici que l extrac tion d ADN s est montr e extr mement d licate chez cette esp ce et que nous avons d travailler en aveugle en ignorant s il y avait effectivement des mol cules dans nos extraits avant d obtenir les profils pics Jai jug cette pr cision importante pour les coll gues qui d cideraient de se lancer dans le g notypage de cette esp ce Notons que l esp ce Rhipicephalus microplus tait commun ment nomm e Boophilus micro plus avant d tre remise en synonymie avec son nom
128. poque ce qui tait vraiment peu Nous allons ensemble voir que malgr cela et les probl mes rencontr s on peut quand m me recueillir beaucoup d informations pertinentes l aide des m thodes d crites dans ce manuel En t l chargeant le fichier IRTotBrut txt vous aurez les donn es brutes obtenues sur des tiques adultes chantillonn es sur la v g tation donc non gorg es sauf pour 115 la Tunisie o les tiques taient fix es sur des vaches Le fichier IRTotBrut txt est un fichier texte mais que l on peut ouvrir sous Excel si on le souhaite Le tableau 6 donne un extrait du fichier de donn es brutes Le fichier comprend neuf colonnes La premi re colonne donne le nom des sites o les tiques ont t chantillonn es Il y a huit sites en Suisse fig 15 et un site en Tunisie La deuxi me colonne correspond l ann e d chantillonnage car certains sites ont t pr lev s aux printemps 1995 et 1996 et d autres uniquement au printemps 1996 La troisi me colonne correspond au sexe de la tique F pour femelle et M pour m le La quatri me colonne donne le nom cod des diff rents individus tiques Ce codage individuel peut tre utile si on fait des analyses individus centr es telle qu une AFC ou une construction d arbre sur distances interindividuelles Enfin les cinq derni res colonnes correspondent aux g notypes en taille d all les aux cinq loci microsatellites polymorphes d finis
129. qu elle transmet 151 compl te et le premier m le le plus complet On obtient ainsi un jeu de donn es de cinq sites avec un nombre d individus fortement r duit par site C est aussi la raison pour laquelle les tests seront unilat raux les femelles dispersent moins Le r sultat de cette analyse figure dans le tableau 14 o on retrouve bien le signal initial sugg rant un biais de dispersion femelle la diff rence que tous les param tres vont dans le bon sens m me si cest toujours A qui donne la seule P value significative Tableau 14 R sultat du biais de structuration femelle unilat ral sur le jeu de donn es r duit un individu ou deux une femelle et un m le par cluster BAPS pour les cing sites du nord ouest de la Suisse Cette fois ci tous les param tres vont dans le m me sens les femelles dispersent moins Pour le Frs le test a t r alis sans le locus IRO8 Parametres A 0 496 0 520 0 0097 s AL 6377 25510 0 3341 For 0 008 0 016 0 1307 G 0 824 0 847 01221 Fis 0 470 0 511 0 2220 Interpr ter l ensemble des r sultats sur les biais de structuration Il semble bien y avoir un biais de dispersion biais pour les femelles elles disperseraient moins l chelle du plateau Suisse ou m me de r gions plus restreintes mais le signal est brouill par une micro structuration qui existe localement Le fait que dans chaque site les clusters trouv s par BAPS contiennent des femelles beauc
130. rentielles des tiques et donc de races d h tes en particulier vis vis des oiseaux et des micromammif res au moins aux stades larve et nymphe Il pourrait s agir aussi d une manipulation des tiques par les borr lies qui inciteraient une tique infect e par telle ou telle autre borr lie faire son prochain repas sur la m me esp ce h te que celle l ayant infect e Nous aurons l occasion de discuter davantage cela dans le paragraphe suivant Tableau 19 Valeurs moyennes pond r es par les tailles de sous chantillons de corr lation entre la pr sence de chacune des deux bact ries consid r es ligne 2 2 dans la sortie de Genetix colonne R IJ et P value test G multi chantillon de Fstat correspondante mais avec les tiques infect es par au moins une borr lie uniquement tiques saines exclues du test Une valeur de R IJ positive indique une association positive alors qu une valeur n gative indique une r pulsion Borr lies P value Bbss t Bba 0 471 0 11049 Bbss Bbg 0 412 1 Bbss Bbundet 0 622 0 00304 eel Bbg k 0 67559 Bba Bbundet 0 632 0 0001 Bbg Bbundet 0 290 1 Occurrence des diff rentes esp ces de borr lies et g n tique des tiques Dans cette partie nous rechercherons s il existe une relation entre la g n tique des tiques et leur probabilit d infection par chacun des quatre types de borr lies On peut r pondre cette question de trois mani res Soit en testant la dif
131. s la structure g noty pique compl te des individus c est dire que tous les g notypes homozygotes et 22 Initiation la g n tique des populations naturelles h t rozygotes sont en principe distinguables Il existe de nombreuses cat gories de marqueurs codominants Les isoenzymes ou alloenzymes les RFLP Restriction Fragment Length Polymorphisms AFLP Amplified Fragment Length Polymorphisms microsatellites minisatellites MLST Multi Locus Sequence Typing et SSCP Single Stranded Conformational Polymorphism figurent parmi les plus connus Les marqueurs SNP Single Nucleotide Polymorphism se montrent extr mement utiles dans les tudes d association mais ces marqueurs correspondent essentiellement des loci bi all liques deux all les seulement ce qui est loin d tre id al De plus ils pr sentent des taux de mutations h t rog nes d un all le vers l autre ce qui est beaucoup plus pr judiciable encore Il existe en effet un biais clair en faveur des transitions et au d triment des transversions VIGNAL et al 2002 Les SNP ne sont donc pas appropri s aux tudes de g n tique des populations au sens strict du terme Dans ce qui va suivre je vais surtout traiter des marqueurs isoenzymatiques et microsatellites Les raisons de cette restriction si j ose dire sont assez simples et pragmatiques D abord ces marqueurs sont les moins chers 4 mettre en ceuvre en travail et moyens surtout les isoenzymes
132. s par s que d une ann e soit environ 1 3 du temps de g n ration 7 ricinus Ici les adultes pr sents d une ann e sur l autre font partie de cohortes s par es et qui m me long terme auront du mal changer des g nes La diff renciation entre ces cohortes d ja remarqu e par De Meets et al 2002a va tendre tre tr s sup rieure celle qui existe r ellement entre deux g n rations d adultes reproducteurs Lutilisation des m thodes tempo relles sur nos donn es aboutira donc de fortes sous estimations des effectifs effi caces Faites le et v rifiez qu effectivement compte tenu qu il n y a qu un tiers de La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 163 Tableau 16 R sultats synth tiques obtenus pour le calcul des effectifs efficaces N et leur intervalle de confiance 95 Li et Ls par la m thode des d s quilibres de liaison dans NeEstimator Les valeurs infinies sont ignor es pour le calcul des moyennes Les chantillons de 1995 sont consid r s comme ind pendants car appartenant des cohortes de tiques g n tiquement isol es de celles de 1996 le cycle d Ixodes ricinus dure environ trois ans Berne 1996 182 Berne 1995 Infini Monte Ceneri 1996 Infini Infini Dor naz 1996 700 Infini Ecl pens 1996 Infini Infini Gorges du Trient 1995 1077 601 Gorges du Trient 1996 75 219 Montmollin 1996 338 Infini Neuch tel 1996 398 Infini Staadswald 1995
133. sans pour autant partager une origine ancestrale commune proche dans le temps coancestry en anglais On dit de ces all les qu ils sont identiques par tat et non par descendance et on appelle ce ph nom ne homoplasie IAM ou Infinite Allele Model La mutation transforme l all le d origine vers un all le nouveau jusqu alors inexis tant et ind pendant de l tat du pr c dent Ce mod le est tr s utilis en g n tique des populations th oriques car il est plus simple manipuler sans modifier consid rablement les r sultats par rapport au KAM si K suffisamment grand Dans ce mod le il ny a pas d homoplasie et deux all les identiques par tat le sont galement par descendance SMM ou Stepwise Mutation Model Le SMM Kimura et Outs 1978 est un mode de mutation invoqu pour les mar queurs microsatellites La mutation correspond ici l ajout ou au retrait d une r p tition par rapport a l all le d origine Il est vident que ce type de mutation va g n rer beau coup dhomoplasie Il en r sulte galement qu une ressemblance de taille traduira galement une proximit ancestrale probable Il existe aussi des mod les panach s entre KAM et SMM comme le TPM Two Phases Model avec une certaine proportion de SMM et le compl ment en KAM avec une variance de taille d all les donn e Conclusion sur la mutation Quoi qu il en soit la mutation va bien videmment modifier les fr quences all l
134. sente qu un probl me modeste pour le Fs dans les cas deux all les qu il vaut donc mieux viter de toutes mani res assez rares surtout chez les marqueurs microsatel lites Donc si les loci homoplasiques sont bien videmment viter pour toute tude phylog n tique ou assimil e il n y a aucune raison valable de les carter pour des tudes de g n tique des populations Structuration plus de trois niveaux La situation classique trois niveaux individus sous population population totale ne correspond bien videmment pas tous les cas de figure Il peut par exemple exister plus de niveaux Si j chantillonne plusieurs parasites par individu h te avec plusieurs h tes dans plusieurs habitations de plusieurs villages on voit bien que l on peut avoir autant de niveaux pertinents de structuration potentiels On peut alors subdiviser l chantillon en autant de sous chantillons qu il est n cessaire en supprimant lin fluence des niveaux potentiellement confondants Par exemple l effet individu h te 62 Initiation la g n tique des populations naturelles 0 076 0 075 0 074 Pig 0 073 0 072 0 071 0 07 0 0 002 0 004 0 006 0 008 0 01 0 2 NENS b Si Ss 0 19 Soo 0 18 D ES pe AM OS ee ee K 2 ee ieee K 5 oe 0 16 KZI E EAE K 20 0 15 0 14 0 0 002 0 004 0 006 0 008 0 01 Figure 9 Illustration de l influence du nombre d all les possibles K sur les valeurs attendue
135. si on se r f re aux autres travaux associ s ce projet non abord s dans ce manuel DE MEEts et al 2010 Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 245 7 r n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest INTRODUCTION Le jeu de donn es que nous allons analyser a fait l objet d une publication en 2009 Korri ef al 2009 Il va nous permettre d explorer comment adapter les outils de la g n tique des populations aux organismes reproduction majoritairement asexu e v4 __ ETAT DES LIEUX Les trypanosomiases africaines sont des maladies 4 vecteur transmises normalement par des glossines mouches ts ts et parfois m caniquement par d autres insectes piqueurs tabanides ou m me sexuellement pour Trypanosoma equiperdum BRUN et al 1998 La maladie du sommeil ou trypanosomiase humaine africaine THA est connue sous deux formes la forme chronique rencontr e en Afrique de l Ouest et centrale et la forme aigu qui s vit en Afrique de l Est La forme chronique de la THA est provoqu e par Trypanosoma brucei gambiense type 1 Tbg1 et repr sente plus de 90 des cas recens s par l Organisation mondiale de la sant OMS WHO 2006b Une personne infect e par Tbgl peut rester asymptomatique durant des ann es avant de d clarer la forme neurologique dramatiquement specta culaire de la maladie La forme aigu de la
136. soient identiques et Qz la probabilit que deux all les un locus de deux individus pris au hasard dans deux sous populations diff rentes et deux archipels diff rents soient identiques cf fig 61 Nous pouvons d finir six indices de fixation Frs consanguinit individuelle relative celle des sous populations Fs consanguinit des sous populations relative celle des archipels F4 1 1 Frs 1 F4 consanguinit individuelle relative celle des archipels F47 consanguinit des archipels relative celle de la population totale Fer 1 1 F64 1 Far consanguinit des sous populations relative au total et Fyr 1 1 Fi 1 Foz consanguinit des individus relative la popula tion totale Ces indices peuvent tre exprim s en suivant la m thode propos e par CocKkERHAM 1969 1973 en fonction des probabilit s d identit d finies plus haut dans ce paragraphe on peut aussi consulter les p 40 48 de la premi re partie de ce manuel Q Q IS FO Fe gQ Q be Fa Q Q lU 66 l Qy Fsr Q Qr 1 Q Fir Q Qr l Qy Si nous nous concentrons maintenant sur les indices de fixation qui refl tent la dif f renciation g n tique entre sous populations du m me archipel et entre archipels il wy a alors plus que Fs4 et Far qui nous int ressent Si pour une raison quelconque Q est tr s petit migration tr s faible entre sous populations il est alors facile de voir par l
137. t rozygotes plus ou moins prononc s sont donc attendus chez de nombreuses esp ces parasites tels que les schistosomes dioecie ou les monog nes mono ques largement autoincompatibles ce qui a en effet t document pour Schistosoma mansoni PRUGNOLLE et al 2002 Les croisements syst matiques entre apparent s Chez la gu pe parasitoide Nasonia vitripennis la femelle pond plusieurs ufs fr res s urs dans une m me chenille Ceci a tendance favoriser les croisements entre fr res et s urs SHUKER et al 2004 Dans certaines populations c est m me la r gle Ce type de reproduction existe ou a exist de fa on marginale dans l esp ce humaine pour certains membres de familles royales ou imp riales pharaons rois europ ens Le r sultat est identique au pr c dent m me si moins efficace voir la figure 6 On obtient des d ficits en h t rozygotes tous les loci par rapport aux attendus sous l hypoth se de panmixie L homogamie Ici les individus de m me g notype pr f rent s accoupler entre eux ou la compati bilit entre gam tes est augment e par la ressemblance g n tique Les cons quences sont identiques l autof condation sauf qu elles ne concernent que les g nes respon sables du caract re homogamie et ceux qui leur sont li s auto stop qui voient la fr quence des h t rozygotes diminuer S il y a dominance pour le caract re chaque g notype se reconna t la vitesse de pert
138. test En effet il est int ressant de regarder ce qui se passe aussi en faisant hypoth se d un mod le de mutation en deux phases two phases model en anglais TPM Il est montr que si un goulot d tran glement a r ellement eu lieu on le d tectera tr s fortement avec l hypoth se IAM moyennement avec le TPM et faiblement avec le SMM CoRNUET et LUIKART 1996 alors qu en cas d absence de goulot d tranglement mais en population structur e en petites sous populations on pourra d tecter faussement une signa ture de goulot d tranglement avec IAM mais exceptionnellement voir jamais avec TPM et jamais avec SMM DE Garine Wicuatitsky et al 2009 DE MEEUs et al 2010 Donc en cas de tests tr s significatifs pour les trois proc dures on peut tre assez confiant Le test le plus puissant et robuste pour tester un goulot d tranglement est le Wilcoxon CORNUET et LuIKART 1996 donc autant ne pas s embarrasser avec les deux autres Faites attention ce que votre fichier soit au bon format en particulier pas de colonne ni de ligne suppl mentaire la fin sinon Bottleneck risque de se fermer sans pr venir Pour les param tres du TPM je laisse les param tres par d faut car s il fallait en choisir on men sortirait pas infinit de combinaisons On a donc 70 des mutations de type SMM et 30 qui impliquent lajout ou le retrait de plus d un motif microsatellite avec une variance de 30 Vous pouvez
139. test sous R nous pouvons calculer la probabilit avec laquelle nous pouvons observer une fois un test significatif au seuil a 0 0044 sous l hypoth se nulle Hp Cette probabilit est P value 0 0889 On peut donc consid rer qu l chelle de chaque zone il y a ind pendance entre loci Test de la panmixie dans les quatre zones d chantillonnage Chargez DataTsetseMouhounMalMang dat dans Fstat et demandez le Fs par locus et population les estimations de Weir et Cockerham et testez Hardy Weinberg dans les sous chantillons avec 10 000 permutations d all les entre individus Le r sultat peut tre r sum dans le tableau 24 On y constate un fort d ficit en h t rozygotes tr s significatif mais aussi une forte variance du Fj entre loci Une recherche d all les nuls de stuttering ou de dominance d all les courts s av re n cessaire ANALYSE PAR MICRO CHECKER Il faut ici traiter les femelles seules pour les loci h t rosomaux du site A un fichier de plus pour les autres sites il ny pas de probl me pas de m le En passant par Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 195 Tableau 24 R sultat du test de Hardy Weinberg sur le Frs dans les diff rentes zones de capture des ts ts y 0 IS P par locus et sur l ensemble et r sultat des tests de permutation Toutes P value ee les zones PepX11 0 0003 PepX13 0 0055 Pep24 0 0001 B11_1 0 0001 BX104 0
140. tests of differentiation 57100 C1100 171000 Figure 46 Menu Fstat pour tester l association entre borr lies associations avec Bbg sont marginalement significatives on peut consid rer que le signal existe eu gard a la grande raret de Bbg puissance tr s faible du test Il est int ressant de noter pour information que Bbundet vraisemblablement compos e d une mixture de Bbg tr s largement sous repr sent e ici et Bbv B valaisiana curieusement absente de l chantillon donnent des valeurs essentiellement n gatives pour R IJ ce qui fait regretter plus encore que les d terminations de l poque aient connu autant de probl mes Il n en reste pas moins qu une forte corr lation positive lie Bbss Bbg et Bba qui est confirm e si on teste la co occurrence des trois esp ces dans la m me tique rencontr e une fois dans l chantillon des 73 tiques femelles de Neuch tel en 1996 et pas Bern comme annonc dans la partie r sultat de l article de DE Meets et al 2004b on ne relit jamais assez ses preuves Il y a N 73 observations une fr quence observ e de 4 73 6 73 et 1 73 pour Bbss Bbg et Bba respectivement donc une fr quence attendue de p 41 61 1 73 pour l v nement de co occurrence des trois borr lies dans la m me tique v nement observ avec la fr quence k 1 Cette fr quence observ e peut tre compar e l attendue par un test binomial Sous R tapez binomtest 1 73 p 0 00
141. tions Ann Rev Ecol Syst 16 393 430 SLATKIN M 1995 A measure of population sub division based on microsatellite allele frequency Genetics 139 457 462 SNaBEL V De Meets T Varapy M Nansen P Bjorn H Corea J 2000 The sexually linked Mpi locus is presumably involved in imidothiazole resistance in Oesophagostomum dentatum parasites Parasitol Res 86 486 490 SokaL R R ROHLF E J 1981 Biometry 2 Ed New York Freeman and Co SOLANO P DE La ROCQUE S DE MEE S T Cuny G Duvarrer G Cursance D 2000 Microsatellite DNA markers reveal genetic differ entiation among populations of Glossina palpalis gambiensis collected in the agropastoral zone of Sideradougou Burkina Faso Insect Mol Biol 9 433 439 Sunnucks P 2000 Efficient genetic markers for population biology Trends Ecol Evol 15 199 203 Tasacunick W J Black W C 1995 Making a Case for Molecular Population Genetic Studies of Arthropod Vectors Parasitol Today 11 27 30 Tarr A MacLeop A TWEEDIE A Masica D Turner C M R 2007 Genetic exchange in Trypanosoma brucei Evidence for mating prior to metacyclic stage development Mol Biochem Parasitol 151 133 136 TAKEZAKI N Ner M 1996 Genetic distances and reconstruction of phylogenetic trees from microsatellite DNA Genetics 144 389 99 Tamuna K PETERSON N STECHER G NEI M Kumar S 2011a MEGA ver
142. tiques m les et femelles La justification de ce test est qu un tel signal avait t sugg r chez cette esp ce en Irlande pour un locus enzymatique HEALY 1979 Nous allons donc mesurer et tester la diff renciation entre m les et femelles de chaque sous chan tillon Pour ce faire il faut construire un fichier Fstat par exemple o femelles et m les de chaque site sont consid r s comme appartenant des chantillons diff rents Appelons ce fichier IRTotBrutSexBias dat et chargeons le dans Fstat apr s avoir ouvert Fstat il faut aller dans File Open etc On coche ensuite dans Fstat l option Fst per pair of samples et la case Pairwise tests of differentiation ainsi que la case 5 100 du Nominal level for multiple tests Cette derni re case est choisie pour gagner du temps Ici Fstat donnera le seuil Bonferroni de significativit corrig par le nombre de tests 276 ici A ce seuil une P value sera significative si elle est inf rieure ou gale a 0 05 276 0 00018 et Fstat ajuste le nombre de per mutations n cessaires pour atteindre cette valeur soit 5 520 ce qui est bien suffisant Avec 1 100 on obtient 27 600 ce qui est beaucoup En plus ce niveau le Bonferroni est beaucoup trop conservateur De toutes fa ons comme nous rallons utiliser que les r sultats par paire locale de femelles et de m les nous n appliquerons pas cette proc dure Apr s avoir cliqu sur
143. tr s polymorphes codominants abondants dans presque tous les g nomes et relativement ais s manipuler LEHMANN ef al 1996 Grace l utilisation de l outil PCR et des derniers progr s faits en la mati re il est possible de travailler partir de quantit s infimes de mat riel biologique comme le montre le travail de RAZAKANDRAINIBE et al 2005 o chaque oocyste de Plasmodium falciparum est analys au niveau de sept marqueurs microsatellites Ces arguments font des marqueurs microsatellites des outils de choix sinon les meilleurs pour les tudes de g n tique de populations et en particulier des populations de pathog nes pid miologie mol culaire Le lecteur d sireux de s informer davantage sur les propri t s des microsatellites et leurs diverses applications est invit consulter l ouvrage dit par GOLDSTEIN et SCHL TTERER 1999 28 Initiation la g n tique des populations naturelles BC oncepts de base en gen tique des populations CALCUL DES FREQUENCES ALLELIQUES A PARTIR D UN CHANTILLON partir de maintenant nous consid rerons sauf si pr cis que nous travaillons sur un locus codominant on distingue les h t rozygotes des homozygotes avec deux all les chez un organisme diplo de Admettons que nous ayons g notyp XV indivi dus de cet organisme dans un site que nous supposons contenir une population Parmi ces XV individus N se sont r v l s tre de g notype 1 1
144. v rifier l aide du logiciel BAPS voir p 98 101 en premi re partie et le tableau 1 en annexe si certains individus peuvent tre regroup s sur la base de leur ressemblance g n tique BAPS va ensuite explorer de fa on it rative et r p t e en suivant plusieurs cha nes de Markhov ou une cha ne stochastique d optimisation suivant les versions afin de trouver la meilleure partition celle qui regroupe le mieux les individus dans le sous chantillon analys La partition d finit un nombre donn de clusters sous unit s compos s chacun d un certain nombre d individus du sous chantillon La qualit d une partition se d finit par un savant calcul dans le d tail duquel je serai bien incapable de rentrer mais qui d pend de la distance g n tique entre les groupes d finis par rapport aux autres partitions explo r es durant le processus Il est aussi expliqu dans les articles d crivant le logiciel qu une hypoth se du mod le utilis dans l algorithme est que les clusters qui com posent la partition sont en quilibre de Hardy Weinberg Je ne suis pas certain de bien comprendre ce qui est entendu par l dans la mesure o mon exp rience m a montr que la plupart des partitions obtenues ne sont pas conformes cet quilibre voire m me en sont tr s loign es J ai galement pu observer cela avec STRUCTURE qui fait la m me hypoth se Comme discut dans la premi re partie de ce manuel beau coup
145. 0 WHO 2006b African trypanosomiasis sleeping sickness WHO Media centre Fact sheet N 259 World Health Organization http www who int mediacentre factsheets fs259 en WiLsON A J HUTCHINGS J A FERGUSON M M 2004 Dispersal in a stream dwelling salmonid inferences from tagging and microsatellite studies Conserv Genet 5 25 37 WoLrr K E 1996 Comparison of graphical data analysis methods 7 Faulbaum F Bandilla W eds SoftStat 95 Advances in Statistical Software 5 Lucius amp Lucius Stuttgart 139 151 Initiation a la g n tique des populations naturelles WRIGHT S 1951 The genetical structure of populations Ann Eugenics 15 323 354 WRIGHT S 1965 The interpretation of popula tion structure by F statistics with special regard to system of mating Evolution 19 395 420 Xu J 2005 The inheritance of organelle genes and genomes patterns and mecha nisms Genome 48 951 958 Kase aux questions R ponse 1 L hypoth se faite est que l chantillonnage ne modifie pas les fr quences all liques dans la population ce qui suppose que cette derni re est suffisamment grande R ponse 2 Les taux de mutation d une base vers une autre ne sont pas identiques selon que l on s adresse une transversion ou une transition voir le glossaire Une telle propri t interf rera n cessairement avec les effets d ordre d mographique D aille
146. 0 00938 Year 1 0 160 315 56 832 0 888 0 34675 Sex 1 0 349 314 56 483 1 942 0 16438 On aboutit une conclusion similaire la pr c dente puisque ni le sexe ou l ann e ni la taille des all les ne comptent avec seulement environ 6 13 de la d viance expliqu e par le site qui est moins spectaculairement significatif que pr c demment Pour le locus IR27 le tableau obtenu est diff rent Df Deviance Resid Df Resid Dev F Prior NULL 133 25 9549 poly Allele 2 2 4 1186 131 21 836 15 1968 1 294e 06 Sample 8 5 1810 123 16 6553 4 7793 4 022e 05 Year 1 0 0621 122 165932 0 4584 0 4997 Sex 1 0 1967 121 16 3964 1 4519 0 2306 En effet comme nous pouvons le d duire du tableau ci dessus le site Sample explique 19 96 de la dispersion des points 5 181 25 9549 et la taille des all les poly Allele 2 en explique 15 86 4 1186 25 9549 et sont tous les deux tr s significatifs soulign par les trois toiles Ils expliquent ainsi 35 83 de la variance Cette valeur est cons quente eu gard l importante variance r siduelle attendue en g n ral pour un estimateur de statistique F Comme le montre la courbe d crite dans la figure 24 la relation entre F7s et taille des all les est n gative si on exclut les trois premiers points ce qui ne changerait rien eu gard aux intervalles de confiance ce qui peut donc tre interpr t par une dominance des alleles les plus courts Pour le locus IR32 on obser
147. 0 individus Commen ons par et nous pren drons ensuite Tapez a On vous demande si vous souhaitez faire le test avec le logarithme n p rien des distances g ographiques ou non Tapez d car nous sommes dans un contexte unidimensionnel cf p 89 en premi re partie On vous demande la distance minimale consid rer pour la r gression Comme le test n en tiendra pas compte que le biais ne risque pas d tre important WATTS et al 2007 voir aussi le commentaire de Rousset dans la documentation de Genepop 4 et qu il ny a pas de log tapez 0 Le nombre de randomisations effectuer pour le test de Mantel vous est demand Tapez 1 000 000 En 200 Initiation la g n tique des populations naturelles 1 Data tsetse GPS Nouboun zone AT 2 P pX iij 3 Pop il3g 4 Papi4q 5 B11 6 BX104J 7 C1024 E GpCag 3 popi 0 12412195 338755 2 179185 1921594 000000 169 1 popil 1241313 336737 179179 192192 O00000 169 3 pop 4 1241313 338737 179179 194194 197197 195 5 popi 6 1241401 338702 0 2092097 192192 19719 169 pop 8 1241401 336702 oo0000 1921925 197197 aag 3 popil o 1241500 330734 o 179195 174156 197197 a00 popil 1241500 338734 2 185165 1921592 197197 169 popi 12416015 336736 179179 174174 197197 173 popil 1241725 336719 s oo0000 194194 197197 169 pop 1241725 338719 199209 192154 197197 167 popi 1241725
148. 000 KIVI 0 05 Bonon 2002 RI ee Bonon 2002 KIVI Bonon 2004 KIVI Bonon 2004 RI Bonon 2004 BS Dubreka 1998 Kivi Dubreka 2002 Kivi Boffa 2002 Kivi Figure 85 R sultat du NJTree bas sur la distance harmonique de Cavalli Sforza et Edwards entre paires de sous chantillons calcul e 4 partir de huit loci microsatellites chantillons Il faut ensuite ouvrir un fichier type MEGA Kumar et al 2004 comme d crit dans la figure 84 Le r sultat obtenu est pr sent en figure 85 On voit bien que la m thode d isolement n est pas un param tre tr s important Notez que le dendrogramme obtenu diff re de celui publi par Korri et al 2009 car ce dernier tait bas sur six des loci Micbg6 et Trbpa avaient t limin s pour des raisons que nous verrons plus loin et sur des distances valu es par Genetix qui calcule en fait une autre distance que la distance harmonique de Cavalli Sforzza et Edwards contraire ment ce qui est dit Mais la conclusion g n rale ne change pas Nous pouvons donc d sormais ignorer le facteur m thode d isolement dans les ana lyses qui vont suivre G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 255 DESEQUILIBRES DE LIAISON HOMOZYGOTIE RELATIVE LOCALE ET SYSTEME __ DE REPRODUCTION Cr ation du fichier Fstat En reprenant le fichier de d part nous allons construire un fichier Create o chaque combinaison de Foyer Ann e d isolement corre
149. 006169 alternative two sided ce qui donne une P value 0 0045 tr s significative Cette P value est en fait gale la probabilit de l v nement lui m me puisqu il ny en a pas de plus rare possible Elle est donc gale la probabilit dans une loi La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 177 binomiale de tirer une seule fois Bbss Bbg Bba dans 73 tirages et o la probabilit de tirer Bbss Bbg Bba une fois un tirage al atoire est de 0 00006169 soit cf nimporte quel manuel de statistiques IN Fe f L ple a Hl Awe a a soit Prippmigie 731 0300006169 1 0 00006169 0 0045 Tableau 18 Valeurs moyennes pond r es par les tailles de sous chantillons de corr lation entre la pr sence de chacune des deux bact ries consid r es ligne 2 2 dans la sortie de Genetix colonne R IJ et P value test G multi chantillon de Fstat correspondante Une valeur de R IJ positive indique une association positive alors qu une valeur n gative indique une r pulsion Borr lies I x J P value Bbss t Bba 0297 0 00008 Bbss Bbg 0 496 0 05311 Bbss Bbundet 0 069 l Bba l Bbg 0 109 0 09348 Bba Bbundet 0 017 0 91598 Bbg Bbundet 0 030 1 Cette corr lation est donc tr s forte Elle peut tre due au fait que les tiques infect es correspondent des individus sensibles et que les autres individus sont r sistants Cette corr lation peut galement proveni
150. 1 m 4 m 1l n 1 n 1 4 l gt w qa 2m1 m 4 m n l n 1 4 l gt w G4 2m 2m m n l n 1 4 gt mw 2m m Ja m l a 270 Initiation la g n tique des populations naturelles 4 l 1 2m m n n 4 l m 1 1 my Ta n l n 1 Il en r sulte que l ga 71 n Nous faisons maintenant l hypoth se d une clonalit totale c 1 les r currences deviennent Qia Di ZOTE di Qrin N 2 1 lt Qh a a ie re Qs A 4 Qro l Qsan l 4 eS U g Qro 72 Qran a Si nous nous posons un tat proche de l quilibre mutation migration d rive alors Qxo Qran Qr Qs Qs Qs Qro Qu Qr et on voit tout de suite que Q 0 ce qui correspond bien l attendu th orique d une population clonale en nombre infini d all les h t rozygotie totale BALLOUX et al 2003 Le syst me d quations pr c dent devient Qr 0 Os ot 1 2G 4 Ge vice 73 2N N 1 1 Qr gq t 1 Rs 7907 2N N On peut r soudre ce syst me de deux quations deux inconnues l aide des calculs matriciels comme dans l article de BALLoux et al 2003 Cependant pour gagner du temps et simplifier les calculs nous allons tout de suite faire trois hypoth ses trois cas de figures et voir ce que cela donne Dans la premi re hypoth se nous suppo serons que le nombre de sous populations 7 est tr s grand Dans le deuxi me cas G n tique des popu
151. 12112 092112 092092 092112 092112 092 112 092112 112112 102102 ligile 102102 092102 092 100 092100 NAFNA a 153153 151152 153153 152153 152152 152153 152153 153154 152153 152153 153153 153154 154155 153154 154154 153153 152153 152154 152152 152153 152154 1521532 152154 152155 152154 152152 152153 152153 153155 152152 152154 151154 195197 196196 197199 195196 195199 196197 196197 196197 197199 196197 196197 196197 197199 196199 195197 197199 197199 146152 1521549 152154 1461559 152154 1461544 146154 1461654 154154 1541669 1541549 154154 1461549 196197 197199 195196 197197 195197 1681689 1461549 152154 1521589 1461547 1461549 195197 197197 197199 196197 000000 197199 196199 197199 1541687 1461684 1541547 152154 15415497 1461469 1461544 1541559 146165 1461659 1461549 196199 196199 1541549 1541544 TETE ds 107100 1691E0m Extrait du jeu de donn es des g notypes microsatellites des tiques Rhipicephalus microplus au format Genepop pour Genetix LDNe et Estim 238 Initiation la g n tique des populations naturelles de tiques le test devient tr s significatif Puisque la pente est connue nous pouvons donc calculer le voisinage qui est de N 1 b 42Do 275 98 individus Et donc le produit de la densit
152. 198 145 1 Boul 3 gt 198 200 145 it Boul 3 194 198s 179 1 Boul 3 gt 194 198 135 17 Boul 3 192 198 145 1 Boul 3 gt 194 198 179 1 Boul 3 198 198 145 lt Boul 3s 194s 198 150 if Boul 3 194 198 145 1 Boul 3 194 194 145 l Boul 3 194 196 179 1 Boul 3 194 194 145 is Boul 3 194 198 145 if Boul 3 194 198s Ox Os Boul 3 194 198 145 t Boul 3 194 198s 150 gt 1 Boul 3s 194s 200 179 17 Bour i 198 198 179 1 Bour 1l gt 194 198 1795 if Bour 1 194 200 150 Li Bour 1l gt 194 gt 194 145 1 Bour 1 gt 192 196 0 Os Bour 1l 194 198s 145 l Bour i 194 194 aE Os Bour 1l gt 194 198 150 if Bour i1 198 gt 198 150 1 Bour i 198 198 17S gt 17 Bour 1 194 198 145 14 Bour 1 192 194 145 gt 17 Bour 1 gt 198 198 145 1 Bour i 194 198 145 14 Bour 1l gt 192s 198 145 17 Figure 63 Extrait du fichier de donn es pour l analyse Frs et d s quilibre de liaison de R microplus de b tail en Nouvelle Cal donie gt gt signale une tabulation Nous allons convertir ce fichier au format Fstat par entremise de CREATE comme au chapitre pr c dent Une fois cela fait et avant de lancer Fstat il faut diter le fichier BoophilusAdultsDataCattleIndivHostFisLD FSTAT POPULATION NAMES lab nom des sous populations que vient de cr er CREATE pour supprimer les deux derni res colonnes je ne sais pas pourquoi CREAT
153. 219 LuIKART 1996 Dans ce cas en prenant quatre g n rations par an Korfi et al 2006a nous pouvons en d duire que ce goulot d tranglement eut lieu il y a 2003 1942 i 4 244 g n rations de tiques Avec si peu de loci et des tailles d chantillons de 30 50 individus environ la possibilit de d tecter un goulot d tranglement n est possible que si le param tre t de Cornuet et Luikart est compris entre 0 1 et 2 5 CoRNUET et LUIKART 1996 DE MEEts ef al 2007a Sachant que T 2N o t est le nombre de g n rations et N est l effectif efficace post goulot d trangle ment on peut en d duire en cas de d tection effective d un goulot d tranglement que NV t 2t 244 5 244 0 2 49 1220 Cette gamme d effectif efficace converge t elle avec les effectifs efficaces calcul s l aide d autres m thodes BARTLEY et al 1992 Vrraris et COUVET 20012 b c BALLoUx 2004 WapLes 2006 Et bien c est ce que nous allons rechercher ensemble ANALYSE DE LA CONSANGUINIT __ RELATIVE INTRA H TE Ce que nous allons rechercher ici c est la part prise par les infra populations de R microplus dans la r partition de information g n tique Le param tre mesurer et tester est donc le Fsg ou probabilit de fixation homozygotie dans les sous populations infra populations relative celle des levages Nous aurons donc aussi besoin de mesurer le Fys C est ce que nous fer
154. 23 1919 1919 1919 1919 1919 1919 r919 1919 LI 1921 1919 1919 0000 4650 4545 3350 53533 0000 3539 3535 5050 4650 3339 0000 3535 4650 1919 0000 1919 3333 5050 3333 37427 4144 32321 00001 30427 30301 28351 26277 293515 36361 2 129 42424 29291 25281 20357 35351 00007 U Dorenaz 0000 0000 Popi U Eclepens U Eclepens U Eclepens at a ee eee 0000 4747 1919 3343 37371 7676 4848 0000 5050 00004 TL Fl 3648 1919 0000 33367 7676 4646 1919 0000 28429 Se ee Figure 49 Type de donn es pour le test de biais de structuration pathog ne sp cifique Les tiques infect es sont not es avec un I et les saines avec un U Se r f rer l aide de Fstat pour plus de d tails sur la constitution d un tel fichier Il est important de ne pas oublier que les all les doivent tre deux chiffres et que les colonnes sont s par es par des espaces et non des tabulations Tableau 22 R sultat du test bas sur le Fsr de biais de structuration g n tique pathog ne sp cifique des tiques pour les diff rentes esp ces de borr lies pour lesquelles assez de donn es taient disponibles Bbg exclue On remarque une structuration significativement plus forte pour les tiques infect es I par Bba par rapport aux tiques non infect es par cette borr lie U Bbundet U 0 000 I 0 045 P value 0 1764 184 Initiation a la g n tique
155. 27 132 FERNANDEZ LOPEZ L PINEIRO E Marcos R VELAZQUEZ A SURRALLES J 2004 Induction of instability of normal length trinucleotide repeats within human disease genes J Med Genet 41 3 9 FisHER R A 1970 Statistical Methods for Research Workers 14 Edit Edinburgh Oliver and Boyd FONTANILLAS P PETIT E PERRIN N 2004 Estimating sex specific dispersal rates with autoso mal markers in hierarchically structured populations Evolution 58 886 894 Foucaup J Estoup A Lorseau A REY O ORIVEL J 2010 Thelytokous parthenogenesis male clonality and genetic caste determination in the little fire ant new evidence and insights from the lab Heredity 105 205 212 Friscu J E 1999 Towards a permanent solution for controlling cattle ticks nr J Parasitol 29 Iarl FRONTIER S 1976 Etude de la d croissance des valeurs propres dans une analyse en composantes principales comparaison avec le mod le du b ton bris J Exp Mar Biol Ecol 25 67 75 Gareney P M 1994 Heterosis and heterozy gote deficiencies in marine bivalves more light In Beaumont A R ed Genetic and Evolution of Aquatic Organisms London Chapman and Hall 146 153 GALLARDO J S Moraes J 1999 Boophilus microplus Acari Ixodidae preoviposition ovipo sition egg hatching and geotropism Bioagro 11 11 80 GANDON S 2002 Local adaptation and the geometry
156. 2u Qs IN 01 NE Qr 0 Qr 0 Qs he 24 l 2 2N 2N 2 4Nu 4u 2 4Nu 4u Gr 0 Nous allons consid rer que u lt lt 1 ce qui fait Gr 0 l Qs 2 4Nu Qr 0 Nous ne pouvons ici nous contenter de calculer un F 0 Qr Qs 2 4Nu ow ph 1l E Is 1 Qs 4Nu 1 2 4Nu amp Fro 4Nut 1 1 Fys 4Nut 1 1 Firs 280 Initiation a la g n tique des populations naturelles C est le m me r sultat que dans l article de Smo et al 2010 Les r sultats de cette approche en utilisant v 0 001 comme ailleurs figurent galement sur le tableau 38 Les renseignements compl mentaires figurent quant eux dans le tableau 39 F6 et F7 Tableau 38 R capitulatif de estimation de la taille des populations N et taux de migration m de Trypanosoma brucei gambiense en C te d Ivoire et en Guin e Fsr provient du calcul d crit auparavant et pr sent dans le tableau 37 Les intervalles de confiances 95 Li et Ls sont obtenus par bootstrap sur les loci sauf pour l estimation de m avec le mod le deux les o la m thode du jackknife a t utilis e sur les quatre loci disponibles Les valeurs de Fis et de Fsrutilis es figurent dans le tableau 39 E Boffa Dubr ka 0 21 Waples Bonon 2000 2002 32 11 190 Bonon 2000 2004 169 69 422 Bonon 2002 2004 27 N37 N287 Bonon moyenne 100 39 266 Dubr ka 1998 2002 96 28 342 MLNE Bonon 7 6 13 0 365 0 112 0 836 2 71 10 63 11 01 Maximu
157. 4 existe au sein des infra populations de microplus en Nouvelle Cal donie Une l g re variation de ce Fis entre loci fig 65 pourrait sugg rer l influence d all les nuls dans ce d ficit sauf que les loci responsables de cette variation D12 et D10 ne semblent pas influencer beaucoup le r sultat global Certaines infra populations tant de petites tailles il para t d licat d utiliser MicroChecker ce stade Mais la 222 Initiation la g n tique des populations naturelles Moyennes sur les infra populations 0 16 4 0 12 0 08 _ m E _ 0 047 y E os a 0 a 0 04 2 2 ee ee B12 C07 D12 D10 A12 C03 All 0 0783 0 1576 0 0001 0 0003 0 1806 0 4014 0 0001 Loci Figure 65 R sultat des analyses d homozygoties relatives des individus F7s au niveau des infra populations dans chaque individu h te de R microplus sur bovins en Nouvelle Cal donie Les intervalles de confiance 95 sont issus de jackknives sur populations o le F7 est calculable 33 infra populations avec la m thode d crite en p 72 73 1 partie sauf pour la valeur moyenne All dont l intervalle de confiance correspond 5 000 bootstraps effectu s par Fstat La probabilit de d vier de 0 sous Ho P value obtenue apr s 10 000 permutations des all les entre individus de la m me infra population est donn e entre parenth ses m thode de r gression des F7 en fonction du nombre de blancs par locus et so
158. 4 T245 85 ma B4 136 85 mas B4 0163 55 ms Ref Pome Payas CIs CIs CIs Cle CIs CIs CIs CIs Cle CIs Cle Cl CIs Cle CIs CIs CIs CIs Cle CIs CIs CI GIs Cis CI Ci CIs CIs CIs CIs Cis CIs Cle CI CIs Pts Foyer Bonons Ponorin Honohs Bono ris Bonar Bonon Bonari Bonons Bonon Bea note Bonon Bonot Bonome Bono H rmann ononx Eonotus Honons Bono tis Hanons Bono Honats Sonons Bont Bonde Bononn Bo nore Bonn Bonot Honor Bono fis Bo not onors Bono tis Donors Bar Pi Fen Ann es 2000s 2000s 2000s 200s 2000s 2000s 2000m 2000s 2000e 2000s 2000s 2000 2000s 200Ue 2000s 2000 2000 002 2002s 2002s 2002 2002s 2002s 2002 2002s 2002 2002 2002s 2002 cools EDOZ 2004s 20042 20046 2004s FNM ae Igo lements KIVIs KIWI EIVIs KIVI EIVI EIVI EIVI EIVIs KIVIs EIVIs EIVI EIVIn EIVIs KI Is EIVIs EI Is EINI EIVI Ri RIs RI EIWIx EIVI EIVI EIVI KIW In Elx RIs KIVWI RIs Ris EEE ES Bon BS Bihi mic bgis 1621522 162194 1621948 1621942 1621945 1621942 162194 162194 164194 1671194 162194 1624194 1621545 162 194 1621545 162194 1621945 162154 164194 1621942 162194 1621945 1621945 162194s 162194 1621940 162194 162154 162194 162194 162194 1621942 162154 1621545 162194 TAF PGs mig i702 170 170 1702 170 170 170 1702 170 1708 170 170 1702
159. 57 au seuil 5 cf p 72 74 de la 1 partie de ce manuel Pour chaque locus l intervalle de confiance se calcule donc avec les formules F7 2 57xStrdErrFis pour la limite inf rieure qui ne peut d passer 1 et Fys 2 57xStrdErrFis pour la limite sup rieure qui ne doit pas d passer 1 Les valeurs d intervalle de confiance qui d passent les valeurs 1 et 1 doivent donc tre artificiellement ramen es ces valeurs fronti res En faisant cela nous supposons que les F7s suivent la loi normale ce qui est sans doute faux D un autre c t nous rutiliserons pas ces intervalles de confiance pour une d cision statistique mais pour illustrer le comportement des diff rents loci dans un graphique Nous pouvons ainsi r aliser le graphe de la figure 86 On notera que toutes les P values 0 0001 sauf pour trbpa P value 0 0011 On peut aussi noter que deux loci sortent du lot micbg6 qui est en fait fix h t rozygote 182 266 dans tous les chantillons et trbpa dont la variance est anormalement lev e Ce locus est d ailleurs situ dans une zone codante Ropt et al 1998 et nous avons l typi quement une bonne raison d liminer une source d information qui apporte plus de confusion qu autre chose Pour recommencer cette analyse sans le locus trbpa il suffit de recharger le fichier dans Fstat et de s lectionner les sept autres loci Fstat cr e un autre fichier que j ai personnellement nomm T BruceiFoyAnCI amp G
160. 64 Cases cocher dans Fstat pour l analyse Fs et d s quilibre de liaison par paire de loci des donn es microsatellites de R microplus BoophilusAdultsDataCattleIndivHostFisLD dat et le fichier associ lab On coche les options comme indiqu dans la figure 64 Ensuite on clique sur Run et on attend la fin des permutations 7 mn sur ma machine vous avez le temps de consulter vos courriels ou de faire une partie de d mineur Dans le fichier out nous remarquons qu aucun locus n a un all le de fr quence trop dominante pas de fr quence moyenne sup rieure 4 0 5 dans le cas pr sent Les tests de d s quilibre de liaison sont donc raisonnablement puissants Un seul de ces tests sur les 15 paires de loci possibles est significatif au seuil 5 Ceci n est pas significativement diff rent de l attendu sous l hypoth se nulle comme nous le donne l utilisation de Multi Test avec alpha 0 05 k 15 et k 1 P value 0 537 ou la commande R binom test 1 15 0 05 alternative greater Il ny a donc pas de signal significatif de d s quilibre de liaison ce niveau Nous pouvons consid rer ces loci comme statistiquement ind pendants Les r sultats de l analyse des Fy sont repr sent s dans la figure 65 Normalement ce stade ces analyses ne doivent vous poser aucun probl me Nous constatons qu un d ficit en h t rozygotes tr s significatif quoique l ger F7 0 0
161. 7 1 Fs7 a bDg o De est la distance g ographique afin d estimer le produit Do de la densit d adultes reproducteurs dans un site D et la distance moyenne au carr mesur e entre la position occup e par un adulte reproducteur et celle que sa m re occupait la g n ration pr c dente En effet Rousset 1997 montre qualors l Ds 52 ib 52 Cette m thodologie fut appliqu e pour l escargot intertidal c tier Bendicium vita tum voir Rousset 1997 pour une r analyse ou la tique d oiseaux marins xodes uriae McCoy et al 2003 Les sous chantillons sont distribu s sur deux dimensions Dans ce cas le test de Mantel doit tre effectu entre la matrice des Log n p riens des distances g ographiques par paire de populations et celle des 6 1 6 voir Rousset 1997 Si le test est significatif la pente de la r gression s7 1 Fsr a bLn Do va permettre d estimer Do avec l quation Rousset 1997 l Di 53 Al b ve Si Pun des deux param tres D ou peut tre estim m me approximativement de fa on ind pendante on obtient un pouvoir d inf rence relativement puissant ici voir Korri et al 2006a Bouyer et al 2009 DE GARINE WICHATITSKY et al 2009 pour illustration Tests statistiques 89 Les m mes proc dures peuvent tre appliqu es entre individus entre lesquels un quivalent du F57 1 Fs7 appel a calcul dans Genepop et d velopp par Rousset 2000
162. 7 Bon00O 5 035 605 64 Bon00 7 0400409 Bon00 7 042042 Figure 89 Aspect d un fichier de donn es pour NeEstimator Exemple des donn es de Bonon 2000 Le seul locus correspond aux MLGs Les donn es commencent en seconde ligne qui ne sera pas lue par NeEstimator Le signe gt gt signifie une tabulation tic programs et cliquer ensuite sur Create On vous demande ensuite de choisir les populations focales pour laquelle le N et le m seront calcul s et sources immigrants Nous choisissons d abord Bonon comme population focale pour laquelle nous essayerons d obtenir m et N et les deux autres comme source fig 92 Renommez le fichier de telle sorte qu il soit identifi comme focalis sur Bonon comme par exemple T BruceiFoyerAnMLGCreate MLNE Bonon txt Faites ensuite la m me chose pour Boffa et Dubr ka Pour Boffa a ne marche pas car il ny a qu un seul chantillon temporel Nous nobtenons donc que deux fichiers ana lysables par MLNe un pour Bonon et un pour Dubr ka N oubliez pas d identifier le fichier de Dubr ka Analyses avec NeEstimator Lancez NeEstimator et apr s avoir lu l avertissement cliquez sur OK Apr s avoir cliqu sur File et choisi New vous obtenez un cadre de menu o vous allez s lectionner les m mes options que celles indiqu es en figure 93 En particulier choisissez le format de fichier Genepop et ignorez la premi re ligne avec un format de d lim
163. 72 2 N SS 2NI Za p 1 7 p 02 36 2 SS 2NH 7 p Nous pouvons enfin obtenir les moyennes de ces sommes de carr s en les divisant par leur degr de libert respectif et ainsi obtenir le syst me d quations trois inconnues 56 Initiation la g n tique des populations naturelles Norv MS Ze Nr 7 A No 2 2N 2 p 1 2 At 2NA1 p n MS a 2M iayta On a donc 2 i Nyy AN N 2N 1 p 1 re 2a P 0 Cp 3 we 2 2nl N 1 AN ee i No gt NA 2N 2 p gt a Nin I 2NA N 1 ce qui donne Nr N 0 2N 1 2 Ni ne 2 p _ Nr Nm N 1 n N 1 4N 2 A p E P Nro P N 1 4N N 1 La combinaison des syst mes d quations 39 et 29 permet d obtenir les estima teurs des diff rentes statistiques F dans le cas de figure pr sent N 39 a Ceux qui souhaiteraient plus de d tails sont invit s consulter la bibliographie correspondante car je n entrerai pas plus dans les d tails ici tant donn que ces estimateurs sont calcul s par la plupart des logiciels disponibles tels que Fstat 2 9 3 GouDET 2002 t l chargeable gratuitement http www unil ch izea softwares fstat html voir GOUDET 1995 Genetix 4 03 BELKHIR et al 2004 t l chargeable gratuitement http www univ montp2 fr genetix genetix gene tix htm ou encore Genepop 3 4 Raymon et Rousset 2003 t l chargeable gratuitement
164. 9 On obtient alors une fen tre r sultat dont on fait descendre le curseur pour pouvoir enregistrer cliquer sur Save fig 60 Je Pai enregistr e sous le nom NeEstimA txt Cliquez ensuite sur l option Ne inferences du menu Analysis et sauver en gardant le m me nom car ces nouveaux r sultats sont crits la fin de la fen tre pr c dente Vous pouvez ouvrir le fichier r sultat avec un diteur de texte Recommencez la m me op ration pour chacune des zones restantes Les r sultats sont que seules deux collec tions de pi ges donnent des valeurs exploitables le pi ge 8 de la zone A N 3 19 m 0 27 et le groupe de pi ges 16 17 de la zone H N 2 08 m 0 55 tabl 27 La m thode de Waples et Do pour laquelle il suffit de charger le fichier Genepop avec toutes les donn es en appuyant sur le bouton Search ne donne aucun r sultat 206 Initiation la g n tique des populations naturelles M ESTIM 1 2 File Options Figure 59 Menu pour lancer la premi re analyse effectuer avec ESTIM ici pas d estimation possible comme c est tr s souvent le cas mais la plupart des limites inf rieures param triques disponibles indiquent de tr s faibles valeurs de JN N anmoins et sans garde fou solide pour la m thode impl ment e il faudra bien garder l esprit qu on aura peut tre ici des valeurs tr s sous estim es par la m thode des d s quilibres de liaison de B
165. 9 1421424 1511374 1121299 1211299 1291334 1291449 125142 131144 1421424 1291294 1271294 1341374 133133 1261334 1491499 133133 1251254 1361354 1311374 000000 Figure 37 Format de fichier pour NeEstimator pour les tiques de Berne 1995 Il faut ensuite lancer le programme NeEstimator apr s lavoir install sur votre machine bien entendu Une fen tre d avertissement sur le copyright et sur la mani re idoine de citer ce logiciel appara t Cliquez sur OK pour acc der au pro gramme qui appara t dans une fen tre comme dans la figure 38 Comme indiqu sur la figure 38 cliquez sur le menu d roulant File et Open ce qui permet d ouvrir la fen tre Analysis Dans la fen tre Analysis une s rie d onglets appara t et vous positionne sur celui du format de vos donn es Data Format o il n y a rien changer car vous avez 161 La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet gt NeEstimator Figure 38 Menu a louverture de NeEstimator Load Details for Selected File Data File No data file selected Generation Number Loci Number of Individuals Figure 39 Onglet Data File avec le bouton Load qu il faut clicker 162 Initiation la g n tique des populations naturelles 2 NeEstimator g MCLEEPS Settings MLNE Settings Configure Third Party Methods Set As Default Analysis m Details for Selected
166. 96 D abord parce que la Tunisie est trop loign e par rapport aux distances entre chantillons suisses Il y aurait deux groupes de points Proc der un test de r gression entre deux points n a pas de sens le plus court chemin entre eux tant n cessairement une droite c est dans tous les bons livres de statistiques Or le test d isolement par la distance est une forme de r gression o on cherche expliquer une diff rence g n tique croissante par un loignement g ographique Ensuite il n y a pas assez d chantillons en 1995 Pour le test il faut configurer un fichier avec deux demi matrices l une pour les distances g ographiques entre paire de sites et l autre pour les Fs7 estim s par 6 correspondants Pour les distances g ographiques vous pouvez vous aider de la figure 15 Pour les Fz il suffit de prendre la sortie IRTot96CH fst que Fstat a produit en analysant le fichier IR9GCH dat des donn es suisses 1996 si vous avez toutefois coch la case Fst per pair of samples En ce qui me concerne j obtiens les matrices repr sent es dans le tableau 15 Le test va tre effectu selon la m thode d crite par ROUSSET 1997 pour un sch ma en deux dimensions Nous allons donc effectuer un test de Mantel sur la corr lation entre le F7 1 Fsr et le log n p rien ou naturel de la distance g ographique Nous allons utiliser Genepop 3 pour faire ce test et donc formater les donn es dans ce sens et
167. BLOIS R Esroup A Rousser F 2003 Influence of mutational and sampling factors on the estimation of demographic parameters in a continuous population under isolation by dis tance Mol Biol Evol 20 491 502 Lesois R Rousser F Estour A 2004 Influence of spatial and temporal heterogeneities on the estimation of demographic parameters in a continuous population using individual microsat ellite data Genetics 166 1081 1092 LEGENDRE P LEGENDRE L 1998 Numerical Ecology Second English Edition Amsterdam Elsevier Science B V LEHMANN T Haw ey W A Kamau L FONTENILLE D Smar F Coruns E H 1996 Genetic dif ferentiation of Anopheles gambiae populations from East and West Africa comparison of microsatellites and allozyme loci Heredity 77 192 208 LISCHER H E L EXCOFFIER L 2012 PGDSpider an automated data conversion tool for 294 connecting population genetics and genomics pro grams Bioinformatics 28 298 299 LUIKART G CORNUET J M 1999 Estimating the effective number of breeders from heterozygote excess in progeny Genetics 151 1211 1216 MacArruur B H 1957 On the relative abundance of bird species Proc Natl Acad Sci USA 43 293 295 MacLean L Opt M MacLeop A Morrison L SWEENEY L Cooper A KENNEDY P G E STERNBERG J M 2007 Spatially and genetically distinct African trypanosome virulence variants defined by host in
168. Ber 195 IF Bern95F_044 18 10 1741761301301 119119 233233128128 Ber 195 VE Bern95F_045 19 11 171175 145145 119121 243246 142142 Bera CE Bern95F_048 20 3 173183 147147 119119 243243 129142 eres Soy e Bern95F_049 21 12 168170 000000 119121 233233 131144 Ber 195 Je Berm ab T050 T22 6 1691691150151 119119233233 129135 Ber 95 M___ Bern95M_006 1 7 T 7 ASS VAIO 2335233 29129 Ber 195 M T i Bemn95M_ 008 2 8 172172 137148 119119 000000 000000 Ber 95 M___ Bern95M_009 3 14 165165 146148 119127 248248 131137 Ber 95 M Bern95M_010 4 3 000000 148148 123123 233233 131133 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 141 7 Import format texte MN Lapremi re ligne contient les noms des locus M La premi re colonne est l identifiant des populations La seconde colonne est l identifiant des individus Figure 30 Importer les donn es dans Genetix la fin du fichier On s lectionne les cases H2 H726 on les copie et on fait un collage sp cial on veut ne coller que la valeur et non la formule sur C2 On sup prime les colonnes H et A et on sauve en texte seul sous le nom IRTotBAPSClustMalMangIRO8MEFSep txt Supprimez aussi le label de la pre mi re colonne c est pour Genetix qui ne d sire que le nom des loci P q q Nous allons maintenant recalculer les Fy par locus et sur l ensemble avec intervalles de confiance Nous sommes paresseux e
169. C 2005 Population genetics of the diamondback terrapin Malaclemys terrapin Mol Ecol 14 723 732 HeatyJ A 1979 Analysis oft Glycerophosphate deshydrogenase variability in the tick Zxodes ricinus Acari Ixodidae Genetica 1 19 30 Heprick P W 1999 Perspective Highly variable loci and their interpretation in evolution and conservation Evolution 53 313 318 Heprick P W 2003 Hopi Indians cultural selection and albinism Am J Phys Anthropol 121 151 156 Hepricxk P W 2005 A standardized genetic dif ferentiation measure Evolution 59 1633 1638 Hive M BANULS A L TIBAYRENC M 2001 Genetic heterogeneity and phylogenetic status of Leishmania Leishmania infantum zymodeme MON 1 epidemiological implications Parasitology 123 425 432 Hirai H Lo Verne P T 1995 FISH techniques for constructing physical maps on schistosomes chromosomes Parasitol Today 11 310 314 Initiation la g n tique des populations naturelles HOFFMAN J I Forcapa J TRATHAN P N Amos W 2007 Female fur seals show active choice for males that are heterozygous and unrelated Nature 445 912 914 HOFFMAN J I Matson C W Amos W LOUGHLIN T R BickHaAM J W 2006 Deep genetic subdivi sion within continuously distributed and highly vagile marine mammal the Stellers sea lion Eumetopias jubatus Mol Ecol 15 2821 2832 Horm S 1979 A simple seque
170. CROCHECKER T IDENTIX T ML RELATE Select Populations l WHICHLOCI Deselect All Select All Output Folder OeMeeus thierry BouquingenatPop TP Data Trypans Findha i oe i es ee ie ie ne Output Filename BruceiFeyerAnML Craste Back Figure 92 D finir la population focale et les populations sources pour MLNe dans CREATE 264 Initiation a la g n tique des populations naturelles gt NeEstimator l OX Analysis X Data Format Data Files Methods TM3 Settings MCLEEPS Settings MLNE Settings Type of File p Example Choose the format of your data file 1 Header line Label1 AlleletaAlleletb Allele2aAllele2b GenePop Cc Simple Columns Label2 AlleletaAlleleib 000000 Label3 Allele1aAllele1b AlleleZaAllele2b ete ag C Counts Labeln AlleletaAlleletb AlleleZaAllele2b r File Format Options Missing values denoted by 000000 Header lines to ignore fi Delimiter used between data Ta Individual labels included V F Figure 93 Menu NeEstimator pour estimation de N temporel Waples NeEstimator Fie NeEstimator Help gt Analysis Data Format Data Files Methods TM3 Settings MCLEEPS Settings MLNE Settings Data Files Loaded date files Details tor Selected File Data File C DeMeeus thierry BouquinGenetPop TP DateT rypano FindNe Bonon02 txt Generation 19 Number Loci 1 Number of
171. E DEROTHE J M LAMBERT A DE Meets T Cezy E 1995 Assortative pairing in Gammarus insensibilis Amphipoda infested by a trematode parasite Oecologia 104 259 264 TIBAYRENC M 1998 Genetic epidemiology of parasitic protozoa and other infectious agents the need for an integrated approach Int J Parasitol 28 85 104 TiBAyRENC M 1999 Toward an integrated genetic epidemiology of parasitic protozoa and other pathogens Ann Rev Genet 33 449 477 TrpayReNc M Ayaa F J 2002 The clonal theory of parasitic protozoa 12 years on Trends Parasitol 18 405 410 TIBAYRENC M KJELLBERG E AYALA E J 1990 A clonal theory of parasitic protozoa the population structures of Entamoeba Giardia Leishmania Naegleria Plasmodium Trichomonas and Trypanosoma and their medical and taxonomical consequences Proc Natl Acad Sci USA 87 2414 2418 TIBAYRENC M KJELLBERG E ARNAUD J Oury B BRENIERE S E DARD M L AYALA E J 1991 Are eukaryotic microorganisms clonal or sexual A population genetics vantage Proc Natl Acad Sci USA 88 5129 5133 Toonen R J 1997 Microsatellites for Ecologists Non Radioactive Isolation and Amplification Protocols for microsatellite markers Unpublished manuscript available from the author or via anonymous FTP from http biogeek ucdavis edu Msats or http www2 hawaii edu toonen files MsatsV 1 pdf TROUV S DEGEN L GOUDET
172. E a computer program for maximum likelihood estimation of relatedness and relationship Mol Ecol Notes 6 576 579 Kimura M Outa T 1978 Stepwise mutation model and distribution of allelic frequencies in a finite population Proc Natl Acad Sci USA 75 2868 2872 Kimura M Weiss G H 1964 The stepping stone model of population structure and the decrease of genetic correlation with distance Genetics 49 561 576 KING J R Jackson D A 1999 Variable selec tion in large environmental data sets using princi pal components analysis Environmetrics 10 67 77 KiszewskI A E MATUSCHKA E R SPIELMAN A 2001 Mating strategies and spermiogenesis in ixodid ticks Annu Rev Entomol 46 167 182 Korri B B De Meets T Barr N DURAND P ARNATHAU C CHEVILLON C 2006a Founder effects inbreeding and effective sizes in the Southern cattle tick the effect of transmission dynamics and implications for pest management Mol Ecol 15 4603 4611 Korri B B RistErRuccr A M Jour D Durand P Barre N De Meets T CHEVILLON C 2006b Characterization of poly morphic microsatellite loci within a young Boophilus microplus metapopulation Mol Ecol Notes 6 502 504 Korrt M DE Meets T BUCHETON B SOLANO P Camara M Kasa D Cuny G Ayaa E J Jamonneau V 2009 Population genetics of Trypanosoma brucei gambiense the agent of sleeping sickness in Wester
173. E fait a Profitons en pour rac courcir le nom des fichiers en BoophilusAdultsDataCattleIndivHostFisLD dat et BoophilusAdultsDataCattleIndivHostFisLD lab On lance Fstat on charge Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 221 Fstat for windows Processing BoophilusAdultsDataCattleIndivHostFisLD dat o File Options lbibec Biased dispersal Mantelise iti Help F statittics Testing and Disequiibium Come among goupe of samples 2 Gene dveraties and F Salistior Genotpec debi SS Per locus and sample statistics Global statistics Oraal or fon FF Alak biequencies FF Nera Falatistics pen Rene Genobypic lrequencies Fe afer and Cockerham Fsbatetice C Teale beween al paie di look Mamta ot atetes l Ahoa Tests between af pais ol balin each rang M Aleit richness I Fatper par of samples i Ff Gene der Normal level lor l ple beste _ 500 tf 1100 Pr 7000 fe Fis in aa Testing Save Tables Global T ects j FF Hady Weinberg vathin samples 10000 TU Hardy Weinberg overall samples a Fr Population dieere fe iO beet C Test MOT assuming HW vahin samplet o Aun Test manng Hi vaihe samples fo FM Hiv beste pes katut and ample Haminal level Pet muliple tests P S100 e100 P1008 Peite tects of difesentialion Figure
174. Fry tout comme le Frs varie entre 1 et 1 Concepts de base en g n tique des populations 47 Nous pouvons pour finir remarquer que pour un mod le en les infini et deux all les nous avons d montr avec l quation 16 que 1 p 1 2a p ce qui correspond la d finition originelle du Fr WRIGHT 1965 rest e assez Fi op populaire pour qu on la trouve encore dans de nombreuses publications et ouvrages sp cialis s D finitions en fonction des probabilit s d identit Maintenant notons Qy la probabilit d identit de deux all les d un m me locus au sein d un m me individu pris au hasard Qs la probabilit de tirer deux all les iden tiques d un m me locus de deux individus diff rents de la m me sous population et Qr la probabilit de tirer deux all les identiques de deux individus de deux sous populations diff rentes pris au hasard Nous pouvons alors donner les formules g n ralis es des statistiques F pour un degr 3 de subdivision individu sous popu lation et total RoussET 2004 Q Q Fis FG P Q Q Der 21 Fir en En partant du syst me d quations 21 nous pouvons galement constater que le Fer varie entre Fsr 0 quand l identit g n tique entre individus est ind pen dante de la sous population o ces individus r sident absence de diff renciation g n tique entre sous populations et Fr 1 quand tous les individus r sidant dans la m me sous po
175. Fstat Il faut s lectionner les loci pas le locus MLG dans un premier temps et les sous chantillons pertinents pas les souches de r f rences ni les sous chantillons o il my a eu qu une seule m thode de pr l vement Ceci se fait avec le menu d roulant Options de Fstat et les sous menus Label file for pops pour indiquer le fichier contenant le nom des sous chantillons plus facile pour la suite Loci to use on s lectionne tout sauf MLG et Samples to use on s lectionne les sous chantillons de Bonon en 2002 et 2004 qui sont les seuls o plusieurs m thodes de pr l vements sont disponibles Dans le cadre principal du menu Fstat cochez Fst per pair of samples Pairwise tests of differentiation et activez le bouton 1 1000 de Nominal level to multiple tests pour avoir suffisamment de permutations Enfin cliquez sur Run Nommez le nouveau fichier T BruceiBetweenlsolationMetEstat dat nous avons en effet s lec tionn des loci et sous chantillons particuliers pour ce test et cliquez sur Enregistrer pour lancer l analyse Fstat Deux fichiers de sortie Fstat nous int ressent celui qui poss de les F s par paire de sous chantillon et qui porte l exten sion fst et celui qui donne les P values avec l extension pvl Les seules paires qui nous int ressent sont celles qui comparent deux m thodes dans un m me sous chantillon Comme on le voit d
176. I 1 1l 2 V2 2 l l 5 1 m t 2 2 q Nous avons d j vu que m lt 0 5 donc 1 1 m 2q 1 81 79 q En combinant les quations 80 et 81 nous obtenons dil 8ul 75 N 2UF Is J or _ 1 1 m 2 2 4uFrs For Fy t 1 8ul Ts _ 1 l AuFrs 2h or 4uF 7s For ga ee a a 2 2 4uF 7s For 278 Initiation a la g n tique des populations naturelles N 8uFrs 1 1 F TETE Esr 2 2 kor 4uF ys gt F yss fist 8uFrs l m l sr 2 FT 4uF 75 Nous pouvons maintenant calculer les effectifs clonaux des diff rents foyers ainsi que la proportion de migrants Notez que dans le cas particulier des clones structu r s en deux sous unit s le Fy devient ind pendant de la migration et on peut direc tement estimer V partir du F7 Nous prendrons comme pr c demment u 0 001 Les r sultats sont pr sent s dans le tableau 38 Une sous population isol e Dans ce cas on consid re que m 0 et donc q 1 qy 0 et Qr 0 et le syst me d quations 73 devient Qr 0 i 1 Ose ace 7 Qr 0 gt Qr 0 1 er ee Qs on Qr 0 gt Qr 0 2N AlN Qs 2N 2N G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 279 D Q 0 2N JIN Qs o a Ls ZIV 2N Qr 0 Nous savons que 0 001 donc que u7 lt lt 1 et donc que y l 2u ce qui fait Qr 0 l 2 Qs N Dis Ne Qr 0 Q 0 l
177. IN J P HERVOUET J P DE MEE Ss T KaGBADOUNO M S BOUYER J SOLANO P 2006 Genetic and morphometric evidence for isolation of a tsetse Diptera Glossinidae population Loos islands Guinea Journal of Medical Entomology 43 853 860 CATERINO M S CHo S SPERLING E A H 2000 The current state of insect molecular systematics a thriving tower of Babel Annu Rev Entommol AS 1 54 Initiation a la g n tique des populations naturelles CAVALLI SFORZA L L Epwarps A W E 1967 Phylogenetic analysis model and estimation proce dures Am J Hum Genet 19 233 257 CHAMBERS J M Hastie T J 1992 Statistical Models in S Wadsworth and Brooks Cole Advanced Books and Software PacificGrove CA CHapuis M P Estour A 2007 Microsatellite null alleles and estimation of population differen tiation Mol Biol Evol 24 621 631 CuHEssEL D Durour A B THIOULOUSE J 2004 The ade4 package I One table methods R News 4 1 CHEVILLON C Korri B B BARRE N DURAND P ARNATHAU C De Meets T 2007a Direct and indirect inferences on parasite mating and gene transmission patterns Pangamy in the cattle tick Rhipicephalus Boophilus microplus Infect Genet Evol 7 298 304 CHEVILLON C DucorNnez S De Meets T Korri B B Gata H DELATHIERE J M BARRE N 2007b Accumulation of acaricide resistance mechanisms in Rhipicephalus Boophilus microplus Ac
178. Il faut donc que soit indiqu 3 En huiti me ligne sont indiqu s les num ros de cohorte de chacun de ces sous chan 0 Il faut donc taper 0 20 40 sur cette ligne Ensuite ce sont les donn es cod es par Create au format cc tillons temporels dans l ordre et en commen ant par MLNE et que personnellement je n aurais jamais eu le courage de faire tout seul Il faut ensuite enregistrer ce fichier sous le nom MNE_DATA en lettres capitales et sans extension II suffit ensuite de double cliquer sur mne2 exe pour lancer la proc dure Apr s un certain nombre de calculs plus ou moins longs le logiciel cr e alors un fichier MNE_ OUT Le programme donne les valeurs de NV et de m selon deux m thodes Celle du maximum de vraisemblance avec les intervalles de confiance 95 et celle des moments Ces deux m thodes sont d crites dans l article WANG et WHITLOCK 2003 Pour Dubr ka il ny a que deux sous chantillons temporels 2 en ligne 7 correspondant aux cohortes 0 et 59 0 59 en ligne 8 Les r sultats de cette approche figurent dans le tableau 38 Estimation de la taille clonale des foyers par mod lisation Ici les allergiques aux formules math matiques vont souffrir mais il ny a gu re d autres moyens d expliquer comment obtenir des valeurs d effectifs clonaux Ceux pour lesquels la cause est perdue peuvent se r f rer directement aux r sultats finaux Cependant si vous lisez c
179. Individuals 14 Figure 94 Cadre de menu de NeEstimator pour choisir les fichiers analyser pour un calcul d effectifs efficaces pour deux chantillons du m me site pr lev s deux dates diff rentes G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 265 NeEstimator ka Dune Help Run Results Table t C Results Plot fgs MCLEEPS Settings MLNE Settings Configure Third Party Methods Set As Default Analysis Save Data AS Bomont Details for Selected File Data File C DeMeeus thiery BouquinGenetPop TP DateTrypano FindNe Bononl2 bet Generation 3 Number Loci 1 Number of Individuals Figure 95 Lancement du calcul de N 3 HeEstimator Approx 95 CL Figure 96 R sultats de Panalyse NeEstimator pour le calcul du N temporel de Waples Bonon 266 Initiation la g n tique des populations naturelles gt NeEstimator X LR NeEstimator Help New mela Open Ctri O 0 bad m x Results of Analysis Print Results Ctri P Estimate Approx 95 Cl 4 Ne Bonon02 tt MLNE Program Figure 97 Sauver les r sultats de NeEstimator Vous pouvez et je le conseille sauvegarder ces r sultats avec le menu d roulant File et Save fig 97 Nommez votre fichier de fa on appropri e et NeEstimator y ajoutera l extension NeA Jai personnellement nomm ce fichier ResNeEstimBonon00 02 NeA Refaites la m me chos
180. Ixodes ricinus La fr quence attendue des blancs pg2 est obtenue en mettant au carr la fr quence estim e des all les nuls selon la m thode 2 de BROOKFIELD 1996 et le nombre de blancs attendus correspondant cette valeur multipli e par N N correspond quant lui la somme de N individus g notyp s et des blancs observ s Pour la derni re ligne la valeur de pp est obtenue en divisant le nombre total de blancs attendus par le N total chantillon observ s attendus Bem Jont oui non 0 1201 0 0144 45 46 0 66 Cent oC F i 0 1736 003011729 0 90 Dor_96_F i 0 0594 0 0035 47 o7 Gor_96_F i i 0 0826 0 0068 023 Tun_96_F i 0 3594 01292 2 58 0 0253 4 61 Tous Pour v rifier que ces r sultats expliquent correctement les F7 observ s on peut comparer la proportion de blancs observ s avec celle attendue sous l hypoth se que les all les nuls expliquent la totalit de ces F7 Un test binomial unilat ral avec comme fr quence attendue pg2 un nombre de r ussite gal aux blancs observ s pour un nombre d essais de VW semble ici appropri On pr f re ici un test unilat ral car ce qui nous int resse est de savoir si on a oui ou non moins de blancs qu attendus On peut facilement effectuer ce test sous R Il nous faut donc lancer R et dans la fen tre de commande taper l instruction binomtest Blancs observ s N p pp gt alternative less 128 Initiation a la g n tique des populations n
181. J 2005 Ecological components and evolution of selfing in the freshwater snail Galba truncatula J Evol Biol 18 358 370 Uer M W Parmer G H Scores G A KappMEYER L S Know ies D P 2008 Persistently infected horses are reservoirs for intra stadial tick borne transmission of the apicomplexan parasite Babesia equi Infect Immun 76 3525 3920 UILENBERG G 1976 Tick borne livestock dis eases and their vectors 2 Epizootiology of tick borne diseases World Animal Review 17 8 15 Van Bekkum M Sacar P M STAHL J L CHAMBERS G K 2006 Natal philopatry does not lead to population genetic differentiation in Buller s albatross Thalassarche bulleri bulleri Mol Ecol 15 73 79 VAN OOSTERHOUT C HUTCHINSON W E WILLS D P M Surrey P 2004 Micro checker soft ware for identifying and correcting genotyping errors in microsatellite data Mol Ecol Notes 4 535 538 VERGES J 1944 Les tiques du b tail M thodes d radication Noum a Imprimeries r unies VIGNAL A MILAN D SANCRISTOBAL M EGGEN A 2002 A review on SNP and other types of molecular markers and their use in animal genetics Genet Sel Evol 34 275 305 Bibliographie 299 Vitatis R Couver D 2001a ESTIM 1 0 a computer program to infer population parameters from one and two locus gene identity probabili ties Mol Ecol Notes 1 354 356 Vitauis R Couvet D 2001b Est
182. LARD J C 2009 Population genetic structure of wild and farmed rusa deer Cervus timorensis russa in New Caledonia inferred from polymorphic microsatellite loci Genetica 137 313 323 DELAYE C AESCHLIMANN A RENAUD E ROsENTHAL B De MEE S T 1998 Isolation and characterisation of microsatellite markers in the Lxodes ricinus complex Acari Ixodidae Molec Ecol 7 360 361 DELAYE C B ATI L AESCHLIMANN A RENAUD E De Meets T 1997 Population genetics struc ture of Ixodes ricinus in Switzerland from allozymic data No evidence of divergence between nearby sites Int J Parasitol 27 769 773 De Meets T 2000 Adaptive diversity spe cialisation habitat preference and parasites Jn Poulin R Morand S Skorping A eds Evolutionary Biology of Host Parasite Relationships Theory Meets Reality Amsterdam Elsevier 27 42 DE Meets T AGNEw P PRUGNOLLE F 2007b Asexual Reproduction Genetics and Evolutionary Aspects Cell Mol Life Sci 64 1355 1372 De Meets T Battoux E 2004 Clonal repro duction and linkage disequilibrium in diploids a simulation study Infect Genet Evol 4 345 351 De Meets T Battoux F 2005 F statistics of clonal diploids structured in numerous demes Mol Ecol 14 2695 2702 DE Meets T B ATI L DELAYE C AESCHLIMANN A RENAUD E 2002a Sex biased genetic struc ture in the vector of Lyme disease xodes ricinu
183. Ne t indique la g n ration en partant de 0 pour 1998 et en finissant avec 79 pour 2004 sur la base de 10 g n rations par an Il s agit ensuite de lancer le calcul en cliquant sur File et Run comme sur la figure 95 Les r sultats apparaissent sous forme d un tableau fig 96 Seule l analyse par la m thode temporelle de Waples celle qui nous int resse ici donne un r sultat avec 95 d intervalle de confiance Cet intervalle de confiance est calcul selon la for mulation complexe d crite dans WapLes 1989 qui utilise la loi du Chi 2 avec un degr de libert gal au nombre total d all les ind pendants ayant servi l estimation et un seuil a 0 05 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 263 Number of Loci Row Containing Column Headings Row Data Begins On Population Identifier Column Individual Identifier Column Column Containing Cohort Birth Column Containing Death Use F Vv F Vv Vv a Column Containing Sex F Column Containing Known Parent 1 Column Containing Known Parent 2 F Column Containing Spatial Data 1 F Column Containing Spatial Data 2 Column Containing First Allele Columns After Allelic Data Missing Data Symbol Text File Delimiter Text Files txt dat Figure 91 Menu Create pour cr er le fichier pour MLNe Select Programs For File Output F MLNE l NEESTIMATOR r SALMONNB l TM3 T TMVP r MI
184. O2042 060s 0709 3 iy 3 0204s 0106s 0204 10 1 3 0204 0101 0205 11 in Fa O204 0606 0909 12 ix Js 0204s 01062 0709 13 1 Je 0405s 0106 0202 14 Is Jo 02045 0608s 0209y 15 in Jp 0204r 0105 0209 16 i 3 0104 01068 0204 17 is 4 020 DEUG 0709p 18 i 4 04045 0101 0205 19 i Je O204 0206 06093 20 1 3 0204s 0102 OSS 2zi 1s dm 0202s 0101 0209y zz in a 0204s 060g 0202 23 i Js 0202 0108 02 OS 24 Is 3J 020 0106 0209 25 1 3p 0204 NA 0209 26 dr Js 0204s 0106s 0209 27 Ix 3 004 0202 0909 26 1s 4 0205 D l 0505p 29 2h ds 0404 0606 0903 30 go ds O2042 0605 0505 31 26 Fe 0205s 0206 0205 JE 2 do O202 0106 0204 33 x ni 0103 NA 0204 34 2 ds 0204 0101 0202 35 d 4s O202 His 0202 36 2 ds 0204 0207 0202 T a de 04042 0206 0202 36 fe ds 0404 06065 0202 39 2 dx 0204r 010i 0409 Figure 66 Extrait du fichier BoophilusAdultsDataCattleHierFstat txt pour l analyse des F hi rarchiques par HierFstat le package hierfstat on se met dans le bon r pertoire et on tape les commandes habituelles data lt read table BoophilusAdultsDataCattleHierFstat txt header TRUE attach data loci lt data frame B1l2 C07 D12 D10 Al2 C03 gt levels lt data frame Farm Host gt varcomp glob levels loci ce qui donne le r sultat Farm Host Ind Total 0 01535231 0 016482637 0 05917112 Farm 0 00000000
185. RONDELAUD D RENAUDE 2004a Field and experimental evidence of pref erential selfing in the freshwater mollusc Lymnaea truncatula Gastropoda Pulmonata Heredity 92 316 322 MEUNIER C HURTREZ BOUSS S S DURAND P RONDELAUD D RENAUD FE 2004b Small effec tive population sizes in a widespread selfing species Lymnaea truncatula Gastropoda Pulmonata Mol Ecol 13 2535 2543 MICHALAKIS Y EXCOFFIER L 1996 A generic estimation of population subdivision using dis tances between alleles with special interest to microsatellite loci Genetics 142 1061 1064 MizcrooM M G 1996 Recombination and the multilocus structure of fungal populations Ann Rev Phytopathol 34 457 477 Morean A D GANDON S BUCKLING A 2005 The effect of migration on local adaptation in a coevolving host parasite system Nature 437 253 256 MURREL A BARKER S C 2003 Synonymy of Boophilus Curtice 1891 with Rhipicephalus Koch 1844 Acari Ixodidae Syst Parasitol 56 169 172 Naozer S A 1995 Microevolution and the genetic structure of parasite populations J Parasitol 81 395 403 N BAVI E AYALA E J RENAUD E BERTOUT S EHOLIE S Moussa K MALLI M De MEEts T 2006 Clonal population structure and genetic diversity of Candida albicans in AIDS patients from Abidjan C te d Ivoire Proc Natl Acad Sci USA 103 3663 3668 Ner M Cuesser R K 1983 Es
186. RUE gt attach data gt loc27 lt gl m data formula Fis poly Allele 2 Sexe family gaussian gt anova loc27 test F La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 167 R 0 52 P value 0 008 0 8 1 ie A z K 111 115 119 123 127 13 Taille des all les Figure 42 R gression entre taille des all les et F observ s au locus IR27 dans les clusters d Z ricinus d finis par BAPS Il n y avait pas assez de donn es pour calculer des intervalles de confiance ce qui renvoie au r sultat suivant Analysis of Deviance Table Model gaussian link identity Response Fis Terms added sequentially yrst to last Df Deviance Resid Df Resid Dev F Pr gt F NULL 16 lL 65129 poly Allele 2 2 0 85916 14 0 79212 7 0896 0 008281 Sexe 1 0 00441 13 0 78771 0 0728 0 791550 Comme cela a t vu au d but de ce paragraphe la majeure partie 64 du Fy initial est expliqu e par un effet Wahlund Cet effet Wahlund est plus prononc chez les m les dont les clusters se trouvent plus diff rents entre eux que les femelles Dans l hypoth se de sp cificit s d h tes diff rentes des larves et ou nymphes femelles et m les des groupes de larves ou nymphes m les fortement apparent s seraient trans port s ensemble sur le m me h te tr s dispersant oiseau avec de forts risques de tomber sur des sites d favorables lors du d tachement la fin du re
187. SWALDT et GLENN 2005 VAN BEKKUM ef al 2006 HoFEMaN ef al 2006 tendent montrer par la diff rence des r sultats obtenus la compl mentarit des deux approches ou plus rarement une convergence tonnante Warts et al 2007 BOUYER et al 2009 DE GARINE ef al 2009 Cela tant pour les syst mes h te parasite vecteur le marquage est le plus souvent impossible de toutes fa ons au moins pour le pathog ne Il faut cependant citer ici la tentative m ritoire de CHLYEH et al 2002 sur les bulins h tes interm diaires de schisto somes et sur les ts ts sur lesquelles nous reviendrons L acc s ce type d information n a pas qu un int r t acad mique il n est pas non plus r ductible un simple divertissement intellectuel M LGROOM 1996 TIBAYRENC 1998 1999 TAYLOR et al 1999 CRISCIONE et al 2005 Population structure and mating system of pathogens are tightly linked biological phenomena with crucial consequences on the epidemiology of transmissible diseases TIBAYRENC et AYALA 2002 Ces informations peuvent en effet s av rer cruciales pour le contr le de certaines maladies M1LGRoom 1996 et pour les recherches de nouveaux traite ments et de mesures de pr vention TAYLOR ef al 1999 ainsi que pour des valua tions et pr dictions plus efficaces quant l volution de r sistances aux drogues antibiotiques et autres biocides TIBAYRENC 1999 Les recherches utilisant la g n tiqu
188. TCHARD J K STEPHENS M DONNELLY P 2000 Inference of population structure using multilocus genotype data Genetics 155 945 959 Prout T 1981 A note on the island model with sex dependent migration Theor Appl Genet 59 327 952 PRUGNOLLE E CHoisy M THERON A Duranp P DE Meets T 2004a Sex specific correlation between heterozygosity and clone size in the trematode Schistosoma mansoni Mol Ecol 13 2859 2864 PRUGNOLLE FE DE Meets T 2002 Inferring sex biased dispersal from population genetic tools a review Heredity 88 161 165 PRUGNOLLE E DE Meets T 2010 Apparent high recombination rates in clonal parasitic organ isms due to inappropriate sampling design Heredity 104 135 140 PRUGNOLLE E DE Meets T DURAND P Sire C THERON A 2002 Sex specific genetic structure in Schistosoma mansoni evolutionary and epidemi ological implications Mol Ecol 11 1231 1238 PRUGNOLLE F Durano P TH RON A CHEVILLON C De MEE S T 2003 Sex specific genetic structure new trends for dioecious para sites Trends Parasitol 19 171 174 PRUGNOLLE F THERON A Duranp P De Meets T 2004b Test of pangamy by genetic analysis of Schistosoma mansoni pairs within its natural murine host in Guadeloupe J Parasitol 90 507 509 PRUGNOLLE E THERON A PoINTIER J P JABBOUR ZAHAD R Jarne P Durano P De Meets T 2005 Dispersal in a parasitic worm
189. TII PO HOTO FISTS HOTS PARA MOT 125123 PIS MOIS 119119 125125 HOTI OE OTTI HITI FOTI HOTS ISA 259255 220 243243 250250 243248 241241 243248 293223 23293 243243 20020 250253 250250 233243 233233 000000 252559 295285 243246 243243 20020 25029 20020 000000 129129 135153 000000 142142 142142 129135 S15 125125 135142 125142 151197 134137 1224127 12101028 135142 112129 127134 128128 142142 129142 131144 129135 129129 000000 117 PREMIER RECODAGE DES DONNEES Certains logiciels n aiment pas les noms longs et encore moins les accents ou autres signes cabalistiques Par ailleurs il est plus commode pour la lisibilit que tous les noms d un m me niveau aient le m me nombre de caract res alignement des colonnes C est pourquoi j ai choisi de recoder dans IRTotBrutl txt le nom des sites qui a t raccourci Dans les donn es initiales certains individus sont apparus avec trois ou quatre bandes certains loci Nous avions cod ces g notypes 333000 et 444000 pour les g notypes trois et quatre bandes respectivement Il convient de recoder ces donn es en donn es manquantes 000000 Nous reviendrons sur ces g notypes bizarres un peu plus tard car ils s av reront utiles pour discuter des r sultats des analyses de pedigrees Nous allons proc der une premi re analyse avec tous les chantillons afin de tester la panmixie locale et les d s quilibres de liaison entre l
190. a 2002 73 Boffa 2002 56 eet 2002 51 Boffa 2002 57 Bonon 2004 41 _ a AASE ee ey Se Stib215 Tbb Tanzanie Lion TSW65 Tbe2 C te d Ivoire Porc TRPZ166 Tbr Zambie Zebu SSS Eatro1125 Tbb Ouganda Antilope TH2 Tbe2 La d Ivoire fee Feo Tb o Tb D Renya amina Tbe2 Soudan mae Tbe2 C te d Ivoire Porc TH113 The C te d Ivoire Abba Tbg2 C te d Ivoire Ligo Tbg2 Cote d Ivoire Figure 98 NJTree bas sur la distance harmonique de Cavalli Sforza et Edwards Les isolats de l tude de g n tique des populations sont en noir un seul repr sentant par MLG pour gagner de la place Les souches de r f rence sont en couleur rouge Tbg1 jaune Tbg2 vert Tbb bleu Tbr L esp ce h te est indiqu e si non humain 284 Initiation a la g n tique des populations naturelles Les analyses concernant des tailles g n tiques des populations de Tbg1 sugg rent un nombre de souches circulantes sup rieur l estimation du nombre de personnes infect es Les h tes r servoirs et ou les patients asymptomatiques repr sentent les hypoth ses les plus parcimonieuses pour expliquer cela mais ceci n cessitera confir mation par d autres types d tudes La diff renciation g n tique entre C te d Ivoire et Guin e indique une divergence extr me entre ces deux pays La Guin e semble en effet abriter des souches qui s loignent de toutes celles pr sentes dans notre tude et montrent m me des carac t ristiques pid miologiqu
191. a deux raisons cela La premi re est que l on conna t d avance le sens du signal La seconde raison est que les chantillons tant encore plus petits nous aurons besoin d encore plus de puissance dans le test Nous ne nous occuperons que du test sur le F7 Les tests sont tous les deux significatifs avec P value 0 0497 pour les tiques femelles et P value 0 0123 pour les tiques m les et une apparente tr s forte diff rence de signal entre les deux comme indiqu dans la figure 51 Nous pouvons galement constater la formidable variance chez les m les infect s tr s peu nombreux Nous pouvons effectuer un test unilat ral de Wilcoxon pour donn es appari es comme en p 143 quand nous avions compar les Frs des donn es brutes avec ceux des donn es clusteris es par BAPS Ici l unit d appariement reste le locus donc cinq donn es mais la statistique est la diff rence de Fs entre tiques 186 Initiation la g n tique des populations naturelles 0 45 7 Femelles infect es Femelles saines Males infect s Males sains Figure 51 Diff rence compar e entre tiques m les et femelles du F7 mesur entre tiques infect es par Bba et celles qui ne le sont pas infect es et non infect es chez les femelles et les m les Le fichier tester contiendra donc les diff rences des diff rences appari es srm srmu srer sreu Le test unilat ral Fsrmr Fsrmu gt Esrrr Fsreu montre que la diff rence n est pa
192. a la sous population de tique ou pour suivre la terminologie parasitologique l infra population de tiques au sein de laquelle nous attendons une consanguinit importante Cette forte consanguinit conduit elle un biais de dispersion sp cifique au sexe PRUGNOLLE et DE MEEts 2002 ou et un vitement des conjoints apparent s La diffusion apparemment rapide de la r sistance mais voir CHEVILLON et al 2007b peut elle tre expliqu e par les capacit s dispersives de cette tique 218 Initiation la g n tique des populations naturelles Nouvelle LE Cal donie XY an ees J 160 E RA Koumac Kaala Gomen Canala Pouembout 106 Sarram a Poquereux 24 Bourail 107 117 D aos SES Thio Bouloupari o Port Laguerre 166 Gadji 0 100 200 km Le lt lt Noum a Figure 62 Sites et nombres de Rhipicephalus microplus adultes chantillonn es sur b tail en Nouvelle Cal donie en 2003 et g notyp es aux six marqueurs microsatellites Le goulot d tranglement qu a subi cette population lors de son introduction en 1942 est il d tectable l aide des marqueurs microsatellites mis au point par KoFFI et al 2006b Si oui c est que la quarantaine s est montr e efficace car des intro ductions multiples effacent la signature d un goulot d tranglement CORNUET et Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus
193. a mauvaise Il faut d cider du test que l on fait bilat ral ou unilat ral et dans quelle direction 68 Initiation la g n tique des populations naturelles avant de faire le test Il faut donc bien se poser la question avant pas apr s Si aucune information ne permet de d finir dans quelle direction le signal doit avoir lieu il faut syst matiquement proc der un test bilat ral Par contre si on est certain de la direction que le signal est cens prendre alors le test unilat ral s impose Par exemple je mesure le Frs partir d un chantillon quelconque et j obtiens une valeur l g rement plus grande que 0 Je pose tout d abord mon hypoth se nulle Hy Fis n est pas significativement diff rent de 0 Le test statistique va donc consis ter calculer compte tenu du nombre de loci sur lequel la mesure a t faite le degr de polymorphisme de ces diff rents loci nombre d all les leur distribution et le nombre d individus g notyp s la probabilit d avoir obtenu un F7 aussi extr me ou plus extr me que celui observ sous l hypoth se d une rencontre au hasard des gam tes dans la population d o ont t tir s les individus g notyp s panmixie Le test par d faut est unilat ral et le plus souvent pour les valeurs positives A Frs gt 0 car la plupart des facteurs influen ant ce param tre g n rent des d ficits en h t rozygotes autof condation effet Wahlund Cependant dan
194. actuel MURREL et BARKER 2003 Le fichier de donn es se nomme BoophilusAdultsDataCattle txt TAT DES LIEUX Rhipicephalus microplus est une tique dure originaire du Sud Est asiatique Indon sie Malaisie Inde LABRUNA et al 2009 Cette tique a colonis les zones intertropicales du monde entier en suivant l introduction des bovins d levage et est aujourd hui devenue une peste majeure des levages de races europ ennes dans les agro cosys t mes tropicaux et subtropicaux FRISCH 1999 JONGEJAN et UILENBERG 2004 Rhipicephalus microplus est consid r e comme la tique la plus importante du monde du point de vue conomique GUERRERO et al 2006 en y tant responsable de pertes de production directes perte de poids par spoliation sanguine surinfections et transmissions de maladies ainsi qu indirectes de par l utilisation massive d acari cides comme moyen de lutte Friscx 1999 CHEVILLON et al 2007b Ajoutons que les co ts indirects se voient aggrav s par l volution r currente et extr mement rapide de r sistance aux diff rentes mol cules utilis es dans les diff rentes parties de son aire de distribution FriscH 1999 CHEVILLON ef al 2007b Cette tique est dite monophasique c est dire qu elle accomplit son cycle de mues sur un seul individu h te en th orie La femelle gravide une fois son repas sanguin achev tombe au sol et meurt en lib rant quelques milliers d ufs sur le sol
195. aguerre 0 00781 0 01563 0 42188 Sarramea 0 00781 0 02344 0 21875 Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 243 jamais en dessous de 0 0001 Pour le TPM la quatri me plus petite P value 0 01563 est toujours inf rieure 0 0355 Ici aussi la P value combin e est inf rieure 0 0001 Pour le SMM la quatri me plus petite P value est de 0 57813 Or la valeur maximale pour a est 0 5 Il est clair que pour SMM la P value est gt 0 5 on peut noter 0 57813 pour donner un chiffre comme dans DE MEEUs ef al 2009 La conclusion eu gard aux niveaux de significativit obtenus avec le IAM et le TPM est qu il existe bien une signature de goulot d tranglement dans les fermes Ce goulot correspond le plus vraisemblablement l introduction accidentelle de quelques individus microplus en 1942 Conform ment au mod le de CORNUET et LuIKART 1996 voir plus haut en p 220 compte tenu du nombre de loci la d tection de ce goulot d tranglement suppose alors que l effectif efficace post gou lot d tranglement de la premi re ferme touch e a t de N 49 1 220 soit une gamme de valeur remarquablement convergente avec la gamme donn e par les autres m thodes d estimation de M CONCLUSIONS Nos analyses ont permis de montrer que l unit d mographique de microplus n est pas l individu h te avec son infra population comme pressenti mais plut t l le
196. ailable from http www unil ch izea softwares fstat html Updated from Goudet 1995 GoupeT J 2005 HierFstat a package for R to compute and test hierarchical F statistics Mol Ecol Notes 5 184 186 GouDET J PERRIN N Waser P 2002 Tests for sex biased dispersal using bi parentally inherited genetic markers Mol Ecol 11 1103 1114 GOuUDETJ RAYMOND M DE MEE ST ROUSSETE 1996 Testing differentiation in diploid populations Genetics 144 1933 1940 GuBLeR D J 1998 Resurgent vector borne diseases as a global health problem Emerg Infect Dis 4 442 450 292 GUERRERO E D Nene V M GEORGE J E BARKER S C WILLADSEN P 2006 Sequencing a new target genome the Boophilus microplus Acari Ixodidae genome Project Med Entomol 43 9 16 Guo S W THompson E A 1992 Performing the exact test of Hardy Weinberg proportion for multiple alleles Biometrics 48 361 372 Haxpant J B S 1954 An exact test for ran domness of mating Genet 52 631 635 Harpy G H 1908 Mendelian proportions in a mixed population Science 28 49 50 Harti D L CLARK A G 1989 Principles in Population Genetics Second Edition Sinauer Associates Inc Sunderland Massachusetts Hausotp B TRAVISANO M Ramey P B Hupson R R 1998 Detecting linkage disequi librium in bacterial populations Genetics 150 1341 1348 HauswaLDT J S GLENN T
197. ailleurs hypoth se d un mod le en les est faite il est clair que nous ne sommes pas KC ESTIM 1 2 File Options Ouvrir Regarder dans O NeE stim ps CE EE m TsetseMouhounAIIMalMang gen m TsetseMouhounAllMalMangNearestPooled gen Nom du fichier F gen Fichiers de type Annuler ue af Figure 58 Chargement des donn es dans le logiciel Estim pour estimation des N a partir des d s quilibres intra et inter loci donn es manquantes chez les m les pour les loci li s PX tout fait dans les crit res orthodoxes de cette m thode Il vaut mieux consid rer chaque zone A H C D s par ment car cela influence les r sultats comme vous pourrez le v rifier Notez que la strat gie de regroupement diff re quelque peu de celle de l article de Bouyer et al 2009 avec des r sultats l g rement diff rents On peut donc charger le fichier contenant tous les groupes de pi ges de la zone A dans Estim Mon fichier s appelle Tsetse MouhounAllMalManqNearestPooledA gen N oubliez pas de supprimer les pi ges isol s ne contenant qu une mouche car Estim ne va pas appr cier On lance donc Estim et on charge son fichier Pour qu il apparaisse on tape gen dans la case appropri e comme dans la figure 58 ou alors on change l extension du fichier de gen txt et on clique dessus deux fois Ensuite on appelle la commande Identity measures du menu Analysis fig 5
198. aire de loci dans la mesure o des tests globaux existent normalement dans les autres cas diff rencia tion On peut alors appliquer le test binomial ou le Z En cas de signal positif A vraie il y aura autocorrelation entre les tests si A et B sont li s ainsi que B et C alors A et C seront li s et donc inflation de la puissance des tests La pr cision du 86 Initiation la g n tique des populations naturelles niveau de significativit n aura donc pas beaucoup de sens ce sera significatif ou pas Comme sous l hypoth se nulle nous n attendons pas plus de 5 de tests significa tifs 4 ce seuil et en principe pas d autocorr lation entre tests le test exact binomial doit faire laffaire Sous R R Development core team 2011 la commande est binom test X k 0 05 alternative greater o amp est le nombre de tests significa tifs au seuil 5 parmi les amp tests D terminer quels sont les tests significatifs proc dure de Bonferroni Ici s il est souhait de d terminer quelles paires de loci sont statistiquement associ es ou quelles paires de sous chantillons sont diff renci es la proc dure du Bonferroni s quentiel s impose Le cas des d s quilibres de liaison Les d s quilibres de liaison repr sentent le cas de figure le plus fr quent Ici en fonction de la taille de chaque sous chantillon et du degr de polymorphisme des loci le seuil de Bonferroni peut s av rer impossible atteindre
199. aires codominants Nous ne parlerons donc que d organismes eucaryotes MARQUEURS CYTOPLASMIQUES Les marqueurs cytoplasmiques correspondent des loci pr sents dans le g nome mitochondrial ou le g nome chloroplastique chez les plantes Ces marqueurs et plus particuli rement l ADN mitochondrial ont fait l objet d un nombre consid rable d tudes en populations naturelles RoDERICK 1996 LADN mitochondrial ou ADNmt s est en effet montr extr mement informatif dans les tudes phylog o graphiques car il pr sente des taux d volution relativement rapides et ne subit pas de recombinaisons entre loci AVIsE ef al 1987 AvisE 2000 Cependant pour les tudes de g n tique des populations les propri t s de ces marqueurs sont loin d tre id ales et ce pour diff rentes raisons Tout d abord l ADNmt pr sente g n ralement une h r dit uniparentale typiquement maternelle bien qu une transmission pater nelle existe chez certains organismes LE er al 2002 Xu 2005 La structure 20 Initiation la g n tique des populations naturelles g n tique constat e est donc conditionn e par celle observ e par un seul des deux sexes chez les organismes dioiques comme le sont de nombreux n matodes arthro podes et les schistosomes Par ailleurs l effectif efficace voir encadr 1 pour de tels marqueurs sera toujours difficile appr hender car d pendant de l interaction entre divers facteurs tels que
200. and its two hosts and its consequences for local adaptation Evolution 59 296 303 Qu W G Boser E M CAMPBELL J R Ucme G D Wane I N Lurr B J DYKHUIZEN Initiation la g n tique des populations naturelles D E 1997 A population genetic study of Borrelia burgdorferi sensu stricto from eastern Long Island New York suggested frequency dependent selection gene flow and host adaptation Hereditas 127 1997 203 216 QUELLER D C GoopnicuTt K E 1989 Estimating relatedness using genetic markers Evolution 43 258 275 Raczrau J Vercent G 1959 Les tiques Acariens Ixodidae des les fran aises du Pacifique Bull Soc Pathol Exot 52 819 835 RANNALA B Mountain J L 1997 Detecting immigration by using multilocus genotypes Proc Natl Acad Sci USA 94 9197 9221 RAUFASTE N BONHOMME F 2000 Properties of bias of two multiallelic estimators of Fs7 Theor Pop Biol 57 285 296 Rave S DE MEEUS T DUJARDIN J P Z Z D G Goopine R H Dusrour I SANE B Cuny G Sorano P 2007 The tsetse fly Glossina palpalis palpalis is composed of several genetically differentiated small populations in the sleeping sickness focus of Bonon C te d Ivoire Infect Genet Evol 16 116 125 RayMOND M ROUSSET E 1995a An exact test for population differentiation Evolution 49 1280 1283 Raymonp M Rousset E 1995b GENEPOP version 2
201. ande partie une r alit biologique de nature assez complexe races d h te structures familiales et qui devra conduire d autres tudes BAPS ne La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 145 repr sente ici quun outil d argumentation et d orientation de futures investiga tions pas un g n rateur de v rit s CONCLUSION SUR LES D FICITS EN H T ROZYGOTES l occasion de ces premi res analyses nous pouvons constater qu une analyse d un jeu de donn es de g n tique des populations requiert de la patience de la m thode ainsi qu une bonne batterie de tests Il tait cependant n cessaire d aller jusqu au bout avant d aller plus loin Nous savons maintenant que ces tiques sont structur es une chelle locale ce qui explique une grande partie des d ficits en h t rozygotes Cet effet Wahlund r sulte probablement d une structure en groupes familiaux L existence d esp ces cryptiques n est en effet pas soutenue par nos analyses NJ TREE ni par l absence totale de d s quilibre de liaison Nous savons galement qu une partie non n gligeable de ces d ficits provient de l existence d all les nuls Loci IR25 IR32 IR39 Pour ces derniers il y a donc un risque de surestimer la diff renciation entre sous chantillons mais seulement pour des niveaux de diff renciation attei gnant au moins 10 Fsr 0 1 en dessous de quoi l effet devient faible CHAPUIS et Estoup
202. ans l analyse Cette mesure est galement utilis e comme statistique dans les tests de randomi sation impl ment s dans Multilocus Par rapport au test bi locus cette proc dure permet l obtention directe d un test global sur l ensemble des loci mais ne peut tre r alis e que sous chantillon par sous chantillon Il peut cependant n tre significatif qu cause d une seule paire de loci Le test bi loci de Fstat bas sur le G permet d obtenir un test sur l ensemble des sous chantillons mais pour chaque paire de loci prise une une Tests statistiques 87 TESTER LA CORRELATION ENTRE DISTANCES Il s agit ici de regarder si la diff renciation g n tique distance g n tique que l on observe entre les sous populations de notre chantillon peut tre due aux distances g ographiques qui les s parent ou d autres distances Ces autres distances peuvent tre cologiques diff rences de temp ratures moyennes de janvier pluviom triques etc ou m me g n tiques si on souhaite comparer les distances g n tiques h tes et parasites par exemple Dans tous les cas on cherche corr ler deux matrices de distances entre elles Comme pour les d s quilibres de liaison les mesures de ces matrices ne sont pas ind pendantes ce qui emp che de proc der des tests classiques de corr lation ou de r gression Nous allons donc effectuer un test de MANTEL 1967 La valeur d un param tre d associa
203. ans le tableau 35 nous obtenons quatre comparai sons qui toutes pr sentent un estimateur de Fs57 lt 0 non significatif Tableau 35 R sultats des mesures et tests de significativit par paire de m thodes d isolement des souches de Trypanosoma brucei gambiense 1 Bonon en 2002 et en 2004 Donn es avec les loci individuels Ann e M thode 1 M thode 2 For P value 2002 KIVI Rodent inoculation 0 0164 0 9547 Blood sample KIVI 0 0088 0 6749 2004 Blood sample Rodent inoculation 0 0181 0 8319 KIVI Rodent inoculation 0 0131 04102 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 253 Les organismes clonaux ont la facheuse habitude de g n rer une corr lation entre les loci d s quilibres de liaison d o la pr sence de g notypes multilocus Cela pourrait conduire un test de diff renciation par effet d auto corr lation 4 pencher trop fort dans une direction ou l autre bien qu ici les r sultats soient peu ambigus Pour valider notre test l utilisation des g notypes multilocus ou MLGs comme autant d all les d un m me et unique locus est une option efficace Nous allons donc r p ter ce que nous venons de faire mais en ne gardant que le locus MLG L analyse du nouveau jeu de donn es ainsi cr T BruceiBetweenlsolationMetFstatMLG dat aboutit aux r sultats pr sent s dans le tableau 36 On voit encore que la diff renciation mest pas significa tive avec des mes
204. ans qu il soit pour autant impossible de tester des diff rences de Fx de H ou de d s quilibres de liaison Ici aussi les loci ou paires de loci peuvent tre utilis s comme r pliquats pour un test de rangs pour donn es appari es voir par exemple N BAvI et al 2006 ANALYSES MULTIVARI ES Les analyses multivari es permettent souvent une repr sentation didactique de lor ganisation g n rale de la variabilit g n tique globale des chantillons g notyp s Dans certains cas ils permettent galement des analyses statistiques et des inf rences Il en existe plusieurs types de m me nature mais offrant des possibilit s diff rentes Analyse factorielle des correspondances AFC Cette analyse introduite par BENZ CRI 1973 a t adapt e aux donn es g n tiques diploides par SHE et al 1987 LAFC place chaque individu dans un hyper espace Tests statistiques 93 K dimensions K tant le nombre total d all les pr sents sur l ensemble des loci et les projette sur les plans d finis par les axes orthogonaux donc ind pendants expli quant le mieux la dispersion des points m me principe que celui d une r gression Une mesure de la pertinence des axes ainsi d finis est repr sent e par le pourcentage d inertie de chaque axe Comme il y a K axes un axe repr sentant 100 K d inertie ne veut rien dire Linertie est donc proportionnelle non seulement la quantit d information que laxe corresp
205. ant la fr quence de 7 dans la popula tion on indique car en dioecie on approche cette valeur pour de grandes populations seulement Dans sa descendance la femelle homozygote produira des h t rozygotes ij si elle re oit du j avec la probabilit 1 p La proportion d h t ro zygotes observ s dans ce type de fratries sera donc en moyenne de Oe s l p La probabilit de fabriquer des 7 dans cette fratrie est gale p ou probabilit que la femelle re oive un spermatozo de i La proportion attendue d h t rozygotes sous 310 Initiation la g n tique des populations naturelles panmixie dans ce type de fratries sera de 2p 1 pju soit si les i7 sont en fr quence p et les ii en fr quence 1 p dans la fratrie alors pj p 1 2 1 p 1 2 p 1 et donc 1 2 1 p 1 p h t rozygotes attendus dans ce type de fra trie On attend donc dans la population l 2 l exp ii Pi Sl pilll pj y 2 Hexpl ii zl pill Pi 1 Si la m re est h t rozygote ij avec la probabilit 2 Pj elle produit de j si elle re oit du 7 ou du j avec la probabilit p et p respectivement et d autres h t rozygotes si elle re oit d autres all les avec la probabilit 1 p p voir le tableau M re P re ip ii 1 2p ij 1 2p ID ij 1 2p i2p autre 1 p p autre h t rozygote a 1 p p autre h t rozygote Ya 1 p p En tout nous obtenons dans ce ty
206. antel n est pas significatif au seuil 5 Mais une tude plus approfondie contredit cela et dans ce cas la moins mauvaise solution est de d cider qu il y a en effet isolement par la distance Vous pourrez v rifier par vous m me qu en s parant les infra populations BoophilusaAdultsDataCatt leFarm B124 CO74 D124 D109 A129 CO354 Pop Boul Boul Boul Boul Eoul Boul Boul Boul Boul Boul Boul Boul Boul Eoul Boul Eoul Boul Boul Boul Boul Boul Boul Eoul Boul Eoul Boul Boul Pop Bour Bour Bour Bour Bour Rei s Figure 77 192194 200200 192194 192198 192194 198200 194198 194198 1941908 194198 194190 198200 194198 194198 192190 194198 198198 194198 194198 194194 194198 194194 194198 194190 194198 194196 154200 198198 194198 194200 194194 192196 10410A 145192 179179 179192 145192 179179 145179 179179 145192 145145 179179 145179 145192 179192 145176 145192 179179 145145 150192 145150 145145 179192 145192 145192 000000 145179 150150 179179 179179 179192 150179 145179 000000 14C14 092112 106112 092112 092112 092100 112116 108112 092100 092102 112112 106112 O92092 092116 092112 092100 1068112 092103 104112 1
207. arables sur plusieurs ann es et je cherche combiner les P values obtenues lorsque j ai test la significati vit du F y dans chacun de ces jeux de donn es d ann es diff rentes je compare la diff renciation entre deux cat gories d individus m les versus femelles parasites d h tes d esp ces diff rentes ou de sexes diff rents etc dans plusieurs sites je souhaite combiner l information de tous les sites Dans tous les cas je peux chercher savoir si un signal global existe ou je peux d si rer identifier quels tests sont significatifs Tester si un signal global existe On peut alors combiner les amp tests de quatre fa ons diff rentes le test binomial et sa version g n ralis e TERIOKHIN et al 2007 DE MEE S et al 2009 la proc dure de Fisher FISHER 1970 le test SGM GouDET 1999 et la transformation Z de Stouffer WHITLOCK 2005 On peut proc der un test binomial pour un nombre d essais correspondant au nombre de tests et un attendu correspondant au seuil a Pour a 0 05 la structure du test est la suivante H la proportion de tests significatifs observ s n est pas diff rente de 0 05 H la proportion observ e de tests significatifs est sup rieure l attendu 0 05 test unilat ral La plupart des logiciels de statistiques font le test binomial et son application est assez simple La loi binomiale concerne les cas o on ne peut avoir que deux possibi
208. ari Ixodidae populations from New Caledonia Island Vet Parasitol 147 276 288 CHIPPINDALE A K Rice W R 2001 Y chro mosome polymorphism is a strong determinant of male fitness in Drosophila melanogaster Proc Natl Acad Sci USA 98 5677 5682 CHLYEH G HENRY P Y SOUROUILLE P DeLay B KHALLAAYOUNE K Jarne P 2002 Population genetics and dynamics at short spatial scale in Bullinus truncatus the intermediate host of Schistosoma haematobium in Morocco Parasitology 125 349 357 CocKERHAM C C 1969 Variance of gene fre quencies Evolution 23 72 84 CocKERHAM C C 1973 Analysis of gene fre quencies Genetics 74 679 700 Coomss J A LETCHER B H Nistow K H 2008 CREATE a software to create input files from diploid genotypic data for 52 genetic software programs Mol Ecol Resour 8 578 580 CORANDER J WALDMANN P SILLANP M J 2003 Bayesian analysis of genetic differentiation between populations Genetics 163 367 374 CORANDER J WALDMANN P MARTTINEN P SILLANP M J 2004 BAPS 2 enhanced pos sibilities for the analysis of genetic population structure Bioinformatics 20 2363 2369 Cor ey L S BLANKENSHIP J R Moore A J 2001 Genetic variation and asexual reproduction in the facultatively parthenogenetic cockroach Nauphoeta cinerea implications for the evolution of sex J Evol Biol 14 68 74 CorNUET J M Lur
209. artenant ou non la m me esp ce MAYNARD SMITH et al 1993 MacLeo ef al 2000 Par ailleurs la plupart des investigateurs consi d rent les d s quilibres de liaison comme des outils privil gi s de mesure de la clo nalit alors qu il a t montr que ces d s quilibres de liaison sont tr s difficiles estimer et d pendent fortement de la structure des populations cibles DE MEEts et BALLOUX 2004 PRUGNOLLE et DE MEEts 2010 Or les organismes tels que les trypanosomes ont de fortes chances de montrer des structures de populations assez cloisonn es Pour les esp ces diplo des comme c est le cas des trypanosomes le param tre Fy de Wright WRIGHT 1965 qui mesure comme on l a vu l homozygo tie des individus relative l homog n it g n tique de la sous population dont ils sont issus repr sente un outil beaucoup plus performant DE MEE S et BALLOUX 2005 DE Meets et al 2006 Un autre probl me sp cifique Tbgl concerne la m thode d isolement des souches Il a en effet t montr que les profils enzymatiques de souches provenant du m me patient mais isol es par diff rentes m thodes taient diff rents De 1a l id e que ces m thodes s lectionnaient des souches de parasites particuli res JAMONNEAU et al 2003 ce qui est g nant si on ne peut pas tre certain d avoir des chantillons repr sentatifs de la diversit pr sente Ces m thodes d isolement sont au nombre de trois
210. artley La m thode des d s quilibres de liaison de Bartley est impl ment e par NeEstimator comme pour les tiques un fichier par groupe de pi ge ici voir p 160 164 dans la seconde partie de ce manuel Enfin Results D thierry BouquinGenetPop TP DataTsetseMouhoun NeEstim TsetseMouhounAllMalManqNe arestPooled gen E Estimation of averaged one locus identity probabilities F and identity disequilibria eta_S for each population at loci B11 1 BX104 1 102_1 GpCag_l Pgp24_1 PgpXil 1 and PgpXx13 1 Population F 95 CI eta 5 95 CI 1 0 053877 0 052443 0 161491 0 025227 0 214284 0 159375 10 0 006639 0 138474 0 116104 0 000000 11 0 077247 0 003679 0 164463 0 033986 0 040756 0 119195 Figure 60 Cadre de premi re sortie et de cr ation du fichier de sauvegarde de l analyse par ESTIM Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 207 la m thode de Balloux est tr s simple puisqu il suffit de calculer les F par groupe de pi ges avec Fstat par exemple et d utiliser la formule N 1 2F 7s Fys 1 Frs et de ne garder que les valeurs de N positives Tous les r sultats sont compil s dans le tableau 27 Nous avons maintenant besoin de transformer ces effectifs en densit s Densit s efficaces Nous allons utiliser une autre m thode que celle de Bouyer et al 2009 pour changer Nous allons simplement pour chaque m thode pr
211. as changer beaucoup l estimation du Nm Or dans ce cas nous observons une variation entre 0 2 et 2 individus chan g s par g n ration Si nous prenons un maximum de 10 g n rations de trypano somes par ann e comme discut ailleurs nous obtenons un maximum d individus chang s de l ordre de 2 20 par an Cela signifie si une radication s quentielle devait tre envisag e id alement coupl e d ailleurs une lutte vec torielle qu il faudrait d abord s occuper des plus gros foyers Dubr ka en 282 Initiation la g n tique des populations naturelles Guin e qui envoient le plus de migrants ailleurs avant de s occuper des plus petits Boffa et ce sans laisser passer trop de temps Structure a l chelle sub sp cifique Il ne nous reste plus maintenant qu tudier comment s organisent les diff rentes souches de cette tude entre elles et comment elles se positionnent par rapport a des souches de r f rence des diff rentes sous esp ces du complexe 7 brucei Nous allons effectuer pour ce faire une analyse NJTree qui est mon avis la plus illustrative Vous connaissez maintenant la proc dure par coeur En prenant le jeu de donn es complet vous le faites passer la moulinette Create pour obtenir un jeu de don n es MSA Avec ce dernier vous obtenez une matrice de distances harmoniques de Cavalli Sforza et Edwards entre individus isolats que vous faites passer dans MEGA pour dessiner l arbre Cet
212. ase H2 si individu est male ou de recopier le g notype de la femelle au locus R08 contenu dans la case C2 On copie ensuite H2 et on le colle de H3 4 H726 normalement 140 Initiation a la g n tique des populations naturelles Tableau 10 Aspect du tableau de donn es brutes modifi es avec l appartenance des individus aux clusters BAPS Ber Bern95F_005 VOSS SONS 0 1252323523512 Ber Sonar Bern95F_ 007 2 2 174174 137146 119119 233250 133133 bei S Je LED AUTRE 2 177183 000000 119119 243243 000000 Ber 195 F Bern95F_013 4 4 173175 136142 119119 250250 142142 Berai CSA NE Bem95F_018 5 2 165178 137146 119119 243248 142142 Ber 95a i Bern95F_020 6 5 165173 145148 119119 241241 129133 Ber 195 F Bern95F_022 7 8 168171 134134 119119 243248 135135 Bers 95 E Bern95F_027 8 7 AS 147 147 ION 19 235233125125 Ber 95 F Bern95F_028 9 6 169175 140145 119119 233233 135142 Ber 195 E Bern95F_029 10 11 166176 128145 119119 243243 125142 Ber ON NE Berns E 092 i 2 17318315414 12 T12 235233 13 1137 Ber OS E Ben ode Way 9 175183 147147 119119 235235 134137 Ber 195 IF Bern95F_ 038 113 a 175183 135147 1231231250250 127127 Ber 195 le Bern95F_039 14 12 183183 134134 119119 233243 121128 Ber 25 E Bern95F_040 15 6 168174 141147 119119 233233 135142 Be Som Bern95F_042 16 2 174178 146146 119119 000000 112129 Ber 195 le Bern95F_043 17 9 175175 000000 123123 233235 127134
213. aturelles Pour des raisons de recherche de puissance et pour limiter le nombre de tests dont la multiplication est toujours probl matique voir p 82 en premi re partie on ne fera les tests qu avec les valeurs totales pour chaque locus Pour le locus IR08 cela correspond aux valeurs de la derni re ligne du tableau 8 Pour ce locus la commande devient donc binom test 4 186 0 0253 alternative less Faites bien attention de respecter strictement le format en particulier les majuscules et minuscules sont reconnues comme des caract res diff rents sous R Ici less signifie que le test est unilat ral dans le sens des plus petites valeurs H1 il y a moins de blancs observ s qu attendus l instruction devient two sided pour un bilat ral et greater pour l autre test unilat ral Une fois que vous avez tap cette instruction dans R tapez sur la touche Entr e et le test se fait La P value du test est pour IR08 non significative P value 0 4919 Les all les nuls sont donc bien suffisants pour expliquer les d ficits en h t rozygotes observ s ce locus chez les femelles d autant plus qu il semble aussi exister des ph nom nes de stuttering ce locus Pour les autres loci on proc de de la m me fa on On trouve ainsi que pour les loci IR 25 IR27 et IR32 la fr quence des blancs observ s est significativement inf rieure celle des blancs attendus si les all les nuls devaient expliquer l
214. au moins une femelle et un m le Le test global est obtenu par une proc dure binomiale g n ralis e et les tests sans IRO8 ont t effectu s de fa on unilat rale les m les dispersent moins Utiliser le fichier d aide de MultiTest V 1 2 pour une description pas pas de la proc dure suivre pour combiner les neufs tests Bern 0 3250 0 2431 Monte Ceneri 0 0817 02827 Dorenaz 0 3199 0 3355 Eclepens 0 1306 0 2700 Gorges du Trient 0 0159 0 6392 Montmollin 0 2422 0 9079 Neuchatel 0 0636 0 4665 Staadswald 0 0426 0 1809 Tunisie 01272 0 0795 Tous Binomial 0 0041 0 2251 Il y a donc manifestement un effet cluster que nous essayerons d interpr ter plus loin Afin de v rifier quand m me si notre biais de dispersion sp cifique femelle existe toujours m me en tenant compte de l effet Wahlund pr sent au sein de chaque site la solution qui nous reste consiste ne garder qu un seul repr sentant ou une femelle et un m le par cluster dans chaque site nord ouest de la Suisse 1996 On prendra le premier des indi vidus ayant le g notype le plus complet de chaque cluster afin de conserver le plus de puissance possible Par exemple si dans un cluster d un site quelconque il ny a que des m les on ne prend qu un individu si possible g notyp aux cing loci M me chose pour des clusters de femelles Pour les clusters mixtes on prend la premi re femelle la plus La tique xodes ricinus et les pathog nes Borrelia sp
215. au seuil a 0 05 1 12 706 2 080 2 014 2 4 303 22 2 074 50 2 009 3 3 182 25 2 069 gt 2 004 4 DATS 24 2 064 60 2 000 5 271 25 2 060 65 11997 6 2 447 26 2 056 70 1 994 7 2205 27 2 052 80 15290 8 2 506 28 2 048 90 12957 9 2202 23 2 045 100 1 984 10 2 228 30 2 042 110 15982 11 2 201 oul 2 040 120 1 980 12 2179 32 2 037 130 1 978 13 2 160 33 2025 140 12977 14 2 145 34 2 052 150 12976 15 DAS 5 2 050 200 1972 16 2 120 36 2 028 250 1370 127 2 110 S 2 026 300 1 968 18 2101 38 2 024 400 1 966 13 2099 239 2 025 500 965 20 2 086 40 2 021 1000 T962 Les permutations Il sagit ici de simuler l hypoth se nulle un grand nombre de fois avec les donn es Le pro gramme informatique va utiliser les donn es c est dire les alleles ou les individus des diff rents sous chantillons pour simuler Ho mesurer la valeur obtenue sous Ho recom e gt e e e e mencer un tr s grand nombre de fois afin d obtenir une distribution des valeurs possibles sous Hp La P value du test correspond donc simplement la proportion des cas o une valeur aussi grande ou plus grande unilat ral 1 aussi petite ou plus petite unilat ral 2 aussi extr me bilat ral que la valeur observ e a t obtenue dans cette distribution 74 Initiation la g n tique des populations naturelles Il existe deux grands types de randomisations les permutations et les cha nes de Markhov Les deux sont bas es sur le principe de Monte Carlo Le nom provient d
216. berg overall samples Save Tables T HW tests per locus and sample Nominal level for mulane tests 1 C 5100 C 4 700 141000 Figure 48 Exemple des cases a cocher pour une analyse de diff renciation par paire d chantillons exemple des tiques infect es ou non par Bbss 180 Initiation a la g n tique des populations naturelles Il suffit ensuite de convertir ce fichier au format Fstat en passant par Genetix par exemple et de proc der sous Fstat au calcul des Fs57 par paire de sous chantillons et au test de diff renciation par paire comme indiqu dans la figure 48 Vous consta tez que j ai coch la case 1 1000 pour le nominal level afin d obtenir au moins 10 000 permutations et donc dobtenir des P values assez pr cises Le fichier de donn es s appelle ForPairedBbss dat et les fichiers de sortie qui nous int ressent sont ForPairedBbss fst pour r cup rer les valeurs de F7 par paire qui nous int ressent et ForPairedBbss pp pvl o nous allons r cup rer les P values correspon dantes Attention dans ces fichiers seules les comparaisons entre tiques infect es et non infect es du m me sexe de la m me ann e et du m me site nous int ressent Le r sultat pour Bbss est pr sent dans le tableau 20 Tableau 20 Compilation des r sultats obtenus lors de l analyse de la diff renciation entre paires de sous chantillons infect s et non infect par Bbss La combinatoire est obtenu
217. bres observ s d all les chantillon 1 2Np 2N g 2N p ch q 2N Echantillon 2 2N p 2N 93 2N ar qa 2N Somme 2N p 2N p 2Ng F 2N 93 2 N F N gt 2N Si on consid re que les individus des deux chantillons proviennent d une seule et m me population pas de diff rence r elle de leurs fr quences all liques alors la meilleure estimation de la fr quence des all les dans la population correspond la moyenne des fr quences des deux chantillons Par cons quent les effectifs attendus des all les deviennent Effectifs attendus des all les chantillon 1 UN N P2 DN 2 p t 21V p 2N 2N 2N 2N Echantillon 2 DRE RE te Nl aay 2N 2N Somme 2N p 2N p 2Ng F 2N 93 2 N F N gt 2N Soit Pyo la probabilit multinomiale d observer les effectifs du premier tableau si les fr quences all liques de chaque chantillon sont correctes et Pr la probabilit mul tinomiale d observer ces effectifs si ce sont les effectifs attendus qui sont corrects 304 Initiation la g n tique des populations naturelles r IN 2Np 2N 4q 2Ng 2N p P IN g 2 N43 O IN plINgl2N p 2N q 2N 2N 2N 2N 2M Pue 2Np 2Naq 2N p 2N q 2Np 2N4 2N 2N p 2N p 2N 2Niq 2N q 2N 2N 2N p 2 Naq 2M pit 2N pol Ny 2N q 2N 9 N 2N 2N Le ratio du logarithme n p rien de la vraisemblance ou G correspond deux fois le logarithme n p rien du ratio de vraisemblance soit G
218. c ayes E EA EEE E E O E 254 D s quilibres de liaison homozygotie relative locale et syst me de reproduction 256 Cr ation du fichier PSU sowisintesitinsscnivtdannata ualinysinnuniina sie sadannavarbcdnbiieVusldonsiaietunansiadvaliontiniwantawaiensd 256 Analyse des d s quilibres de liaison et des F5 256 D s quilibres de liaison iii 256 Exc s d h t rozygotes lOCaUXaruisiisssnius sinrin Ni eer eis ekarran ie aseran raV tae iraa aaraa taie 256 Diff renciation g n tique et structure des populations 259 Calculs d effectifs efficaces ler sente state tenant etats tante nas 261 Construction des fichiers pour NeEstimator et pour MLNe 00 cceccccceeccceeeeeceeeeceeeeeeeceeueeeeeeeeeeesaneeenas 261 Analyses avec NeEStiMAatOr en nnestinscrdtaieds ouakweondwanmaiaiiedsbedsnesesuaneaeevesehbeernpdeaxuncdiencblnerebes 262 Analyses ave MLN E aaa eee eee een een mn ee ee EEKE pea en meee ener aN 267 Estimation de la taille clonale des foyers par mod lisation 268 Ce es Fae bacnaeeseeeeeees 268 Nombre infini de sous populationS sic iceasicnmcdeientuiion ues basgnonnsaboeuncdneamimarndtiecoategunsetusancaieadatindiediateriresies 272 Deux SOUS 816 0 1 11 2 6 iniciswstninss bixenondemrtdedeinctbidahnuienshxakeinccbimeneadenbaakoiad YoimebradantivancineTeimelriasbiaanelanies 275 Une sous population 1SOIEG icccianccccsinicariusicaronaensiaccandantaseaeisnesdsecoanctbasernd iexenersedunneneumeieeaieniiedatnseerncouas 279 Structure l c
219. c ici une moindre valeur s lective des all les nuls moins qu un m canisme permette de les garder l tat h t rozygote le plus fr quemment possible comme cela peut tre le cas chez les organismes clonaux NEBavI et al 2006 C est un probl me rencontr typiquement chez les marqueurs microsatellites PAETKAU et STROBECK 1995 PEMBERTON et al 1995 BROOKFIELD 1996 Une mutation dans la s quence flanquante au niveau des s quences correspondant un des primers emp che la bonne amplification de cet all le Il appara tra blanc aucun signal l tat homozygote et sera domin par les all les avec lesquels il sera h t rozygote Les h t rozygotes pour ce type d all les apparaissent donc homozygotes pour l autre allele D tecter la pr sence d alleles nuls Nous savons maintenant que la pr sence d all les nuls un locus va provoquer des d ficits en h t rozygotes inexplicables biologiquement Normalement dans ce cas on s attend ce que les diff rents loci donnent une mesure diff rente variance Tests statistiques 105 entre loci DE Meets et al 2002a Hurrrez Boussts et al 2004 Par ailleurs sil y a structuration entre sous chantillons la fr quence de ces all les nuls aux loci concern s devrait changer d un sous chantillon l autre et provoquer une variance des d ficits F7s entre sous chantillons mais seulement pour des niveaux de diff renciation g n ti
220. cativement diff rent de l attendu 12 H la pi ce n est pas bien quilibr e j obtiens moins de faces qu attendu Test bilat ral H la pi ce est bien quilibr e ce que j ai observ mest pas significativement diff rent de l attendu 12 H la pi ce n est pas bien quilibr e et j obtiens un r sultat significativement diff rent de l attendu Pour le test unilat ral 1 la probabilit d obtenir par hasard autant ou plus de faces est gale P Somme des probabilit s d obtenir autant ou plus que deux faces Somme des probabilit s totales obtenues 12 1 Donc la P value du test est P 0 25 Pour le test unilat ral 2 la probabilit d obtenir par hasard plus ou autant de piles est gale P Probabilit de z ro pile Probabilit de un pile et une face Probabilit de deux piles Somme totale 1 2 1 2 1 2 1 Donc P zeak Pour le test bilat ral P probabilit d avoir deux faces ou deux piles 1 2 1 2 7 1 0 5 Plusieurs choses peuvent ici tre signal es Tout d abord la plus basse des probabili t s obtenues est 0 25 Ce qui illustre la faible puissance du test due la faiblesse de P chantillon Il est difficile de prouver quelque chose avec de trop petits chan tillons Ensuite on voit bien qu on est beaucoup plus puissant en unilat ral si on teste dans la bonne direction et beaucoup moins quand on teste dans l
221. cause he just had to go to Monte Carlo The name seems to have endured Tests statistiques 75 TESTER LA PANMIXIE LOCALE Tester le Fis La panmixie locale peut se tester en prenant les all les pr sents dans chaque sous chantillon et en les r associant au hasard l int rieur de ces sous populations et ce dans toutes les sous populations On mesure alors le Fy global moyenne sur Pen semble des sous chantillons et des loci estimation par fde WEIR et COCKERHAM 1984 Ce processus est r p t un tr s grand nombre de fois ce qui permet d obtenir la distribution des Fy g n r s sous l hypoth se de panmixie locale Ho Trois tests sont ensuite possibles en toute rigueur il faut choisir lequel avant Tester s il existe un d ficit en h t rozygotes Il s agit donc d un test unilat ral avec le Fs de la population chantillonn e est plus grand que 0 On teste bien ici si les sous populations chantillonn es sont pan mictiques Ho et n utilisent pas un mode ferm de reproduction du type autof condation ou croisements entre apparent s qui doit donner une homozygotie sup rieure celle attendue sous panmixie tous les loci La proportion de fois que lon obtient au cours de la randomisation une valeur aussi grande ou plus grande que celle observ e nous donne la P value du test Si le test est significatif on peut ensuite essayer d estimer le taux d autof condation ou de croisements
222. certains cas l chantillonnage ne permet pas de tester une diff rence entre sexes ou entre cat gories d individus par randomisation notamment pour tester une diff rence de F7 Dans ce cas une alternative moins puissante existe et permet de comparer H Frs ou le d s quilibre de liaison entre cat gories d individus dans un seul chantillon Il suffit d utiliser les loci ou les paires de loci pour les d s quilibres de liaison comme des r pliquats plus ou moins ind pendants d ailleurs et de faire un test de comparaison pour donn es appari es le crit re d appariement correspon dant donc au locus ou la paire de loci Comme la distribution de telles donn es a toutes les chances de ne pas suivre une loi normale il est conseill ici de proc der un test de rang de Wilcoxon pour donn es appari es Wilcoxon signed ranks test for paired data SIEGEL et CASTELLAN 1 988 TESTER LA DIFFERENCE ENTRE GROUPES Ce cas de figure se pr sente lorsque diff rents types de sites doivent tre compar s C est typiquement le cas si on souhaite comparer diff rents param tres g n tiques 92 Initiation la g n tique des populations naturelles tels que Fis Fsr ou d autres entre infra populations trouv es dans des h tes m les et celles trouv es dans des h tes femelles Ce peut tre aussi le cas entre des sites de diff rentes natures tels que des pr s et des bois dans un paysage de bocages par exemple Hp
223. d sans vous poser plus de questions Possible Errors Possible errors have been found in the data These are detailed in the panel on the left of the screen Alleles with a value of zero will not be included in the analysis Go back to the DataGrid and correct the values Correct Omit the suspect data from analysis Proceed with analysis and include the suspect data Figure 22 Cadre d invite de commande de MicroChecker pour d finir la nature des donn es manquantes et s il faut en tenir compte dans le calcul des fr quences des all les nuls 126 Initiation la g n tique des populations naturelles Micro Checker effectue plusieurs calculs et vous pr sente des r sultats concernant le premier locus Allez dans le menu Tools 4 Nulls across loci comme dans la figure 23 pour obtenir le tableau des fr quences de nuls dans le premier sous chan tillon estim es selon diff rentes m thodes S lectionnez ce tableau avec la souris copiez le et sauvez le dans un fichier Excel par exemple Ensuite regardez dans l encadr en bas droite fig 23 si le locus correspondant montre un probl me de stuttering ou une dominance d all le court large allele dropout Si oui notez le dans le tableau que vous venez de cr er pour sauvegarder les r sultats de cette analyse puis par le menu Window constaterez qu aucun locus ne pr sente de stuttering ni de dominance d all le fig
224. d ADN reste la m me m me localisation dans le g nome la m me place sur le m me chromosome d un individu l autre d o le terme locus Un locus peut correspondre un g ne codant pour une fonction quelconque comme c est le cas pour les loci enzymatiques ou iso enzymatiques mais il peut aussi correspondre une zone non codante et donc priori non fonc tionnelle de l ADN comme c est le cas de la plupart des microsatellites Enfin il est important de se souvenir qu un locus m me non codant peut se trouver dans un intron c est dire dans un g ne et peut donc subir des ph nom nes s lectifs par sa liaison physique avec les parties traduites du g ne On appelle ce ph nom ne l auto stop ou hitchhiking en anglais Cela reste valable pour un locus situ en dehors de tout g ne mais proximit d un locus s lectionn ou simplement parce que le r gime de reproduction de l organisme tudi limite ou emp che la recombinaison entre loci Dans ce qui suit je vais consid rer que l organisme tudi est diplo de comme un moustique ou une tique c est dire que chaque portion d ADN chaque locus dispose de deux repr sentants par individu Plusieurs loci peuvent tre consid r s Nous verrons m me qu il est pr f rable d analyser les populations naturelles au travers de plusieurs loci de nature identique microsatellites ou iso enzymes Il n y a pas de limite sup rieure au nombre de loci qu
225. d their uses Annu Rev Entomol 41 325 352 Ropiti 1 FURGER A Ruepp S ScHurcH N BUTIKOFER P 1998 Unravelling the procyclin coat of Trypanosoma brucei Mol Biochem Parasitol 91 117 130 Rostand E 1908 Chantecler Paris r dit en 2000 par L Harmattan ROUGERON V DE Meets T Hipe M WALECKX E BERMUDEZ H AREVALO A LLANOS CUENTAS A DujaRDIN J C DE DONCKER S LE Ray D Avara E J BANuLs A L 2009 Extreme inbreeding in Leishmania braziliensis Proc Natl Acad Sci USA 106 10224 10229 Rousset F 1996 Equilibrium values of measure of population subdivision for stepwise mutation processes Genetics 142 1357 1362 Rousset E 1997 Genetic differentiation and estimation of gene flow from F statistics under isolation by distance Genetics 145 1219 1228 Rousset E 2000 Genetic differentiation between individuals J Evol Biol 13 58 62 Rousset E 2004 Genetic Structure and Selection in Subdivided Populations Princeton Princeton University Press Bibliographie 297 Rousset FE 2008 GENEPOP 007 a complete re implementation of the GENEPOP software for Windows and Linux Molecular Ecology Resources 8 103 106 Rousset FE Raymonp M 1995 Testing hete rozygote excess and deficiency Genetics 140 1413 1419 Rousset FE Raymonp M 1997 Statistical analyses of population genetic data New tools old concepts Trends Eco
226. dAjouas s p saniq saguUOp op nof np HENXA CT nuoIqL mns 7 nes qer Raw Data Specifications q Number of Loci lt 7 gt aos vo Pop Row Containing Column Headings lt 1 gt inenet cs Row Data Begins On lt 2 gt Population Identifier Column lt 1 gt Individual Identifier Column lt 6 gt Column Containing Cohort Birth lt 3 gt Column Containing Death 4 gt 3 Column Containing Sex lt 5 gt F Column Containing Known Parent 1 6 gt F Column Containing Known Parent 2 7 gt Toeise Jer re c Tsetse JerCoordGeo Trap Sex TolDatalhalHom F Column Containing Spatial Data 1 2 F Column Containing Spatial Data 2 lt f3 gt F Column Containing First Allele lt 7 gt a Columns After Allelic Data t 0 gt M Missing Data Symbol o Text File Delimiter Excel Files xis gt Cancel Proceed Figure 53 Fiche Menu pour Create pour convertir le fichier de donn es brutes de mouches ts ts de la Mouhoun au format d sir a 4 Output Selections Sibship Programs Parentage Programs Genetic Programs Genetic Programs r COLONY M CERVUS r ARLEQUIN l BAPS4 M 6ENECLASS2 l KINGROUP l FAMOZ F FSTAT M BATWING l WHICHRUN PARENTAGE l FAMSPHERE l 6DA l BAYESASS F CONE l PEDIGREE l 6ERUD2 GENEPOP l IM IMa M MLNE PRT l GIMLET l GENETIX l IMMANC l NEESTIMATOR r NEWPAT l MICROSAT F LAMARC M SALMONNB l PAPA MSA l MIGRATE l TM3
227. dans ce cas r chantillonner plusieurs fois le m me sous chantillon Mesurer la diff renciation entre ces chantillonnages strictement identiques n a aucun sens 72 Initiation la g n tique des populations naturelles de 95 Cette valeur du peut tre retrouv e partir d une table tabl 3 ou d un programme informatique Pour 7 tr s grand et a 0 05 on a classiquement 1 96 Sous Excel la commande est LOILSTUDENT INVERSE A1 A2 1 o Al correspond la case de coordon n es de la colonne A 1 ligne o vous avez tap la valeur pour a et A2 est la case o vous avez tap la valeur du nombre de r plicas d o on retranche 1 pour avoir le degr de libert Jackknife sur populations M me chose que pour les loci mais avec les sous chantillons Notons que le Fs peut se pr ter cette proc dure ici puisqu on a toujours 7 1 sous chantillons sur lesquels calculer un F57 ce qui n est pas garanti par le bootstrap le m me sous chantillon peut tre chantillonn z fois par la proc dure Applications num riques pour le jackknife Supposons un jeu de donn es sur huit chantillons avec cing loci Sur l ensemble des loci Fs7 0 004 et pour le Locus 1 Fs7 0 002 Le jackknife sur loci cing valeurs donne une erreur standard de StdErrLoci F57 0 003 Le jackknife sur populations huit valeurs donne une erreur standard de StdErrPop Fs57 0 001 pour le Locus 1 Alors les intervalles
228. de donn es ordinales continues en forme de cloche voir aussi Poissonienne et Logistique G ne Une portion d ADN qui code pour une fonction c est dire transcrite en ARN de transfert et ensuite en ARN messager ou mRNA CARN messager devant lui m me tre traduit en mol cule active tel un enzyme G notype Donne la composition all lique compl te d un individu un locus donn ou une s rie de loci sp cifiques quand pr cis 316 Initiation la g n tique des populations naturelles G om trique Voir Moyenne Germinal Qui provient de la lign e du m me nom cellules souches des cellules sexuelles ou gam tes Gonochorique Terme un peu d suet aujourd hui synonyme de dio que antonymique d hermaph rodite Goulot d tranglement voir Bottleneck Haploide Caract rise un organisme ou une cellule avec un mat riel g n tique chromosomes pr sent en un seul exemplaire Les cellules sexuelles gam tes sont typiquement haploides Harmonique Voir Moyenne Hermaphrodite Se dit d une esp ce reproduction sexu e o chaque individu peut assurer les deux fonctions femelle et male antonymique de gonochorique H t rogamie Processus de reproduction sexu e au cours duquel les individus ou leurs gam tes sont d autant plus attir s l un par l autre pour la reproduction qu ils diff rent g n tiquement antonymique de l homogamie H t rosis Ph nom ne s lectif co
229. de g notypes possibles entre les deux loci tudi s Dans le doute il faut donc bien veiller v rifier que deux proc dures de randomisations faites ind pendamment sur les m mes don n es donnent le m me r sultat Ceci est particuli rement important pour la proc dure cha ne de Markhov utilis e dans Genepop o le nombre d it rations devra atteindre au moins 10 voire 10 Correction du seuil Comme nous l avons vu les tests par paire de loci g n rent un grand nombre de tests autant que de paires de loci Pour sept loci par exemple on a 21 paires de loci Tests statistiques 81 possibles Cette r p tition de tests va poser un probl me statistique important que nous traiterons dans la section suivante Ces tests sont par ailleurs non ind pendants puisque chaque locus est compar 4 chacun des autres loci restants ce qui signifie que l information contenue dans chaque locus est utilis e de fa on redondante ce qui pose un probl me suppl mentaire Dans le paragraphe qui suit nous verrons comment corriger le seuil de d cision statistique afin de prendre en compte ces dif ficult s Remarques sur les tests de d s quilibres de liaison et leur interpr tation Comme nous l avons d j vu certaines des proc dures que nous utilisons en g n tique des populations empiriques requi rent l utilisation d un nombre important de loci au moins cinq qui devraient tre ind pendants statistiquement C est
230. dehors du motif microsatellite dans les s quences flanquantes Ce n est pas dramatique m me si non id al Suivent les estimateurs de Nei en particulier ceux des diversit s g niques intra sous chantillons 47 et globale H7 Ensuite les r sultats des tests de d s quilibre de liaison sont donn s par paire de loci et par sous chantillon et sur len semble des sous chantillons mais toujours par paire de loci La mention Adjusted P value for 5 nominal level is 0 000208 ne doit pas vous inqui ter C est le calcul du seuil de Bonferroni sur l ensemble des tests r alis s Comme il y a 24 sous chan tillons cing loci et donc 5 5 1 2 paires de loci cela correspond a 240 tests Le seuil corrig par la proc dure de Bonferroni 4 a 0 05 est donc a 0 05 240 0 000208 seuil rarement jamais accessible ce qui illustre une discussion que nous avons d j eue pr c demment De toutes mani res nous ne regarderons ici que les tests multi sous chantillons colonne All et donc au pire le seuil est diviser par 10 ce qui est inutile puisque nous pouvons aussi constater qu aucun d s quilibre de liaison n est significatif Les loci sont donc raisonnablement ind pendants statis tiquement les uns des autres Nous pouvons donc sereinement oublier ces derniers et passer la suite Suivent les estimateurs de Weir et Cockerham dont un seul nous int resse pour le moment f l estimateur du F5 par l
231. des populations naturelles Bias dispersal tests File Help Data file being processed is BbaBiasMales96 c One sided test Letter for the most philopatric group EZ a Letter forthe other group u Two sided test ih Number of permutations 10000 IV Mean assignment Hest GO M Variance of Assignment V Relatedness V Ho M Hs Figure 50 Cases cocher pour Panalyse du biais de dispersion pathog ne sp cifique Le test demand est bilat ral car nous n avons en principe pas d priori Toutes les cases sont coch es m me les cases Fis et Ho inutiles cause du codage de IRO8 car on souhaite obtenir le r sultat pour A Il y a donc bien un biais de structuration d l infection par Bba Plusieurs hypo th ses peuvent expliquer ce r sultat La premi re hypoth se implique que certaines tiques plus sensibles l infection par Bba sont aussi pl iotropiquement moins mobiles Les marqueurs utilis s tant des microsatellites non codants cela implique rait un d terminisme g nomique peu vraisemblable Par ailleurs l absence totale de diff renciation entre tiques infect es et non infect es montr e en p 179 182 discr dite cette interpr tation La deuxi me hypoth se implique l existence dau moins deux esp ces cryptiques dont l une moins mobile que la seconde serait plus sensible l infection par Bba Notons que nous n avons not aucun d s quilibre de liaison attendu
232. distance en km Figure 35 Repr sentation de l isolement par la distance entre sites suisses pour les tiques r colt es en 1996 La distance minimale de 2 km a t choisie tre cette distance minimale et tapez la Le nombre de randomisations vous est ensuite demand Tapez 1 000 000 pour tre s r d obtenir une P value suffisamment pr cise Genepop vous demande comme pour tous ses tests passant par randomisa tion quatre nombres qui serviront de graines pour g n rer des nombres pseudo al atoires qui conditionnent le d part des randomisations Tapez ce que vous voulez entre 1 et 168 comme indiqu avec un retour charriot apr s chaque chiffre Quand les randomisations sont termin es Genepop le signale avec un bip assez d sagr able mais qui ne doit pas vous effrayer en g n ral je coupe le son avant D apr s une coll gue avis e TG il n y a pas de son sur la version Web du programme qui par ailleurs est sensiblement plus conviviale Genepop a alors cr deux fichiers l un porte l extension ISO qui vous donne le r sultat du test avec les param tres de la r gression et la P value Le second porte l extension GRA et donne les coordonn es en colonne de cette r gression afin de pouvoir dessiner le graphique correspondant comme repr sent dans la figure 35 On y remarque que la relation n est pas signi ficative Il semble cependant qu une tendance existe Peut tre l existence d une sous structure nu
233. duit ADN amplifi alors que les individus pr sentant une s quence compl mentaire h t rozygotes ou deux homozygotes pour le compl ment pr senteront le m me produit amplifi et donc le m me ph notype Il r sulte de ceci que seules des fr quences ph notypiques peuvent tre estim es avec ce type de mar queurs alors que les fr quences all liques demeurent inconnues moins de faire des hypoth ses tr s fortes sur la structure des populations Par ailleurs la structure g notypique restant elle m me par d finition cach e ainsi en va t il des inf rences possibles sur le syst me de reproduction que doit refl ter la distribution des all les dans et entre les individus des m mes unit s de reproduction sous chantillons Qui plus est et comme d j mentionn il est toujours pr f rable d tudier plusieurs loci de m me nature Il est impossible de savoir quoi correspondent les diff rentes portions d ADN amplifi es par RAPD de par leur nature al atoire On ne peut donc savoir si ces loci sont dans des g nes ou non quels sont leur taux de mutation etc C est pour ces diff rentes raisons que les marqueurs dominants en g n ral et les RAPD en particulier ne seront pas trait s davantage dans ce manuel car ils sont tr s loin d tre id aux pour les analyses de g n tique des populations naturelles MARQUEURS NUCL AIRES ___CODOMINANTS Les marqueurs codominants offrent th oriquement l acc
234. dure malgr son int r t vident n a notre connaissance t utilis e qu deux reprises chez le tr matode Schistosoma mansoni chez les rats de Guadeloupe PRUGNOLLE et al 2004b et chez la tique du b tail Rhipicephalus Boophilus microplus en Nouvelle Cal donie CHEVILLON et al 2007a Dans le premier cas l apparentement entre les paires d individus a t effec tu l aide du logiciel Kinship V 1 2 module Relatedness d velopp par K E Goodnight http gsoft smu edu GSoft html qui calcule un estimateur d apparentement non biais quivalent de celui d crit dans QUELLER et GOODNIGHT 1989 Pour les tiques c est l estimateur de WanG 2002 qui a t pr f r car particuli rement robuste aux petits chantillons Ce dernier fut calcul par le logi ciel MER V3 http www zoo cam ac uk ioz software htm MER Nous reverrons ce dernier exemple dans la seconde partie de ce manuel Dans tous les cas l information apport e par ce test peut s av rer pr cieuse pour discuter des hypoth ses possibles en vue d expliquer une d viation du Frs par rapport aux attendus sous panmixie TESTER LA STRUCTURATION Tester le Fsr Il s agit de simuler la migration libre des individus entre sous chantillons AH en redistribuant au hasard les individus dans ces diff rents sous chantillons On mesure alors le F7 obtenu avec 0 sur l ensemble des loci La r p tition de ce 78 Initiation la g n
235. dus h tes porte des m les apparent s surtout les larves Une fois dispers et gorg chaque groupe a une chance tr s in gale de trouver un habitat favorable la mue suivante Il en r sulterait que seuls certains groupes parfois compos s d individus tr s apparent s fr res survivraient dans une zone loign e de leur site d closion alors que beaucoup de groupes m les seraient limin s Si les larves et nymphes femelles pr f rent quant elles les h tes peu disper sants petits rongeurs il est probable que la survie de ces femelles soit distribu e plus al atoirement entre femelles de pontes diff rentes Ceci pourrait au final expliquer notre effet Wahlund produit en majorit par les tiques m les Diff renciation globale et isolement par la distance Plusieurs l ments nous incitent ici manquer d optimisme Il y a en effet de nom breux all les nuls un effet Wahlund local de la dominance d all les courts un locus sans parler d autres probl mes mis en vidence lors d tudes de pedigrees DE MEE S et al 2004a Si on ajoute cela que manifestement un biais de dispersion sp cifique chaque sexe existe supposant qu un des deux sexes migre beaucoup voir GOUDET et al 2002 et donc qu une faible structuration en r sulte n cessairement la probabi lit de trouver une structuration g n tique devient faible et c est un euph misme Nous allons quand m me tenter notre chance et ce
236. e par la moyenne non pond r e des Fs et un test binomial g n ralis pour les P values Sous chantillon P value Dor naz 1996 femelles 0 008 0 6477 Dor naz 1996 m les 0 030 0 3226 Eclepens 1996 femelles 0 008 0 1206 Eclepens 1996 m les 0 027 NA Gorges du Trient 1996 femelles 0 034 0 9171 Montmollin 1996 males 20027 NA Neuchatel 1996 femelles 0 001 0 7250 Combinatoire 0 009 05179 Vous remarquerez que la combinaison des cing tests disponibles a t effectu e l aide de la proc dure binomiale g n ralis e de TERIOKHIN et al 2007 effectu e l aide du logiciel Multi Test DE Meets et al 2009 En effet partir de quatre tests je pr f re utiliser cette proc dure plut t que le test Z de Stouffer WHITLOCK 2005 Pour effectuer ce dernier chaque P value individuelle est transform e en son quivalent de la distribution Z centr e sur 0 et d cart type 1 Sous Excel on tape S1 B2 NA S1 B2 gt 0 9999 LOI NORMALE NVERSE 0 9999 0 1 LOI NORMALE NVERSE B2 0 1 B2 correspond aux coordonn es de la case du tableau Excel o la P value transformer se trouve Cette commande renvoie une absence de r sultat quand NA est rencontr et tient compte du fait quune P value de 1 mest pas transformable et la P value 0 9999 est choisie comme limite sup rieure Enfin La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 181 P quivalent de la P value en Z c
237. e Tc et T vivax Tv qui affectent gravement la sant du b tail La TAA repr sente un frein majeur au d veloppement en Afrique subsaharienne et son co t annuel a t estim hauteur de 4 75 milliards de dollars am ricains FAO 2000 Bouver et al 2009 248 Initiation la g n tique des populations naturelles Trypanosoma brucei s requiert deux h tes s quentiels pour accomplir son cycle fig 81 Un vert br l homme par exemple o le parasite se propage par fission binaire clonalit et une glossine le vecteur o une phase de propagation clonale dans l intestin moyen pr c de une ventuelle sexualit de type classique me ose avec s gr gation recombinaison et amphimixie qui a lieu dans les glandes salivaires de la mouche ts ts MAcLeop et al 2005a b c 2006 Tarr et al 2007 En th orie la recombinaison sexu e peut intervenir chez n importe laquelle des esp ces ou sous esp ce on y reviendra du complexe T brucei Tarr et al 2007 Il semblerait cependant que ceci ne concerne que les T brucei d animaux i e Tbb alors que la sexualit serait rare ou absente chez les souches infectant l homme Tbg1 et Tbr MAcLeop et al 2000 DE Megts et BALLoux 2005 Korri et al 2009 Simo et al 2010 Cependant ces inf rences sont toujours l objet de contestations car elles d pendent fortement de la strat gie d chantillonnage et notamment de ce qui est consid r comme app
238. e l on se situe en limite de puissance dans ce cas de figure R ponse 14 Calculs d apparentement dans une population de consanguinit F F se note aussi Q Lapparentement R entre deux individus correspond la proportion de cas o ces deux individus portent au moins un g ne identique par ascendance R est donc gal au double de la parent not e Qs qui est la probabilit de tirer deux all les iden tiques par ascendance entre deux individus de la m me population Si le syst me de reproduction explique la totalit de F alors F Frs La parent entre un fr re et une s ur de m mes parents pleins fr res est de 0 25 1 21 1 2 1 4 dans une popu lation non consanguine Elle est de Qs 0 251 1 F dans une population de consanguinit F Donc dans une population o le syst me de croisements explique enti rement le Frs la parent fr re s ur est de Qs 0 251 1 Frs et donc leur apparentement 21 0 251 1 Fys 0 51 1 Frs alors que l apparentement entre deux individus quelconque de cette population sera de 2F R ponse 15 Calcul du Frs moyen dans des fratries d une esp ce gonochorique Nous allons consid rer un mod le IAM de mutation beaucoup d all les dans une P grande population Deux cas sont possibles si on consid re que l on a pangamie Soit la m re de la fratrie est homozygote ii avec la probabilit p 7 soit elle est h t rozygote i avec la probabilit 2p p p t
239. e l effectif efficace de valeur propre qui s int resse l volution de l h t rozygotie au cours du temps et enfin l effectif effi cace de coalescence qui s int resse au temps qu il faut mettre pour retrouver l anc tre commun de deux repr sentants du m me g ne dans une population M thodes de calcul de l effectif efficace des populations naturelles Deux familles de m thodes permettent d inf rer l effectif efficace de populations tudi es l aide de marqueurs mol culaires Les tudes bas es sur les fluctuations temporelles des fr quences all liques au cours des g n rations permettent d estimer ce que les sp cialistes appellent l effectif efficace de variance de populations chan tillonn es de fa on r p t e au cours de leur cycle de vie WapLes 1989 Le logiciel MACLEEPS 1 1 ANDERSON et al 2000 t l chargeable http www stat washington edu thompson Genepi Mcleeps shtml r alise une estimation de NV par maximum de vraisemblance en utilisant la variation des fr quences des all les entre g n rations Il est donc n cessaire de conna tre le temps de g n ration de l esp ce tudi e Lalgorithme utilis fait l hypoth se que la s lection la migration et la muta tion ont un impact n gligeable compar la d rive Un intervalle de confiance 95 est galement calcul ANDERSON et al 2000 Cela est galement r alis par le logiciel NeEstimator PEEL et al 2004 voir plu
240. e la sous esp ce Glossina palpalis gambien sis Gpg transmet la maladie du sommeil avec une pr valence relativement lev e Camara et al 2005 Au Burkina Faso c est un vecteur majeur de nagana en parti culier dans le bassin de la rivi re Mouhoun o se situent les chantillons que nous allons analyser Bouyer et al 2006 La connaissance des sch mas de dispersion et de tailles de populations est un pr requis n cessaire au d veloppement d une lutte raison n e pour le contr le des populations de vecteurs TABACHNICK et BLACK 1995 Pour les mouches ts ts comme pour les autres esp ces de vecteurs les estimations directes par marquage recapture sont fastidieuses et co teuses et pas n cessairement tr s fiables dans le cas des mouches ts ts TERBLANCHE et CHOWN 2007 Comme nous allons 189 Mouhoun river _ Boromo Bobo Dioulasso River course M Swamp forest y Trapping sites Figure 52 Les quatre zones d chantillonnages A H C et D et la localisation pr cise de chaque pi ge dans chaque zone de captures de Gpg le long du Mouhoun Pour chaque pi ge bicone bleu le nombre de glossines g notyp es est donn Le rang des pi ges de chaque zone est donn entre parenth ses pour les premier dernier pi ges et interm diaire d apr s BOUYER et al 2009 190 Initiation la g n tique des populations naturelles le voir les marqueurs g n tiques et les outils de la g
241. e 16 Sachant que le comportement des mod les quasi en r gression logistique peut s av rer trange quand l v nement tudi pr sence de Bbss est rare ce qui est notre cas on est en droit de chercher renforcer ce r sultat En fin de compte nous cherchons juste v rifier si nous n avons pas plus de Bbss chez les tiques femelles que chez les m les puisque ces borr lies sont sp cifiques de petits rongeurs peu dispersants sup pos s tre davantage parasit s par les larves et nymphes femelles que m les quel que soit le site ou l ann e On peut donc calculer parmi les tiques infect es par Bbss la proportion de tiques femelles et m les et comparer cette proportion 2 par un test binomial Sur 34 tiques infest es par Bbss 26 taient femelles ce qui conduit la P valuedutestbinomial sousR binom test 26 34 p 0 5 alternative greater Phino_26 34 0 5 0 0015 ce qui est quivalent aux r sultats pr c dents Vous vous demandez alors pourquoi vous ai je cass les pieds avec toutes ces r gressions alors qu il tait si simple de commencer par le test binomial La r ponse est simple D abord il nest pas inutile d apprendre a taquiner les r gressions lin aires g n rali s es qui servent tr s souvent et ensuite dans une publication une r gression logis tique en quasi likelihood va avoir beaucoup plus de classe en apparence qu un petit test binomial et impressionner beaucoup plus facile
242. e 73 S lection de la variable d pendante dans le menu Mantelise it de Fstat Fstat for Windows File Optio Mareale Ji Biased pers LUTTE air Faites Taing and Daguise Comp among poupa of samples Bare Distances Der cyane red F Stating Gemiye chm Partial Mantel or Regression File I Dais fom distance mairices Vanebies Dependant sanetle Figure 74 Seconde tape pour le Mantel avant de cliquer sur Run 232 Initiation la g n tique des populations naturelles Tableau 31 Tableau des r sultats des tests de corr lation R de Mantel entre Papparentement et l accouplement des tiques des infra populations de Rhipicephalus microplus Les tests au d part bilat raux ont t unilat ralis s dans le sens R gt 0 sens recherch en divisant la P value unilat rale par deux et en la retranchant de 1 pour celles correspondant aux corr lations n gatives Pour le total la corr lation est la moyenne non pond r e sur l ensemble des 20 infra populations et les P values ont t combin es par la m thode binomiale g n ralis e de MultiTest DE MEEUS et al 2009 avec k k 2 10 La 10 P value en ordre croissant est indiqu e en gras Vache ay P value bilat rale P value unilat rale Bourail bovin 1 Bourail bovin 2 Bourail bovin 3 Bourail bovin 4 Bourail bovin 5 Canala bovin 1 Canala bovin 2 Canala bovin 4 Canala bovin 5 Canala bovin 6 La Foa bovin 1 La Foa bovi
243. e chapitre c est que vous comptez travailler sur des orga nismes reproduction clonale Je crois alors indispensable d avoir compris au moins une fois ce qui suit ou au moins de comprendre la d marche permettant d aboutir aux r sultats finaux Cas g n ral Dans un mod le en le subdivis en 7 sous populations chacune compos e de N individus diplo des g n rations non chevauchantes avec un taux de mutation u dans un mod le IAM infinite allele model soit Qy la probabilit de prendre au hasard deux fois le m me all le au sein d un m me individu Qs la probabilit de pr lever au hasard le m me all le dans deux individus de la m me sous population et Qr la probabilit de prendre deux all les identiques dans deux sous populations diff rentes de la population totale soit y 1 u la probabilit qu aucun des deux all les pris au hasard mait mut d une g n ration l autre c la proportion de zygotes form s de fa on clonale asexu e et s la proportion parmi les 1 c qui se forment suite une autof condation soit g la probabilit de tirer au hasard deux individus de la m me sous population qui soient originaires tous les deux d une seule et m me sous population avant migration et q4 la probabilit que deux individus pris au hasard dans deux sous populations diff rentes parmi les n disponibles soient issus 268 Initiation la g n tique des populations naturelles avant migration de la
244. e clusters de BAPS qui le composent 12 pour les femelles de Berne 1995 Sous un diteur quelconque vous fusionnez les colonnes 1 2 3 et 6 du tableau 10 ce qui donne pour la premi re ligne quelque chose du style Ber95F1 N oubliez pas de trier les donn es pour que les clusters apparaissent dans l ordre dans chaque sous chantillon initial Appelons le fichier contenant ces donn es modifi es IRTotBAPSClustMalHomoMEFSep txt Ce n est pas fini car il faut maintenant coder en donn es manquantes le locus IRO8 chez les tiques m les Rappelez vous que dans un souci de puissance nous les avions artificiellement rendus homozygotes afin que les m les soient pris en compte pour ce locus dans l analyse BAPS Maintenant nous souhaitons calculer les nouveaux Frs de cette partition afin de voir si elle chute par rapport au jeu de donn es initiales Le g notype des m les au locus IRO8 doit donc en effet tre recod 000000 car ils ne doivent pas rentrer en ligne de compte dans le calcul du Frs Pour ce faire il est commode soit de faire un petit programme pour ceux qui savent soit utiliser la fonction conditionnelle d Excel Il s agit de cr er une colonne sexe en A dans le jeu de donn es IRTotBAPSClustMalHomoMFSep txt avec le sexe des individus F ou M dans une colonne libre en H apr s IR39 on tape en ligne 2 ligne du premier individu SI A2 M 000000 C2 ce qui aura pour effet d crire 000000 dans la c
245. e d quations 30 on peut tirer en d taillant au maximum SS1 Nall Nall Nr22 202 2N t Nr Naaa F Nal I 0 SS lt 2Nr NT12 2 A 2 2 ar 2 Nii 2 1 Mao 2N p ANT p SS 1 s il 1 31 2N 2N 2N S54 Nrul 2l Nala Nrl201 _ 2N t Nr 2Nr ING Du syst me 31 on d duit SS 2N 7 SS 2N a SS 2a N pit 2N p 32 M ss PNPL oy 7 4 2N 7 3 Le d tail de cette d monstration mest pas indispensable mais je conseille tous les lecteurs d essayer de la comprendre au moins une fois Concepts de base en g n tique des populations 55 A partir de ces sommes de carr s nous pouvons ensuite calculer les composantes intra individuelles w interindividuelles 6 et inter sous chantillons a des sommes de carr s de cette quantit a soit SS SS et SS respectivement SS SS SS SS SS SS 33 SS SS SS c est dire les contributions respectives de ces diff rents niveaux la variance des fr quences all liques Des syst mes d quations 33 et 32 on peut obtenir Dda 2Nrp 2Nrpt Liab 2 poy DING D AT E 2Nrp 2Nr FA p oria 34 2 SS 2Nrp 2Nrp 2Ny p p Toujours en d taillant sensiblement nous d duisons du syst me d quations 34 SS N72 2 oe oe os N oe N SS 2Np p p pp 2 2Nz p l p 1 p E 35 2 2 SSa 2Nrp 2NrP 2Nyp p p 2Nn p d o on tire ss N
246. e d application de la proc dure du Bonferroni s quentiel sur un jeu de 10 tests Les P values ont t class es par ordre croissant Test N P value Nombre P value D cision de tests corrig e 10 2 0 001 0 010 0 0050 i gt 0 003 9 0 027 0 0056 10 0 005 8 0 040 0 0063 j 8 0 015 7 0 105 0 0071 ns 7 0 022 6 0 132 0 0083 ns 4 0 041 5 0 205 0 0100 ns 3 0 050 4 0 200 0 0125 ns I 0 101 3 0 303 0 0167 ns 6 0 210 2 0 420 0 0250 ns 5 0 321 1 0 321 0 0500 ns significatif au seuil 1 significatif au seuil 5 ns non significatif sur le nombre d individus g notyp s De faibles chantillons ne permettront jamais d obtenir des P values suffisamment basses pour supporter une proc dure de Bonferroni C est ce que les statisticiens appellent le risque de seconde esp ce B ou risque de se tromper en acceptant Ho Alors que correspond au risque de premi re esp ce ou risque de se tromper en rejetant Ho Nous avons d j voqu ces concepts en p 69 Les tests r p t s ne sont pas ind pendants C est typiquement le cas des tests de d s quilibre de liaison par paire de loci C est aussi le cas de tests de diff renciation par paire de sous chantillons Ici encore il est n cessaire de distinguer le cas o une r ponse globale est souhait e du cas o on recherche quels tests sont significatifs Tester si un signal global existe Nous prendrons l exemple des tests de d s quilibre de liaison par p
247. e d h t rozygotie sera la m me que pour l autof condation alors que s il y a dominance pour le caract re les h t rozygotes et homozygotes dominants s accouplent de leur c t et les homozygotes r cessifs du leur cette vitesse d pend des fr quences all liques Des caract res tels que la taille la maturit sexuelle ou la r sistance aux pathog nes ont presque toujours au moins en partie un d terminisme g n tique Or il est prouv que dans de nombreuses esp ces ces caract res conditionnent l appariement assorti assortative mating des partenaires sexuels THomas et al 1995 La figure 6 illustre une comparaison de l efficacit en termes de perte d h t rozygo tie des diff rents r gimes consanguins de reproduction d crits plus haut Remarquons que l autof condation est la plus efficace que les croisements fr res s urs sont les moins rapides mais rattrapent l gt homogamie avec dominance sur la fin et que les plus lents sont les homogames dominants pour lesquels l all le dominant est le plus fr quent dans la population de d part L h t rogamie Lautoincompatibilit est une forme d h t rogamie Elle ne peut exister sans s lec tion fr quence d pendante voir p 35 Notons qu elle ne concerne que les loci 38 Initiation la g n tique des populations naturelles Autof condation 100 Croisement fr re sceur 100 JE _ Homogamie 100 p 0 5 es Homogam
248. e d isolement par la distance la diff renciation entre Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 215 zones semble plus substantielle alors que la corr lation intra individuelle F s est forte en raison d un effet Wahlund et des all les nuls et dans une moindre mesure du codage homozygote des m les peu nombreux en Zone A aux loci h t rosomaux dans les pi ges le vrai Fs 0 14 voir plus haut CONCLUSIONS Il y a une forte micro structuration que le maillage des pi ges ne permet pas de rendre avec pr cision en particulier en ce qui concerne la taille des d mes et leur distance entre eux moins que le voisinage soit strictement continu Il n en reste pas moins qu un isolement par la distance a pu tre mis en vidence et que l on sait que la distance entre deux pi ges doit tre r duite si l on souhaite affiner notre vision de la structure des populations de G palpalis gambiensis le long du Mouhoun soit moins que 71 m entre pi ges Les estimations de densit s et de dispersions convergent avec celles des donn es MRR ce qui incite une certaine confiance malgr les effets Wahlund les petits chantillons et les all les nuls qui ont tr s certainement consid rablement brouill les signaux Pavenir pour les ts ts de for t galerie le Mouhoun fait actuellement l objet d une campagne d radication par le PATTEC et ne sera donc pas tudiable avant longtemps des
249. e dans chaque sous population 7 on va observer sur l ensemble du syst me une h t rozygotie de En i a 2p i Nel l p 11 sil n y a que deux all les dans tout le syst me dont le premier la fr quence p dans la sous population 7 44 Initiation a la g n tique des populations naturelles Sur l ensemble la fr quence de cet all le sera donc gale la moyenne des fr quences trouv es sur l ensemble des sous populations pp 12 M Sur l ensemble encore on peut galement calculer la fr quence des h t rozygotes attendus sous l hypoth se d une panmixie globale H a 2pl p 13 On peut alors calculer un d ficit global en h t rozygotes y Hr Frisr H daj eT En utilisant 11 et 13 on obtient pour 14 2pl1 pl 2p ll pil N 7 lg ET 2p l p d o 2 p 1a 2 Wi Frey 2p l p en simplifiant et en d veloppant pp pi p E ni l ni l IST 7 pil p et donc en utilisant 12 7 p pt Don pil p 15 pl gt Concepts de base en g n tique des populations 45 L quation 15 peut galement s crire veuillez vous r f rer la r ponse 4 si vous ne voyez pas pourquoi eal Fer EEE pil p Il s agit donc du rapport entre la moyenne du carr des carts la moyenne si cela ne vous rappelle rien reportez vous la r ponse 5 et la valeur que prend cette moyenne des carr s des carts
250. e de l estimation de densit s efficaces relativement importantes 244 Initiation la g n tique des populations naturelles d environ 200 tiques km soit 600 tiques reproductrices par levage Compte tenu du fait que nos estimations d effectifs efficaces sont probablement sous valu es voir Bouyer et al 2009 que les d ficits en h t rozygotes t moignent d effectifs efficaces inf rieurs aux effectifs r els on se retrouve avec des densit s de tiques importantes plus de 1 000 km telles qu observ es sur le terrain Korri et al 2006a malgr les traitements acaricides Ces derniers semblent donc d un impact l ger sur la d mographie de la tique Si nous consid rons que la rotation des b tes se fait sur 2 5 parcelles par g n ration de tiques Korr1 et al 200G6a et que chaque parcelle fait en moyenne 3 km on peut en d duire que les tiques circulent sur une surface totale 6 15 km soit en consid rant qu il s agit d un disque de surface zr sur un rayon de 0 8 1 1 km donc dans le m me ordre de grandeur que ce que la g n tique semble indiquer Il y a donc convergence remarquable entre observations directes et inf rences par outil de g n tique des populations De grandes populations et un isolement important entre elles doivent favoriser l apparition et l installation rapide de mutations favorables et conf rer un potentiel volutif important R microplus voir ce titre CHEVILLON et a
251. e des populations d organismes parasites font partie de ce que TIBAYRENC 1998 nomme la g n tique pid miologique ou d une mani re moins ambigu l pid miologie mol culaire L tude de la g n tique des populations des parasites de leurs vecteurs et h tes peut comme je viens de le d crire de fa on insistante donner acc s des informations cl s sur leur cologie et potentiels volutifs mais ceci n est rendu possible que gr ce une batterie d outils d analyses statistiques en perp tuelle crois sance et volution Le principal objectif de ce manuel est de d crire la plupart des m thodes disponibles ce jour leur m rite leur puissance ainsi que leur limites les concepts et hypoth ses biologiques de base qui permettent leur mise en uvre et ce de la fa on la plus didactique possible Pour des revues plus g n rales et techniques le lecteur averti pourra se reporter aux excellentes productions de CRISCIONE et BLouIN 2005 CRISCIONE et al 2005 Rousset 2004 et les r f rences conte nues dans ces travaux Ce manuel est organis en deux parties La premiere partie est elle m me constitu e de trois chapitres le premier chapitre entreprend de d crire tr s bri vement les diff rents types de marqueurs les plus utiles pour les tudes de g n tique des popu lations naturelles le deuxi me chapitre traite des concepts de base en g n tique des populations et des diff rents outils param tres
252. e faut galement remercier Michel Raymond et Francois Rousset pour les changes parfois anim s qui m ont permis de mieux assi miler les statistiques parfois souvent non intuitives associ es la g n tique des populations Les discussions avec Jean Fran ois Gu gan et les conseils qu il a pu me prodiguer m ont grandement aid en particulier pour les mod les de r gression Un grand merci galement ric Elguero Benjamin Roche et Marc Choisy pour leurs conseils et astuces toujours utiles Qu il me soit permis ici de rendre hommage au regrett Anatoli Teriokhin parti beaucoup trop t t Cette liste de remerciements o les oublis sont obligatoires serait particuli rement biais e sans la pr sence de Christine Chevillon grande traductrice de Rousset dans le texte devant l ternel et donc sans qui une grande partie de mes publications auraient t amput es de para graphes particuli rement croustillants voire n auraient m me pas vu le jour Je me dois galement de remercier les tudiants que j ai encadr s et dont les remarques r voltes et questionnements m ont particuli rement enrichi et pas seulement en termes de titres et travaux Je pense plus particuli rement Franck Prugnolle mais aussi Damien Caillaud Merci aussi Michel Tibayrenc d avoir ouvert la voie de P pid miologie mol culaire et de m avoir accueilli dans son laboratoire en 1999 et laiss enti re libert dy mener mes recherches Merci to
253. e interm diaire de la grande douve du foie s estim entre 0 8 et 1 MEUNIER ef al 2004a Si la popu lation n est pas l quilibre g notypique il s agit alors de valeurs minimales n ces saires pour expliquer les fr quences g notypiques observ es Dans le cas des lymn es tronqu es cela ne change pas grand chose d ailleurs car on est proche du maximum possible Dans le cas de loci plus de deux alleles il va exister autant de Frs que d all les On comprend facilement que la multiplicit des Frs ne va pas favoriser l interpr tation des processus qui conduisent aux fr quences g notypiques observ es comme le taux d autof condation On peut calculer un F7 moyen sur l ensemble des all les On peut faire la moyenne non pond r e mais la m thode la plus populaire et la meil leure mon sens correspond la moyenne des Frs par all le pond r e par le produit des fr quences all liques p 1 p Ce type de pond ration permet de donner le maximum de poids aux all les de fr quences interm diaires et peu de poids aux all les rares Une mesure du Fs sur un seul locus est une entreprise hasardeuse car il ne permet pas de mesurer quel point c est bien le r gime de reproduction qui est responsable de ce que l on observe ou un artefact li au locus tudi Plus cette mesure est faite sur un grand nombre de marqueurs plus fiables seront les inf rences qu on en tirera La philosophie de pond rat
254. e manuel para tra d autres logiciels avec d autres options seront parus En particulier dans la seconde partie de ce manuel nous utiliserons aussi un autre de ces logiciels plus r cent 100 Initiation la g n tique des populations naturelles FLOCK DucueEsne et TURGEON 2009 qui bien que diff rent de BAPS donne des r sultats tr s comparables et est quasiment aussi facile d utilisation Avant analyse j engage les lecteurs souhaitant aller plus loin de v rifier sous Google en recherchant admixture AND population structure par exemple ESTIMER DES EFFECTIFS EFFICACES Nous avons d ja vu a propos des tests d isolement par la distance en p 89 90 que certains param tres d mographiques sont extrapolables partir des donn es g n tiques Il existe d autres situations o certains param tres tels que l effectif efficace ou le taux de migration peuvent tre inf r s partir de donn es s par es dans le temps et ou dans l espace sans isolement par la distance D finition de l effectif efficace d une population L effectif efficace d une population aussi appel effectif g n tique et g n ralement not NV est cens repr senter avec quelle vitesse une population perd sa diversit g n tique par d rive g n tique En effet la fraction 1 N 1 2N pour des diplo des donne la probabilit que deux g nes pris au hasard dans la population descendent d un seul et m me g ne anc tre d
255. e pour tous les sous chantillons temporels Les r sultats sont synth tis s dans le tableau 38 Analyses avec MLNE Apr s avoir cr un r pertoire pour Bonon et pour Dubr ka et y avoir d plac les fichiers correspondants cr s par Create copiez dans chacun de ces deux r pertoires le logiciel MLNE mne2 exe Lisez bien la notice qui n est pas des plus didactiques afin d effectuer les modifications n cessaires dans les fichiers sources Prenez le fichier pour Bonon La premi re ligne doit indiquer 1 car vous souhaitez estimer la fois m et N La deuxi me ligne indique la taille efficace maximale autoris e pour conomiser de la m moire et est par d faut 5 000 ce qui est largement suf fisant Si le r sultat est proche de cette valeur vous pourrez ventuellement recom mencer avec une valeur plus lev e La troisi me ligne ma pas d int r t et on ne s en occupe pas La quatri me ligne est destin e aux informaticiens experts dont nous ne faisons malheureusement pas partie donc nous zappons La cinqui me ligne d signe le nombre de loci v rifiez que le nombre indiqu est bien 1 La sixi me ligne G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 267 indique le nombre total d all les La septi me ligne indique le nombre de sous chantillons temporels pour la sous population focale ici Bonon Il y en a trois correspondants aux g n rations 39 59 et 79
256. e tiques afin d en pouvoir extraire la surface de dispersion de ces tiques Estimation d effectifs efficaces extrapolation des densit s et de la dispersion Effectifs efficaces des tiques de Suisse Pour des raisons de commodit et de coh rence les tiques tunisiennes n ayant pas t chantillonn es de la m me mani re nous nous focaliserons sur les chantillons de Suisse Rappelons nous que nous avons rencontr de gros d ficits en h t rozygotes all les nuls et dominance d all les courts ainsi que la pr sence d un fort effet Wahlund Nous ne travaillerons donc qu partir de m thodes ind pendantes de l h t rozygotie telle que celle propos e par BARTLEY et 41 1992 bas e sur les d s quilibres de liaison et impl ment e par NeEstimator PEEL ef al 2004 Nous r utiliserons que les donn es clusteris es par BAPS o seuls subsistent un ou deux individus par cluster dans chacun des huit sites suisses pour viter l effet confondant d l effet Wahlund Il faut cr er un fichier par site dans un format proche de Genepop comme dans la figure 37 160 Initiation la g n tique des populations naturelles Pop Bern9SF 044 Bern9SM 050 Bern9SF 027 Bern9SM 019 Bern9SF 039 Bern9SM 006 Bern9SF 013 Bern9SM 035 Bern95F 028 Bern9SM O55 Bern9SF 022 BernSSM 031 Bern9SF 016 Bern9SM 009 Bern9SF 042 Bern9SM 057 Bern9SF 020 Bern9S5M 014 Bern9SF 029 Bern9SF 049 Bern95M 041 B
257. e transformation Log afin de minimiser les risques d erreurs dus aux petites valeurs voir Favre et al 1997 pour plus de d tails Cet indice se note AJ Sa distribution sur l ensemble des populations est n cessairement centr e sur 0 Et une valeur n gative signifie que l individu est moins bien assign que la moyenne son propre sous chantillon On calcule ensuite la moyenne de cet indice sur les m les et la moyenne sur les femelles de l ensemble de l chantillon La statistique suivante est calcul e t o MoA 54 SAAT AL Nb NO o les signes et d signent la cat gorie qui disperse le moins et le plus respective ment la barre d signant la moyenne s la variance et NO le nombre total d individus de la cat gorie consid r e observ s dans l ensemble des sous chantillons La moyenne du sexe le moins dispersant donc mieux assign doit tre sup rieure celle du sexe le plus dispersant La deuxi me statistique qui nous int resse correspond t SHALL Rs AI FAT 55 Tests statistiques 91 La variance de l indice d assignement du sexe le plus dispersant doit tre sup rieure a celle du sexe le moins dispersant La troisi me statistique d pend de la diff rence des Fs estim s pour chaque cat gorie bd at 9 56 La diff renciation mesur e sur la cat gorie d individus les moins dispersants doit tre plus lev e que celle mesur e pour la cat gorie
258. ec les carr s moyens attendus un syst me de trois quations trois inconnues permettant de d duire les diff rentes composantes de la variance des fr quences all liques Cela est possible en saidant d un ouvrage traitant en d tail de l analyse de variance hi rarchique vested en anglais SoKAL et RoHLF 1981 Si nous consid rons le cas d un locus deux all les 1 et 2 l tude de la variation all lique se fait alors sur un seul all le l all le 1 qui prend la valeur a 1 ou a 0 quand il est pr sent ou absent Nous avons besoin ensuite de calculer les sommes des carr s des quantit s de l all le dans chaque chromosome de chaque individu SS des individus SS des sous chantillons SS3 et de l chantillon total SS Notons Ny le nombre d homozygotes pour l all le 1 V7 celui des h t rozygotes et Nm celui des homozygotes pour l absence de cet all le dans l chantillon total De m me consid rons NV le nombre d homozygotes pour l all le 1 Nj celui des h t rozygotes et Vp celui des homozygotes pour l absence de cet all le dans l chan tillon 7 Sachant que la quantit mesur e a prend la valeur 0 ou 1 et en supposant 54 Initiation a la g n tique des populations naturelles une esp rance uniforme des h t rozygoties de chaque sous population nous pou vons poser nN 2 o SS wane n N 2 2 SS 5 n N 2 30 ith 2N n N 2 4 dl SS IN Du syst m
259. ellier II Montpellier France BEN ABDERRAZAK S GUERRINI E MATHIEU DAUD E Truc P NEUBAEUR K Lewicka K BARNAB C TIBAYRENC M 1993 Isoenzyme electrophoresis for parasite characterization In Hyde J E ed Protocols in Molecular Parasitology Humana Press Totowa NJ 361 362 BENNETT J A 2004 Pest and diseases in the Pacific War Crossing the line Jv Tucker R P Russell E eds Natural Ennemy Natural Ally Toward an Environment History of Warfare Oregon State University Press Corvallis 217 251 BENZ CRI J P 1973 L analyse des donn es Tome I La taxinomie Tome II L analyse des cor respondances Paris Dunod Borces E C DuJARDIN J P SCHOFIELD C J ROMANHA A J Dioraruti L 2000 Genetic variability of Triatoma brasiliensis Hemiptera Reduviidae populations J Med Entomol 37 872 877 Boucnoux M E AANENSEN D M Moranp S TH RauD M Spratt B G d ENFERT C 2004 Multilocus sequence typing of Candida albicans strategies data exchange and applications Infect Genet Evol 4 243 252 BOUYER J BALENGHIEN T RAvEL S Kon N VIAL L SIDIB l Sorano P De Mre s T 2009 Population sizes and dispersal pattern of tsetse flies rolling on the river Mol Ecol 18 2787 2797 BOUYER J GUERRINI L DESQUESNES M DE LA RocquE S Cursance D 2006 Mapping 288 African Animal Trypanosomosis risk from the sky
260. ement ne se fait plus alors l all le correspondant ne sera plus amplifi On parle alors d un all le nul Un all le nul ne peut par d finition pas tre d tect sauf l tat homozygote absence de bande On peut aussi dire qu il est r cessif vis vis Qu est ce qu un marqueur g n tique 27 Peak Scan 4294 Size 146 50 Height 1015 Area 2404 130 132 134 136138 140 142 144 146 148 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 182 184 186 188 190 i i J 6000 4000 2000 L i i l i j A6 0got37B P20 23 6ta 8 Yellow Se SS eS A9 Oyi 58B P20 23 6ta 11 Green 6000 4000 2000 e e e OU e CN COR o E ss 4 fl Bs Et jtm Figure 5 Ee aple de profils obtenus pour des loci microsatellites dinucl otidiques sur s quenceur automatique Les profils montr s correspondent ceux obtenus partir d un oocyste de Plasmodium falciparum agent de la forme la plus s v re de la malaria et pour trois loci avec trois couleurs diff rentes tous trois h t rozygotes Le locus bleu pr sente un h t rozygote avec deux all les 46 et 168 le noir est 164 176 et le vert est 166 170 Le nom des all les correspond ici directement a la taille du produit obtenu apr s PCR sp cifique des all les non nuls qui sont donc dominants Nous reviendrons plus tard sur les all les nuls Les loci microsatellites sont consid r s comme tant en g n ral
261. en pareil cas Par ailleurs si on calcule avec Fstat le Fy des tiques en s parant celles infect es par Bba de celles qui ne le sont pas on ne retrouve aucune diminution du Fy 0 45 pour les infect es et 0 44 pour les non infect es par Bba Il n existe pas de diff renciation significative entre tiques infect es et non infect es Cette interpr tation nest donc aucunement soutenue La troisi me interpr tation possible impliquerait l existence d une adaptation locale des borr lies qui infecteraient plus facilement les tiques locales r sidentes que les immigrantes Deux arguments vont l encontre de cette hypoth se La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 185 La premi re est que les tiques m les et femelles qui en principe n ont pas la m me dispersion les femelles dispersent en principe peu ou pas cf p 147 153 ne sont pas infect es diff remment par Bba p 173 Par ailleurs cest le partenaire le plus mobile des deux qui doit en th orie tre le mieux adapt localement GANDON et al 1996 GANDON 2002 Or ici les tiques sont modestement structur es alors que l on pense que les borr lies le sont beaucoup plus Qiu et al 1997 C est donc l h te la tique qui devrait tre adapt localement et non l inverse La quatri me hypoth se implique une survie plus faible des tiques migrantes quand ces derni res sont infect es par Bba Comme les tiques femelles sont mo
262. endre l effectif efficace moyen par pi ge pond r pour le nombre d individus et de pi ges N et diviser cette valeur par la distance minimale en m entre deux pi ges tabl 28 Cette dis tance minimale se trouve en zone A facile trouver dans le fichier que vous avez cr pour la figure 56 et est de Dmini 71 m Le calcul de pond ration est assez particulier Pour ce faire jai multipli le N par le nombre d individus N captur s dans les pi ges correspondants V p N t Npa Pour chaque W j ai calcul le produit du nombre de mouches par le nombre de pi ges correspondant 7jges Np Nind pi ges Jai ensuite fait la somme des Np EN et des Np Np Leffectif efficace moyen est ensuite calcul par le rapport de ces deux valeurs y 1 M Np La densit D est ensuite obtenue en divisant cette valeur par D 71 ce qui permet ensuite de d duire les dispersions o partir des valeurs de Do du tableau 26 On comprend bien que les valeurs obtenues tabl 28 ne pourront tre que tr s approximatives Par cons quent partir des donn es g n tiques et de leur analyse isolement par la distance et de calculs de densit s efficaces nous pouvons inf rer que le long du Mouhoun les ts ts ont des densit s comprises entre 12 et 176 mouches par km et une dispersion distance entre adultes reproducteurs et leurs parents comprise entre 131 m et 1 620 m Ces inf rences sont remarquablement convergent
263. entr e r duite de moyenne 0 et d cart type 1 est calcul Les valeurs Z obtenues sont ensuite combin es dans la formule WHITLOCK 2005 ws Z Le ou amp est le nombre de tests 0 3266 ici La P value globale s obtient ensuite par un retour la loi normale soit sous Excel L O1 NORMALE STANDARD Z 0 628 ici Vous trouverez un argumentaire plus d taill dans DE Meets et al 2009 pour les situations o la proc dure binomiale g n ralis e ou le test Z doivent ou peuvent tre utilis s Si on proc de de la m me fa on pour Bba et Bbundet le m me type de r sultat merge m me quand on ne distingue pas le sexe des tiques chantillons plus grands puisque pour ces deux cat gories de borr lies nous avons vu que le sexe des tiques n importait pas Ce r sultat est rassurant car tant donn que les marqueurs sont non codants donc neutres et ind pendants il eut t difficile d interpr ter une diff renciation entre tiques infect es et non infect es moins d voquer l existence d esp ces cryptiques de tiques et une sp cificit des borr lies Diff renciation entre tiques infect es par diff rentes borr lies Ici il faut ne garder que les tiques infect es et d finir comme sous population les tiques du m me sexe chantillonn es la m me ann e dans le m me site et ayant le m me statut infectieux Notons qu une tique infect e par Bba et Bbss ne fera pas partie de la m me so
264. environ 3 000 GALLARDO et MORALES 1999 Les larves qui closent attendent un h te un bovin 217 pr f rentiellement pour s y fixer et effectuer un premier repas sanguin pour ensuite muer en nymphe sans quitter l individu h te et muer encore apr s un second repas sanguin en adulte Le gardiennage pr copulatoire peut s tablir d s que les femelles sont au stade nymphe FaLK VAIRANT et al 1994 mais semble inefficace emp cher les paternit s multiples CUTULL et al 2010 Apr s f condation les femelles se gorgent et se d tachent ensuite de l h te pour tomber au sol et y mourir en y laissant leurs ufs Bien que plut t sp cifique du genre Bos OSTERKAMP et al 1999 on retrouve galement microplus sur quelques autres h tes surtout Bovidae HOOGSTRAAL et AESCHLIMANN 1982 ainsi que sur le cheval UETI et al 2008 et sur le cerf rusa en Nouvelle Cal donie DE MEEGS et al 2010 En Nouvelle Cal donie l esp ce R microplus a t introduite partir de quelques individus en provenance d Australie en 1942 VERGES 1944 RAGEAU et VERGENT 1959 la suite de quoi une quarantaine stricte a t instaur e L absence de l esp ce avant cette date et l unicit de l introduction est bien document e BENNETT 2004 et son origine australienne confirm e par analyse phylog n tique de l ADN mito chondrial LABRUNA et al 2009 Rhipicephalus microplus a ensuite rapidement colonis tous les
265. ered individuals 22 Number of groups in optimal partition 12 Log marginal likelihood of optimal partition 384 965 Best Partition Cluster 1 1 Cluster 2 2 5 16 Cluster 3 3 20 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 139 Cluster 4 4 Cluster 5 6 Cluster 6 9 15 22 Cluster 7 8 Cluster 8 7 Cluster 9 12 13 17 Cluster 10 18 Cluster 11 10 19 Cluster 12 11 14 21 Le nom du fichier analys est suivi de l effectif de l chantillon du nombre de clus ters dans la meilleure partition et de la valeur du Log de la valeur marginale de vraisemblance ou Log MV qui sert de crit re BAPS pour s lectionner la meilleure partition c est dire celle qui pr sente le plus petit Log MV C est bon savoir si on souhaite relancer BAPS sur les m mes donn es afin de voir s il trouve une parti tion meilleure au deuxi me essai Enfin la partition est donn e Dans le jeu de donn es il faut donc maintenant ajouter une colonne avec le num ro de cluster BAPS auquel chaque individu appartient Il faut le faire pour tous les sous chan tillons cf tabl 10 Attention vous allez peut tre trouver des partitions l g rement diff rentes des miennes et avec des labels de clusters diff rents c est normal Il faut ensuite cr er un nouveau fichier de donn es o chaque sous chantillon ini tial se retrouve subdivis en autant de sous chantillons que d
266. ern9SF OOS Bern9SM 052 Bern9SF 037 Bern95M 017 Bern9SM 015 Bern95M 026 Bern95F_007 Bern9SM 054 Bern95M 051 Bern95F_032 Bern9SM 025 174176 174174 171169 171171 183183 177147 173175 172172 169175 168168 166171 169169 e 165170 165165 172178 1721 4 165173 173173 166176 165170 170170 170183 L 701 70 1735163 gt 17517S 175175S 192192 174174 172172 169169 173183 176176 130130 134134 147147 134147 134134 134147 136142 140147 140145 145151 134154 14 77147 137146 146148 146146 000000 1451486 145145 128145 000000 134148 150150 145145 147147 121141 148148 152152 137146 146146 144144 134134 134144 119119 119119 119119 119119 119119 119119 119119 119119 119119 119119 119119 119123 119119 119127 119119 119119 119119 119119 119119 119121 119119 123123 119123 119119 119119 119119 119125 119119 119119 123123 121121 121121 Z33233 233241 gt 233233 233233 233243 233233 250250 000000 233233 233233 243248 233233 243248 gt 2482458 000000 246246 241241 250250 243243 233233 233233 235235 233233 235235 248246 233241 233233 233250 233233 233243 233233 000000 1281259 1341374 1251254 1311314 1211254 1291299 142142 1291299 1351424 135135 1351354 130130
267. ervalles de confiance sont calcul s l aide de l erreur standard donn e par le jackknife sur les populations et la valeur du pour 23 ddl 24 1 et a 0 05 soit 2 069 voir le tableau 3 en suivant l quation 45 Pour la valeur globale Pintervalle de confiance est issu du bootstrap sur les loci Ces fortes valeurs sont aberrantes tant donn qu on sait qu ricinus pratique une reproduction bi parentale obligatoire Des croisements syst matiques entre apparen t s pourraient ils expliquer un Fx 0 5 Dans la r ponse 11 on d crit comment obtenir une estimation grossi re du taux de croisements fr re s ur 0 n cessaires pour expliquer un Fzs donn b Aa 66 l or Par cons quent nous avons besoin ici de 4 5 soit 80 de croisements fr re s ur pour expliquer nos donn es ce qui est possible mais semble peu r aliste xodes rici nus est en effet une tique triphasique qui change d h te pour chaque stade Les adultes dont nous analysons la variabilit g n tique ont donc subi deux phases de dispersion par des h tes diff rents Pour permettre un taux de 80 de croisements fr re s ur il faut admettre que 80 des individus d une m me ponte restent ensemble au cours des diff rents stades larvaire nymphal et adulte de leur vie Il se pourrait contrairement ce qui est observ en laboratoire o aucun uf non f cond n a pu clore que cette esp ce pratique une parth nog n se automicti
268. es Le mod le en les n a pas que l avantage de simplifier les analyses math matiques Ce mod le est en effet conforme m me approximativement certaines structures de 50 Initiation a la g n tique des populations naturelles populations r elles Dans le milieu marin par exemple il est probable que ce mod le refl te le cycle de nombreux types d organismes fix s et dispersion importante comme les bivalves les chinodermes les crustac s ou les algues mais aussi de nom breux parasites tels que les crustac s parasites cop podes cirrip des isopodes amphipodes et autres monog nes DE Mert 2000 ou m me les parasites en g n ral si on consid re l individu h te comme une sous population et que ces indi vidus h tes sont suffisamment mobiles N BAvI et al 2006 Malgr un aspect tr s caricatural le mod le en les repr sente donc un outil souvent efficace pour tudier les populations naturelles notamment de parasites Autres mod les de populations structur es Il existe d autres mod les de populations structur es qui permettent d tudier les cons quences g n tiques d autres contraintes de subdivision que celles d crites par le mod le en les Ces mod les font intervenir une composante g ographique o l loignement des sous populations et ou des individus va influencer les probabilit s d changes de g nes et ou d individus flux de g nes et ou d individus En termes de migration for
269. es quitablement r partis dans les 100 sous popu lations car cela fait gagner du temps d marrer avec un seul all le requiert un nombre important de g n rations avant d obtenir quelque chose d utilisable Nous allons simuler 1 000 g n rations et r cup rer tous les individus des 1 520 sous populations Nous ne voudrons pas conna tre l ascendance de nos individus Nommez les fichiers r sultats comme bon vous semble et ne deman dez qu une r plication cela suffira ici N oubliez pas de valider chacun de vos choix par un retour chariot sinon vous risquez d attendre longtemps En fonc tion de la puissance de votre ordinateur la simulation durera plus ou moins longtemps 11 minutes avec ma double CPU 2 2 GHz avec 3 5 Go de RAM Quand la simulation est termin e Easypop vous demande le nom du fichier de sauvegarde des param tres de la simulation tr s utile et cr e trois fichiers r sultats le d tail de l volution de la simulation au cours des g n rations au niveau de divers param tres nombre d all les diversit g n tique F statistiques de Wright etc equ un fichier de donn es Fstat dat et un fichier au format Genepop gen Il va falloir cr er des fichiers pour tester l effet sous structuration effet Wahlund et l interaction entre les deux Pour l effet sous structuration on ouvre le fichier dat avec un bon diteur de texte et on ne garde que six sous populations dans les deux zones
270. es C est ce qui se passe durant la m iose entre loci de chromosomes diff rents ou du m me chromosome apr s crossing over S gr gation Processus intervenant lors de la m iose et durant lequel les deux all les de chaque locus se trouvent s par s pour devenir ind pendants dans des gam tes diff rents S lection Processus durant lequel la survie et ou le succ s reproducteur d un individu d pend de son ph notype ou de son g notype d une mani re plus ou moins directe S lectionn S applique pour un locus ou un caract re soumis s lection antonymique de neutre Selfing Voir autof condation Sex ratio Ratio du nombre de m les sur le nombre de femelles dans une population gal un quand il est quilibr SMM Stepwise Mutation Model M canisme de mutation au cours duquel chaque mutation augmente ou diminue avec une gale probabilit la taille de l all le d une unit step pr d finie Ce mode de mutation g n re beaucoup d homoplasie et aboutit au fait qu une ressemblance de taille peut se traduire par une ascendance commune de deux all les 322 Initiation la g n tique des populations naturelles SNP Single nucleotide polymorphism Marqueurs g n tiques d termin s par la mutation d un site paire de base de l ADN avec en g n ral deux alleles possibles car les transitions sont beaucoup plus fr quentes que les transversions Somatique Ce qui vient du soma c est
271. es suivant une courbe en cloche voir gaussienne et logistique Polymorphe Condition qui d crit qu un locus est variable d un individu l autre c est dire qu il pr sente plus d un all le dans l chantillon d individus g notyp s Population Groupe d individus partageant les m mes param tres d mographiques en particu lier la r gulation de la population et partageant une ascendance commune plus probable avec les individus de la m me unit qu avec des individus d autres popula tions d finies comme telles exception faite des migrants bien entendu Purine Base constituant essentiel des nucl otides eux m mes l ments de base des acides nucl iques ARN et ADN compl mentaires des Pyrimidines Il en existe deux Glossaire 321 Pad nine A compl mentaire de la thymine T dans l ADN et de l uracile U dans PARN et la guanine G compl mentaire de la cytosine C Pyrimidines Base constituant essentiel des nucl otides eux m mes l ments de base des acides nucl iques ARN et ADN compl mentaires des purines Il en existe trois la thymine T l uracile U qui prend la place de T dans PARN et la cytosine C R cessif Caract rise un all le qui est masqu quand h t rozygote avec un autre all le anto nymique de dominant Recombinaison Processus durant lequel les all les de loci diff rents auparavant associ s se retrouvent dissoci s et r associ s d autres all l
272. es au format Fstat mais avec un format limit deux caract res par all le Ce logiciel en plus de fournir les graphiques en deux dimensions de la projection des points selon les axes demand s et leur pourcentage d inertie fournit galement des tests de significativit de ces axes selon la m thode du b ton bris broken stick une technique empirique appliqu e l ACP FRONTIER 1976 LEGENDRE et LEGENDRE 1998 KING et JACKSON 1999 qui correspond davan tage un crit re qu un test r el Une explication plus d taill e de cette technique peut tre consult e en r ponse 9 la fin de ce manuel PCA GEN propose aussi une proc dure de permutations des g notypes complets entre sous chantillons afin de tester la significativit de chaque axe bas sur le pourcentage d inertie Comme seuls les g notypes complets sont permut s il est donc important de disposer de jeux de donn es suffisamment complets si on souhaite que cette proc dure ait un minimum de sens 96 Initiation la g n tique des populations naturelles Mouette tridactyle Guillemot de troil REZ Macareux moine 1 0 0 5 0 0 0 5 1 0 PGI Figure 12 ACP bas e sur le polymorphisme de huit loci microsatellites de la tique d oiseaux coloniaux marins Ixodes uriae dans diff rents sites europ ens diff rents points du graphique allant des c tes fran aises cossaises et norv giennes en passant par les les Faro Sur le graphique o
273. es avec celles du papier de Bouyer et al 2009 tabl 29 et donc avec les donn es issues de mar quage relachage et recapture MRR de ts ts marqu es en zone A Dans la mesure o la strat gie de regroupement fut ici l g rement diff rente de m me que le choix de calcul des densit s ce r sultat confirme la robustesse des r sultats du papier La convergence avec les donn es de marquage recapture souligne galement l efficacit des outils de g n tique des populations en particulier la m thode de Rousset 1997 pour estimer Do 208 Initiation a la g n tique des populations naturelles Tableau 28 Calcul d taill des densit s en mouches par m et de la dispersion des glossines distance entre adultes reproducteurs et leurs parents en m le long du Mouhoun 3 19 0 928 7 1 04 0 823 A 0 045 0 013 1710027 H 0 015 10181025 C 57 958 72 D 0 012 30 428 36 o dispersion Zo A I1 244 179 H 1 459 421 C 12222 D 1 620 Do Conclusions isolement par la distance intra zone rolling on the river Nous avons bien mis en vidence une sous structure au sein des zones A H C et D Le fait que les d ficits en h t rozygotes persistent au sein de chaque pi ge auquel s ajoute la non correspondance parfaite entre clusters BAPS et pi ges alors qu un isolement par la distance existe bel et bien plaide pour deux interpr tations compl mentaires Il semble bien y avoir quelques all les nuls mais ces derniers n
274. es d ficits en h t ro zygotes C est un probl me car par un ph nom ne de cercle vicieux moins les all les nuls expliquent un d ficit en h t rozygotes moins le nombre de blancs observ s correspond aux attendus Pourquoi cela Simplement parce que si on attend natu rellement plus d homozygotes en g n ral alors on devrait observer encore plus d homozygotes nuls blancs en particulier ce raisonnement ne marche cependant pas tr s bien s il s agit d un effet Wahlund Par ailleurs la variance entre loci ainsi que le fait que les nuls expliquent tr s bien les d ficits observ s pour IR08 voir plus haut mais aussi pour IR39 P value 0 312 pourraient nous inciter exclure des causes biologiques du type r gime de reproduction ou effet wahlund voir plus loin Notons que des ph nom nes de stuttering ont t d tect s pour IR25 mais seule ment dans deux sous chantillons Pour IR32 et IR27 Micro Checker na pas d tect ce ph nom ne pas plus qu il na d tect de dominance d all les courts Cependant Micro Checker ne travaille que dans chaque sous chantillon de fa on isol e ce qui peut repr senter une forte perte de puissance Dans le paragraphe qui suit nous allons utiliser une autre technique pour d tecter d ventuelles dominances d all les courts D tection de dominance d alleles courts par la m thode de r gression multiple Pour ce faire nous aurons besoin de connaitre pour chaque l
275. es parents 1 N repr sente aussi la probabilit pour deux gam tes qui s unissent de provenir du m me parent Ce ph nom ne est appel coalescence Cette coalescence r currente de certains g nes implique donc que d autres g nes ne contribuent pas au pool des g n rations suivantes Certains g nes sont donc perdus ce qui signifie galement que la diversit g n tique s rode Le ratio entre la taille r elle de la population W aussi appel e taille de recensement ou census size en anglais et cet effectif efficace repr sente donc une mesure de la dyna mique de la diversit g n tique d une population focale par rapport une population dite id ale Une population id ale perdrait sa diversit g n tique la vitesse 1 N par g n ration de telle sorte que son effectif efficace serait gal son effectif de recense ment Une telle situation correspond donc des populations mono ques g n ra tions non chevauchantesse reproduisant de fa on panmictique dans un environnement constant sans s lection migration ni mutation titre d exemple une population compos e de NV 100 individus dioiques avec un seul m le W 1 et 99 femelles Ne 99 aurait un effectif efficace de HARTL et CLARK 1989 86 AN N N c 58 Ce qui donne un N 4 soit 25 fois plus petit que la taille de recensement NW 100 Ceux qui le souhaitent trouveront une d monstration de ceci en Tests statistiques 101 r
276. es simulations Comprendre le manque de structure inter zones avec un peu de simulations 3 e e 3 pi Pour effectuer ces simulations nous allons utiliser Easypop v 2 0 1 BALLoux 2006 mise jour de BALLOUX 2001 Le probl me avec les simulations c est de choisir un jeu de param tres pertinent car il y a une infinit de combinaisons possibles Pour limiter notre travail nous allons utiliser encore une fois les r sultats de l article de RousseET 1997 o l on peut lire que dans un dispositif en une dimension on peut d montrer que si VV est le nombre individus d un d me m la proportion de q prop migrants D la densit efficace d individus par km o la dispersion efficace dis tance entre individus reproducteurs et leurs parents et la distance entre deux d mes adjacents Nm DI 67 La distance entre deux d mes sera Dy i e 68 Nm En explorant les possibles qui collent le mieux aux donn es on peut obtenir D o 700 N 30 et m 0 5 et donc 50 Ce qui voudrait dire que la distance entre deux d mes serait de l ordre de 50 m On va donc supposer que nos estima tions taient les meilleures dans la zone A et que nous y avons sous estim la taille des sous populations La distance entre les zones A et H est d environ 70 km Ces zones font environ 3 km chacune et nous allons simuler deux zones de m me nature de 3 000 m soit 3 000 50 e 50 distance entre deux d mes 60 sous popula
277. es tr s diff rentes des autres majorit des souches dans les ganglions c r braux au lieu du sang Camara et al 2005 Nous pouvons ajouter qu en Guin e le vecteur de la maladie du sommeil est Glossina palpalis gambiensis alors que c est G palpalis palpalis dans les autres zones concern es par notre tude Il existe donc vraisemblablement plusieurs taxons distincts au sein de l entit Tbg1 Que dire alors des autres sous esp ces qui ne se raccrochent a rien Que probable ment beaucoup reste faire sur la taxonomie et l cologie de ces organismes G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 285 Dibbanone Acarow P M Burt A 2001 Indices of mul tilocus linkage disequilibrium Mol Ecol Notes 1 101 102 AGRAWAL A Livery C M 2002 Infection genetics gene for gene versus matching alleles models and all points in between Evol Ecol Res 4 79 90 AKAIKE H 1974 A new look at the statistical model identification JEEE Trans Auto Control 19 716 723 Axsoy S BERRIMAN M HALL N HATTORI M Hipe W LEHANE M J 2005 A case for a Glossina genome project Trends Parasitol 21 107 111 ANDERSON E C WILLIAMSON E G THOMPSON E A 2000 Monte Carlo evaluation of the likeli hood for Ne from temporally spaces samples Genetics 156 2109 2118 ANGERS B MAGNAN P PLANTE M BERNAT CHEZ L 1999 Canonical correspondence analy
278. essus s lectif qui avantage les g notypes ou ph notypes les plus rares Par d fi nition une s lection qui maintient une diversit stable Arithm tique Voir Moyenne Assortative mating Processus d appariement pr f rentiel des partenaires sexuels qui se ressemblent le plus ph notypiquement voir aussi homogamie ARN Acide ribonucl ique normalement transcrit de l ADN et ensuite traduit en prot ine 313 Autoincompatibilit Syst me interdisant l autof condation Autosome D signe un chromosome ordinaire pr sent en paire dans chaque zygote ou individu diplo de normal antonymique de h t rosome Auto stop Hitchhiking en anglais Ph nom ne s lectif au cours duquel la s lection un locus entra ne des modifications de la distribution des fr quences g notypiques un autre locus li physiquement proche sur le m me chromosome ou statistiquement quand le mode de reproduction est ferm clonalit autof condation Bottleneck En fran ais goulot d tranglement D signe un processus d mographique durant lequel une population subit une chute brutale d effectif nombre d individus reproducteurs Cline G n ralement g ographique il correspond l augmentation ou la diminution gra duelle des fr quences all liques un ou plusieurs loci le long d un axe g ographique et ou d un gradient cologique Clonalit Reproduction asexu e o la descendance est produite sans subir ni
279. et gard mauvaise v rifiez le m me s il arrive fr quemment que des mouches du m me pi ge se retrouvent dans le m me clus ter BAPS Les all les nuls jouent peut tre quant eux un petit r le galement comme semblent le montrer les analyses de MicroChecker et de corr lation avec le nombre de blancs Cependant une r gression du nombre de blancs trouv s dans les Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 199 diff rentes zones n explique que peu la dispersion des Fx par loci et pi ge zone R 0 16 Cependant en cas de pangamie c est un Frs l g rement n gatif qui est attendu Le Frs des clusters de BAPS tant l g rement positif il est possible que la contribution des all les nuls m me modeste soit r elle Mais c est bien Il effet Wahlund qui explique le mieux les donn es Isolement par la distance entre individus La plupart de ces pi ges contiennent trop peu d individus g notyp s pour mettre en uvre la m me proc dure que pour les tiques Par ailleurs nous savons que les pi ges ne repr sentent qu approximativement des voisinages si voisinage il y a puisque pi ges et clusters BAPS ne sont pas en tr s bon accord Nous pouvons cependant utiliser ici la proc dure d isolement par la distance entre individus RoussET 2000 Warts er al 2007 impl ment e par le logiciel Genepop 4 Rousset 2008 t l chargeable partir du site http kimura univ montp2 fr ro
280. et en cons quence leur polymorphisme en populations naturelles sera lui aussi lev en g n ral 10 104 ELLEGREN 2000 BALLOUX et Lucon MouLin 2002 ELLEGREN 2004 Ce polymorphisme correspond donc une variation dans le nombre de copies du motif de base Par exemple avec AC o 7 repr sente le nombre de r p titions si on a 7 5 6 ou 10 on a 3 alleles Par ailleurs ce sont souvent des s quences non codantes sauf peut tre les trinucl otides qui correspondent potentiellement des codons r p t s Les microsatellites impli qu s dans des maladies g n tiques X fragile dystrophie myotonique maladie de Huntington sont d ailleurs toujours des trinucl otides ASHLEY et WARREN 1995 FERN NDEZ LOPEZ et al 2004 Or le polymorphisme de s quences non codantes a toutes les chances d tre neutre sauf si le microsatellite en question se trouve par malchance proximit d un g ne ou dans un g ne intron ayant subi un v nement r cent de s lection Un autre avantage des microsatellites est qu ils correspondent des s quences relativement courtes d ADN En tant que tels ils peuvent tre amplifi s par PCR partir de tissus conserv s dans l alcool pendant une dur e assez longue et dans n importe quelle mauvaise condition en principe L amplification par PCR n cessite la connaissance des deux s quences flanquantes du locus o sont choisies les deux s quences compl mentaires des amorces
281. et estimateurs les plus utiles pour les tudes empiriques et le troisi me chapitre examine les diff rentes m thodes statis tiques associ es ces descripteurs et estimateurs Enfin la seconde partie correspond une mise en application des chapitres pr c dents l aide de plusieurs exemples 14 Initiation la g n tique des populations naturelles r els que nous allons r analyser ensemble La plupart des termes techniques sont d finis dans un glossaire que les lecteurs trouveront la fin de ce manuel Certaines questions th oriques sont trait es part dans une partie appel e R ponses aux questions Enfin le nom utilit site web de t l chargement et article associ de tous les logiciels utilis s sont list s en annexe tabl 1 Introduction 15 PARTIE LE Concepts th oriques et Statistiques u est ce qu un marqueur g n tique NOTIONS PR LIMINAIRES Un marqueur g n tique est simplement une portion de l ADN acide d soxyribo nucl ique de l organisme tudi ou un sous produit cod par cet ADN comme une prot ine LADN est la mol cule porteuse de l h r dit chez tous les tres vivants Il importe simplement dans notre cas de toujours regarder ce qui se passe sur cette m me portion d ADN chez tous les individus analys s et dans la mesure du possible dans plusieurs chantillons spatialement et ou temporellement diff rents Il est important que cette portion
282. eurs r sultats TAKEZAKI et NEI 1996 KaLinowsk1 2002 Cette distance est obtenue suivant la formule suivante 42 o 7 correspond au nombre de loci j au label du locus de 1 7 i au label de l all le de 1 mj mj au nombre d all les au locus j xj et Vij les fr quences de l all le i au locus j pour les sous populations x et y respectivement 60 Initiation a la g n tique des populations naturelles Quand c est la distance g n tique entre individus qui est pertinente il semble plus appropri d utiliser la distance d all les partag s shared allelic distance Bowcock et al 1994 voir PRUGNOLLE et al 2005 Si N correspond au nombre d alleles en commun partag s par deux individus sur l ensemble des L loci alors cette dis tance est gale Da 1 N 2L Il existe d autres mesures comme l apparente ment que nous verrons lors des analyses de donn es r elles Il est certain que nous manquons de recul pour appr hender quelles mesures sont vraiment les meilleures et dans quelles situations Esp ces haploides et loci li s au sexe Certaines esp ces sont haplo des durant une certaine p riode voire la totalit de leur cycle de vie Il se peut qu elles soient tudi es chantillonn es durant cette phase Bien entendu il ne saurait tre question d tudier des h t rozygoties chez de telles esp ces Il n en reste pas moins que des tudes de g n tique des populations demeure
283. existe encore une alternative Vous pouvez effectuer la r gression du Fis observ par locus et sous chantillon en fonction du nombre de blancs observ s par locus et sous chan tillon Si la r gression est significative c est que les all les nuls expliquent une partie du Fs Cette m thode en calculant le de la r gression proportion de la variance expliqu e par la r gression permet aussi d appr hender quel point les all les nuls expliquent les donn es Toutes ces m thodes font l hypoth se qu il y a grosso modo panmixie Si la fr quence de nuls ne permet pas d expliquer correctement tous vos d ficits en h t rozygotes en particulier si aucun locus mest conforme l attendu panmictique il se peut que d autres ph nom nes soient en cause Si par exemple il y a de l auto f condation ou effet Wahlund en plus des all les nuls nous ne pourrons pas expliquer les donn es l aide des seuls all les nuls Dans le cas de l autof conda tion il existe un logiciel permettant d estimer le taux d autof condation en tenant compte des all les nuls ou autre probl me dominance partielle dominance des all les courts Il s agit de RMES Davip et al 2007 qui fait l hypoth se d qui libre de liaison entre loci et utilise les d s quilibres d h t rozygotie par paire de loci ce qui peut poser un probl me dans les petites populations tr s autof con dantes Le logiciel est librement t l chargeab
284. extr mes A like c est dire qu on ne garde que les sous populations 5 15 25 35 45 55 et 1 465 1 475 1 485 1 495 1 505 1 515 que l on recode de 1 12 en gardant bien l esprit que 1 6 Al et 7 12 A2 les deux zones extr mes Les populations marginales sont viter c est pourquoi on exclut les sous populations 1 et 1 520 On cr e un fichier de type HierFstat avec en premi re colonne la zone 1 et 2 en 13 Dans un mod le en stepping stone ouvert les populations marginales ne re oivent des migrants que des sous populations qu elles touchent une seule en une dimension alors que les sous populations centrales re oivent des migrants de tous les c t s 214 Initiation la g n tique des populations naturelles deuxi me la sous population 1 12 et en colonnes 3 12 les g notypes aux 10 loci On lance R et on charge le package hierfstat et on se met dans le r per toire o on a cr ce fichier que j ai personnellement appel MouhounA 001HierFstat txt Puis apr s les commandes habituelles data lt read table MouhounA 001HierFstat txt header TRUE attach data loci lt data frame locl oc2 1o0c3 loc4 o0c5 loc6 loc7 0c8 1o0c9 1oc10 levels lt data frame Zone Souspop V V NV NV WM varcomp glob levels loci on obtient le r sultat suivant Zone Souspop nd Total 0 1296429 0 3276309 0 32083790 Zone 0 0000000 0 2274790 0 21967421 Souspop 0 0000000 0 0000000 0 01010303
285. f renciation g n tique entre tiques infect es et non infect es dans chaque sous chantillon soit en testant la diff renciation dans chaque sous chantillon entre tiques infect es par des borr lies diff rentes enfin en proc dant un test de biais de structuration comme nous l avons fait pour le sexe des tiques mais avec le statut infect non infect la place Diff renciation entre tiques infect es et non infect es Il faut construire un fichier par esp ce de bact rie Bbss Bba et Bbundet il ny a pas assez de Bbg On doit changer de nom de population pour chaque site ann e et sexe La figure 47 donne un exemple de fichier pour Bbss La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 179 LRO8 IR25 Ka IR27 IR32 IR394 Dor 96 F I 170184 000000 119119 233246 1291424 Dor 36 F I 165168 147150 119119 235250 1271424 Dor 96 F I 168168 145146 119119 233250 1241274 Dor 96 F I 169175 146146 123123 233246 1281284 Dor 96 F I 168176 149149 119119 250250 1271384 Dor 96 F I 172175 148148 121123 gt 235235 1421424 Dor 96 F I 174175 146146 119119 233233 1351359 Dor 96 F I 168170 147153 119119 241241 1311314 Dor 96 F I 167168 141143 119119 233248 1391394 Dor 96 F I 173177 gt 000000 123123 233241 gt 128142G Dor 96 F I 176176 144144 119119 246246 1351354 Dor 96 F I 166172 145149
286. femelles et m les antonymique de mono que Diploide Caract rise un organisme ou une cellule poss dant un mat riel g n tique chromo somes en double l exception des chromosomes sexuels quand ces derniers existent Glossaire 315 Directionnelle s lection Processus s lectif tendant accro tre ou d cro tre une seule direction la fr quence dun all le ou d un ph notype dans une population Disruptive s lection S lection directionnelle dans chaque sous population mais divergente d une sous population l autre Dominant Caract rise un marqueur g n tique pour lequel un des all les masque l tat h t rozygote les autres all les Caract rise aussi un tel all le antonymique de r cessif Dropout Voir Allelic dropout Epistatique par exemple s lection Forme de d terminisme g n tique o les diff rentes formes d un g ne all les vont avoir diff rentes r percussions sur l expression ph notypique des all les d un autre locus C est typiquement le cas des g nes de r gulation Exon Partie d un g ne conserv e lors du passage de PARN de transfert PARN messager pissage et qui sera donc traduite en prot ine Fr quence d pendante s lection Voire Apostatique Gam te Cellule sexuelle normalement haplo de Chez les animaux les gam tes femelles sont appel s ovules et les gam tes m les spermatozo des Gaussienne Se dit d une distribution
287. fictive fix e un seul all le pr sent pour les locus dont on veut les F par all le Fstat n aime en effet pas travailler sur une seule population Une fois qu on a fait calculer ces Fys par le logiciel on a tout ce qui est n cessaire pour effectuer une r gression lin aire g n ralis e ou GLiM GLiM Generalised Linear Model est une forme de r gression qui permet d analyser des 8 qui p y donn es de nimporte quelle forme gaussiennes poissoniennes logistiques pour les P q 8 P gistiques p plus utilis es en fonction de n importe quel type de variable facteur cat goriel logique ordinal discontinu ou continu Cette r gression doit donc tre de la forme 81q g Fis S T Cte avec S pour le sous chantillon T la taille de l all le et Cte une constante Une analyse de variance sur le mod le permet ensuite de tester si l effet de la taille des all les corrig de l effet des sous chantillons est significatif ou non Attention il faut que la relation entre taille des all les et Fy soit n gative Les q IS 8 relations positives doivent donc tre ignor es Nous verrons tout ceci en d tail dans la mise en pratique de toutes ces connaissances dans la deuxi me partie 110 Initiation la g n tique des populations naturelles LE CAS DU STUTTERING Le mot anglais stuttering se traduit par b gaiement Si les amorces de la PCR ne saccrochent pas tr s bien il est possible alors que la Taq p
288. figure 2 lorsque la technique ne permet pas de discriminer plusieurs all les au locus correspondant soit que ce dernier soit lui m me non variable soit que les variations existantes ne g n rent pas des all les aux charges lectriques suffisamment diff rentes pour tre per ues par la technique Sens du coutant D p ts Figure 2 Repr sentation d une enzyme monomorphe Lenzyme est dite monomorphe c est dire que au moins pour les individus typ s on dit g notyp s il y a absence de polymorphisme et le locus codant pour cet enzyme n est donc pas utilisable pas d information disponible Tous les individus produisent une enzyme qui a la m me charge On estime qu un tiers seulement des mutations de l ADN correspondant au g ne d un enzyme va donner une diff rence de charge suffisante pour tre per ue par lectrophor se SHaw 1970 24 Initiation la g n tique des populations naturelles Les taches r v l es ne sont pas retrouv es au m me endroit Le locus correspondant l enzyme est polymorphe plusieurs all les Plusieurs cas illustr s dans la figure 3 peuvent se pr senter Dans la figure 3 la situation d crite par le Locus I correspond au polymorphisme plusieurs all les d une enzyme mono m rique c est dire qu une seule unit polypeptidique constitue l enzyme fonction nelle celle d crite par le Locus IT repr sente un cas d enzyme dim rique et celle du Locus II une e
289. fique Concepts de base en g n tique des populations 39 de dispersion dans une population structur e seuls les males dispersent par exemple PRUGNOLLE et DE MEEts 2002 PRUGNOLLE et al 2003 Dans ce cas les accouplements se font entre individus plus divergents g n tiquement que s il y avait panmixie Cela entra ne alors comme d j voqu de l gers exc s d h t ro zygotes tous les loci PROUT 1981 PRUGNOLLE et DE MEEUs 2002 Un exemple r cent sur les otaries fourrure de l le de G orgie h misph re sud a mis en vi dence un choix d lib r des femelles pour s accoupler avec des m les non apparent s et plus h t rozygotes HOFFMAN et al 2007 La clonalit Par d finition la clonalit ou reproduction asexu e ou encore parth nogen se apo mictique reproduit l identique les individus qui la pratiquent Elle ne peut donc rien changer elle seule Cependant en populations finies subissant la d rive g n tique avec un taux de mutation constant des exc s d h t rozygotes sont attendus par rapport aux fr quences g notypiques de Hardy Weinberg l chelle de Pen semble du g nome et on s attend m me au bout d un certain temps une h t ro zygotie totale sauf pour les all les homoplasiques BALLoux et al 2003 DE MEEUs et BALLOUX 2005 DE MeEts et al 2006 De Meets et al 2007b Les g n rations se chevauchent Ce ph nom ne ne va pas cr er une
290. fois le m me indi vidu je ne sais pas pourquoi les auteurs ont pr f r cette option h t rodoxe Ici a ne change rien eu gard aux r sultats obtenus 240 Initiation la g n tique des populations naturelles l intervalle de confiance de jackknife Nous obtenons beaucoup plus de valeurs utili sables avec un NV moyen de 380 avec un intervalle de confiance moyen de 93 440 Pour la m thode de Vitalis et Couvet nous allons ouvrir Estim cliquer sur File Open et s lectionner le fichier Ensuite nous allons cliquer sur Analysis cc e cc e Identity measures Cliquez sur Save et choisissez un nom du genre BooNeEstimRes txt pour l enregistrer Retournez au menu Analysis et cliquez maintenant sur Ne inferences et une fois encore sur Save en gardant le m me nom Ignorez l avertissement en cliquant sur Oui Ici tr s peu de r sultats utili sables sont disponibles comme d habitude avec Estim et seul Bouloupari donne un N 1 429 et un taux de migration de 0 007 il sagit d une estimation pour un mod le en le donc une sorte de moyenne de ce qui vient de partout DENSIT EFFICACE ET DISTANCE DE DISPERSION PARENTS DESCENDANTS ADULTES En prenant la moyenne des diff rentes valeurs obtenues sur l ensemble des m thodes on obtient NV 605 La surface d une exploitation est en moyenne d environ 3 km Barr communication personnelle La dens
291. fr re s ur qui permet d expliquer le Fy observ ou encore sil peut tre expliqu par un effet Wahlund voir plus loin Tester s il existe un exc s d h t rozygotes est le test unilat ral dans l autre sens avec le Fre de la population est inf rieur C 1 IS 0 La proportion de fois que l on obtient dans les randomisations une valeur aussi faible ou plus petite encore que celle observ e nous donne la P value du test Ici ce qui est recherch c est si les sous populations se reproduisent de fa on asexu e clonalit stricte auquel cas on attend un F lt 0 pour tous les loci Tester un cart dans n importe quelle direction exc s ou d ficit Il se peut galement que l on s attende ce que les diff rents sous chantillons ou les diff rents loci r pondent dans toutes les directions configurations de tests bilat raux Dans ce cas il y a deux probl mes Le premier assez simple r soudre consiste en l obtention de la P value bilat rale Le second correspond a une d cision statistique globale car il y a en effet autant de P values obtenues que de loci et ou de sous chantillons test s La P value bilat rale s obtient comme suit Il faut faire les deux tests unilat raux ce qui fournit deux P values Soit Pj la plus petite de ces deux probabilit s test 76 Initiation a la g n tique des populations naturelles unilat ral le plus puissant et Pmax la plus grande des deux tes
292. garder un nom de fichier qui permette de retourner ensuite au fichier de donn es correspondantes Ici le premier fichier analys sera IRTotBrut1Ber95E gen femelles de Berne 1995 je choisis donc ici de nommer et cr er le fichier r sultat IRTotBrut1Ber95FBAPSRes txt Ensuite il faut cliquer sur le bouton Clustering of individuals fig 27 Apparait alors une nouvelle fen tre de dialogue qui vous propose diff rents formats de fichiers de donn es fig 28 Choisissez bien entendu le format Genepop en cliquant sur le bouton correspondant Une fen tre qui s ouvre vous permet de naviguer vers le r pertoire o se trouve RTotBrut1 Ber95F gen que vous s lectionnez soit en tapant son nom complet soit en tapant gen et 137 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet a ku Bayesian Analysis of Population Structure Figure 27 S lection dans BAPS du fichier de r sultats El i ta Bayesian Analysis of Population Structure specify Data Format Figure 28 S lection dans BAPS du format de fichier de donn es a analyser Figure 29 Fen tre de s lection de la taille maximale des clusters et du nombre de cha nes d it rations retour chariot et en double cliquant sur le fichier Une question vous est alors pos e Do you wish to save pre processed data cliquez sur No C est alors qu appara t une petite fen tre permettant de s lectionner le nombre
293. glig e mais tr s puissante comme en atteste le maintien de mutations d l t res m me sub l tales des fr quences anormalement lev es NUNNEY et BAKER 1993 Le r gime de reproduction n est pas panmictique Ici aussi plusieurs cas sont possibles Autof condation Ceci nest bien stir possible que chez des organismes hermaphrodites Taenia Echinococcus Fasciola Plasmodium nous ne parlerons pas ici de certains cas de parth nog n se automictique Imaginons que chez de tels organismes une propor tion s de gam tes est investie dans l autof condation et donc 1 s dans des croise ments panmictiques En reprenant notre locus deux all les de tout l heure nous pouvons poser que D H et R sont les fr quences des g notypes 1 1 1 2 et 2 2 la g n ration n respectivement avec D N N H Ni2 N et R N gt N Nous supposerons ici que JV taille de la population est tr s grand Ces individus se repro duisent Quelles seront les fr quences g notypiques la g n ration suivante Pour D par autof condation proportion s des zygotes produits seuls les 1 1 en proportion D et les 1 2 en proportion H de la g n ration n peuvent produire des 1 1 Dans ce cas les 1 1 qui s autof condent ne produisent que des 1 1 on suppose qu il ny a pas de mutation et les 1 2 ne produisent par autof condation que 1 4 de 1 1 le reste tant de 1 2 et de 2 2 Par panmixie 1 s des zygotes o
294. grand Pour visualiser cette relation nous pouvons utiliser les sorties GRA de genepop qui contiennent deux colonnes la premi re avec les distances g ographiques et la seconde avec la distance g n tique 4 Nous pouvons les charger sous Excel en pr cisant que les colonnes sont d limit es par des espaces et tracer le graphique de la figure 57 T T 0 500 1 000 1 500 2 000 2 500 3 000 Distance g ographique en m Figure 57 Repr sentation graphique de l isolement par la distance entre individus des mouches ts ts le long du Mouhoun en zone A Nous avons maintenant besoin d estimer des effectifs efficaces pour essayer d obtenir une id e mais ce sera la louche des densit s 202 Initiation la g n tique des populations naturelles Tableau 26 R sultats de analyse d isolement par la distance entre individus pour les quatre sites A H C D le long de la rivi re Mouhoun au Burkina Faso La pente b de la r gression la taille efficace de voisinage Nb le produit de la densit efficace par la surface efficace de dispersion Do et la P value du test sont donn s ainsi que les moyennes non pond r es pour b Nb et Do Les P value ont t combin es par la m thode binomiale g n ralis e avec MultiTest P value A 0 000322 3105 0 0055 lal 8 02E 06 124725 0 3805 C 6 26E 06 159755 0 2056 D 8 22E 06 21715 030237 Moyenne 8 61E 05 102525 0 0033 Effectifs efficaces Les seules m thodes
295. h mas de diff renciation 147 Structure g n tique sp cifique chaque sexe des donn es brutes sans tenir compte de APS errant mena planes net ideuintiee Sh gnion ent eee een 147 Structure g n tique sp cifique chaque sexe des donn es clusteris es par BAPS 150 Interpr ter l ensemble des r sultats sur les biais de structuration 152 Diff renciation globale et isolement par la distance cccccccccc cece cccceececteeeecsaeesccsueeeetsaeeenteeess 153 D finir diff rents niveaux de subdivision pour l analyse hi rarchique cccccecccceeeeeeeseeeseeueeeeeeeeseeenneees 153 Analyse hi rarchique sur donn es brutes pas de cluster BAPS 153 Analyse hi rarchique sur donn es clusteris es par BAPS ccccccceccccseecccsueceeeseeeeeeseeeeeseeeeeeeeeeeeseeeeeaaes 156 Test d isolement par la distance acc saaisincracisiacasninsindinn uaninsonaitiis gsicndinanineiaunincinanioeiganindininigerasvoxand dea auantaedeaacdeieedzaeds 157 Estimation d effectifs efficaces extrapolation des densit s et de la dispersion 160 332 Initiation la g n tique des populations naturelles Effectifs efficaces des tiques de SUISSE cccccceccccesecccceeecceeeeeecee ee eeeeeeceeeeeeeeeeeeeeeeeeeeeeeseeesessneeeesaneeeeanees 160 Extrapolation des densit s et des distances de dispersion des tiques en Suisse 165 Conclusions sur la biologie et
296. hae A lt 1 ene E E AE en de E E AT 115 Premier recodage des donn es oo cccccccccscscsecsesecsesecsesacsesacsessesecsssecsesesseseesecassecasiecsstessesatsesass 118 Premi res analyses ind pendance entre all les dans et entre loci dans les sous chantillons oo ccc ccc cceececsecsctecsetessetecsetasetatterseterseen 118 Recherche d all les nuls et de dominance d all les courts 125 Convertir le fichier pour Micro Checker et ouverture du logiciel 125 Analyses des loci autosomiques du premier sous chantillon par Micro Checker 125 Analyses des autres sous chantillons des autres loci autosomiques et du locus IRO8 127 Bilan des analyses avec Micro Checker iii 128 D tection de dominance d all les courts par la m thode de r gression multiple ccceeeee 129 Bilan de l analyse des d ficits locaux en h t rozygotes oo cccccccccccccccseeecesseeecesseeecesaeecessaeesensees 134 Recherche d une structure cach e effet Wahlund ceccececececessceecerecesecerecnrentreertens 135 RO OR ie at ee a tele 135 Construction des fichiers BAPS iso eiicysinvniccsrpesciioiciitnaianiwinsniaiosceastyibhundsiininietinsieabiundsiadmiensmiiebaadest 136 Analyse des fichiers par BAPS ie 136 Commentaires sur l analyse des fichiers par BAPS 145 Conclusion sur les d ficits en h t rozygotes 146 Structure des populations et sc
297. helle sub sp cifique 284 Ba aE S AE AAE stents EAA AA sos uaa A AA EN sonaenaute AAT 284 334 Initiation la g n tique des populations naturelles ee I a ee RS 287 RETON E AUX CON nee eee eee een EE 303 Ra A E AN 313 ER P E E eee eee 325 2 FSC www fsc org MIXTE Issu de sources responsables FSC C017278 Imprim en France JOUVE 1 rue du Docteur Sauv 53100 MAYENNE N 2041831D D p t l gal d cembre 2012 La compr hension de l pid miologie d une maladie infectieuse ou parasitaire passe par une connais sance minimale du fonctionnement des populations vivantes concern es Ainsi pour rem dier la difficult d obtenir des observations directes sur la biologie des populations naturelles notamment dans les pays du Sud l utilisation de marqueurs g n tiques permet d avoir acc s travers des m thodes indirectes a des informations cl s sur la biologie des agents pathog nes et de leurs vecteurs cologie mode de reproduction d placements taille des populations etc Un outil pr cieux dans le domaine de la sant o l analyse de la variation spatio temporelle des marqueurs g n tiques peut ainsi tre utilis e pour caract riser la dynamique des populations de para sites et de leurs vecteurs pour conna tre l volution d une maladie infectieuse ou parasitaire valuer les risques d invasions ou d pid mie le potentiel de diffusion de g
298. http wbiomed curtin edu au genepop voir RAYMOND et RoOUSSET 1995b Genepop 4 Rousset 2008 http kimura univ montp2 Concepts de base en g n tique des populations 57 fr rousset Genepop htm ou la version web du logiciel http genepop curtin edu au Il est cependant n cessaire de signaler que si fet F varient entre 1 et 1 tout comme les param tres qu ils estiment Fy et F77 0 quant lui varie entre 1 et 1 alors que le param tre qu il estime Fsr varie entre 0 et 1 Lestimateur du Fs peut prendre des valeurs n gatives car sous l hypoth se d absence de structuration 6 puisqu il est non biais doit tre centr sur 0 valeur attendue sous l hypoth se d absence de structuration g n tique Des valeurs tr s n gatives de 0 correspondront des confi gurations particuli res o les sous chantillons sont plus proches g n tiquement que ce qui est attendu par variance d chantillonnage En effet si on chantillonne deux fois dans la m me population on aura peu de chances d chantillonner exactement le m me nombre d individus de chaque g notype dans chacun des deux chan tillons Il s ensuit une diff rence al atoire variance d chantillonnage prise en compte par 0 dont l esp rance math matique est centr e sur 0 Il est enfin utile de pr ciser que pour plus de deux all les l estimateur moyen pond re par construction les valeurs obtenues pour chaque all le par le facteur p 1
299. i rement d corti quer une nouvelle fois ce jeu de donn es avec les m mes m thodes mais aussi avec des outils plus r cents que ceux qui avaient t utilis s l poque ce qui sera aussi int ressant Nous repartirons de z ro en feignant d ignorer ce qui a d j t fait comme s il s agissait d un jeu de donn es non analys Le jeu de donn es complet est t l chargeable sur mon site web v4 __ ETAT DES LIEUX Les tiques sont des acariens h matophages qui au cours de leur repas sanguin peuvent transmettre des maladies leurs h tes vert br s Dans l h misph re nord ce sont elles qui sont responsables de la tr s grande majorit des maladies vecteur des humains et en particulier de la transmission de la maladie de Lyme dont l impact conomique et en sant publique est reconnu GUBLER 1998 Encore aujourd hui beaucoup reste faire pour mieux comprendre l pid miologie de cette maladie et la variabilit des manifestations cliniques qui la caract rise HuBBaRD et al 1998 Les tiques sont typiquement des organismes difficiles suivre sur le terrain et des approches par marqueur mol culaire semblent donc pertinentes dans ce cas de figure Apr s une tentative peu fructueuse avec les allo zymes avec seulement deux loci peu polymorphes DELAYE et al 1997 des microsatellites ont t d velopp s DELAYE et al 1998 Seuls cinq loci poly morphes avaient pu tre mis au point l
300. ible que si ce dernier a eu lieu dans une fourchette de temps d finie par les limites 0 025 x 2 x N et 2 5 x 2 x N g n rations et o NV repr sente l effectif efficace qui s est mis en place apr s le goulot d tranglement Par cons quent la connaissance de ce temps de g n rations T depuis le dernier goulot d tranglement probable peut offrir une mani re d tourn e d estimer une fen tre probable pour M Ici cette fen tre serait de T 5N 7 0 5N C est ce principe qui a permis d estimer grossi rement les effectifs efficaces probables de la tique du b tail Rhipicephalus Boophilus microplus r cemment introduite en Nouvelle Cal donie comme tr s grands malgr des traitements acaricides soutenus dans les levages bovins de l le Korri et al 2006a Enfin il n est pas inutile de signaler ici que le test de Bottleneck aura tendance donner des r sultats l g rement significatifs quand les populations tudi es sont de petites tailles Dans ce cas il est utile voire indispensable d obtenir des informations sur la taille des populations tudi es par l utilisation de m thodes d estimation 104 Initiation la g n tique des populations naturelles effectifs efficaces par exemple Par ailleurs il ne faudra pencher en faveur d un d effectifs effi le P Il l faud h d goulot d tranglement que si les P values sont tr s significatives et ou si au moins deux et encore mieux les trois mod les de
301. ical and simulation study Evolution 54 1414 1422 Barroux E GouDET J 2002 Statistical proper ties of population differentiation estimators under stepwise mutation in a finite island model Mol Ecol 11 771 783 Barroux E LEHMANN L De Meevts T 2003 The population genetics of clonal or partially clonal diploids Genetics 164 1635 1644 Barroux E Lucon MouLn N 2002 The esti mation of population differentiation with micro satellite markers Mol Ecol 11 155 165 BARNAB C Brisse S TIBAYRENC M 2000 Population structure and genetic typing of Trypanosoma cruzi the agent of Chagas disease a multilocus enzyme electrophoresis approach Parasitology 120 513 526 Barr N Brancu M CHARDONNET L 2001 Role of rusa deer Cervus timorensis russa in the cycle 287 of the cattle tick Boophilus microplus in New Caledonia Exp Appl Acarol 25 79 96 BARTLEY D BAGLEY M GALL G BENTLEY B 1992 Use of linkage disequilibrium data to esti mate effective size of hatchery and natural fish populations Conserv Biol 6 365 375 Barton D E Davip E N 1956 Some notes on ordered random intervals Roy Stat Soc Ser B 18 79 94 BELKHIR K Borsa P CHikHi L RAUFASTE N BONHOMME F 2004 GENETIX 4 05 logiciel sous Windows TM pour la g n tique des popula tions Laboratoire G nome Populations Interactions CNRS UMR 5000 universit de Montp
302. ie 100 p 0 25 Homogamie 100 p 0 75 Figure 6 Perte d h t rozygotie H en fonction du temps en g n rations non chevauchantes 5 our diff rents types de croisements consanguins pour deux all les et pour une fr quence pour diff rents types d t g pour deux all les et p fr q d h t rozygote ty de 12 Pour Phomogamie les r sultats sont donn s dans le cas o le premier all le est dominant avec diff rentes fr quences p de cet all le au locus concern Pour lautof condation et les croisements fr res s urs les valeurs concernent l ensemble des loci alors que pour l homogamie elles ne sont pertinentes que pour les loci concern s par le ph nom ne Dans tous les cas le ph nom ne concerne 100 des gam tes s 1 responsables du caract re Cependant nous pouvons aussi envisager une relation pistatique de l ensemble du g nome sur un locus d vitement de l apparentement En effet la consanguinit peut entra ner un fardeau important il n est donc pas d raisonnable de penser qu il peut tre avantageux de choisir les partenaires sexuels les moins apparent s pour former des zygotes Une descendance plus h t rozygote et donc plus variable pourrait aussi apporter un avantage face des agresseurs para sites Dans ce cas on s attend un exc s d h t rozygotes sur tous les loci utilis s pour cette reconnaissance Ceci peut aussi tre accompli par un biais sexe sp ci
303. ieatedens uaaohiddaetanaeelsasecernd Waxtdaaeeieenedes 46 D finitions en fonction des probabilit s d identit 48 Inf rer Nm partir du Fsz dans un mod le en les 49 Pertinence du mod le RS a eee eee eee ee 50 Autres mod les de populations structur es 51 Estimateurs non biais s des Statistiques Presents te eme EEE kane 51 Mesures de diff renciation g n tique alternatives au For 59 Les R Statistiques cs ppiscodstcissve oicebuseaeinicnts ha bedi lsisie nlecit ond errr 11r ere dest on exp diecarnadracnteciaeised ehivkndpeassassad brain nbiadrwbdearanmbitaneieciuarnts 59 Le F r maximum FS gaia tee cron citaeee ection ar eincted o Gecvins geste essen rit nsdeaatincer staden time aeceened santMenateededuestentanes 60 Diff renciation g n tique par paire d chantillons OU d individus cc ce cecccceeccceeeeeceeseeeeeeueeeeeuaeeeeeaneees 60 Esp ces haplo des et loci WES AUS needed init 61 Le probl me de lhomoplasie none tenant tee tte een 62 Structuration a plus de trOis 1 VC BN Fri cis nie etienne een etre remet ie necessite 62 Probabilit s ou indices d assignement ccccccccccccccecessceecceeseeeseceseeeeseccsseeeeseeteuaeeecestseeeceesteeeeeees 64 Les d s g ilibres AO eee ea ee 65 Tests SOUS OURS en te ee ne a ee ee eee ee ener re 67 CIS Ch eee EEEE ne eee neo CN ee Eee ee rere eee eee eee ene 67 6 7010 100 C0 CRE RS E ETEEN EEEE EEU NEA KOERTE 67 Quest ce gu UN TEST SIA SOUS nee es era ee eee D een 68 Risq
304. ient probablement des all les nuls et autre domi nance des all les courts Ces d ficits restent tr s significativement au dessus de 0 fig 31 ce qui rend bien compte du fait que Hardy Weinberg n est pas une La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 143 n cessit pour parvenir une partition Par ailleurs le Fy fait mieux qu tre faible pour IRO8 il est n gatif ce qui est effectivement ce que nous attendons chez une esp ce dioique pangamique Il semble donc bien y avoir un effet Wahlund contrairement ce que la variance du Frs entre loci pouvait laisser pr voir Reste d terminer si cet effet provient d une micro structuration en groupes familiaux par exemple ou de la pr sence d esp ces ou races d h tes ou groupes adaptatifs ou cotypes cryptiques Afin d essayer d argumenter dans un sens ou l autre on peut essayer de regarder l orga nisation de ces diff rents clusters En principe si on a faire diff rentes esp ces ces derni res devraient appara tre clairement Si on effectue un arbre partir d une matrice de distance inter clusters ces derniers devraient tre regroup s selon les p ce laquelle ils appartiennent en groupes s par s par des branches relativement longues compar es aux branches s parant chaque cluster g ographique en prin cipe l int rieur de chaque esp ce Selon TAKEZAKI et Net 1996 la m thode du Neighbor Joining
305. ifier par le menu Options de Fstat cf le premier recodage des donn es du chapitre 2 de cette deuxi me partie pour une prise en main pas a pas de Create Nous reffectuons pas d autres analyses pour le moment car ces derni res pourraient tre remises en cause par les r sultats obtenus ici La proc dure de test de d s quilibre de liaison est assez lente donc si vous souhaitez que votre analyse finisse avant l ge de la retraite il vaut mieux dans tous les cas s en tenir l option 5 100 pour le Nominal level for multiple testing Mon ordinateur portable dont horloge 2 13 GHz et la m moire vive 2 Go t moignent d une performance somme toute raisonnable a mis quand m me quatre heures pour effec tuer cette premi re analyse dont le r sultat est consultable dans le fichier IRTotTestPanmix out Que pouvons nous voir dans ce fichier Les premi res lignes donnent les fr quences des all les pour chaque locus et chaque sous chantillon ainsi que sur l ensemble moyennes pond r e W et non pond r e La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 119 UW Nous pouvons constater cette occasion que chaque locus sauf IR27 poss de un tr s grand nombre d all les dont la plupart ne suivent en rien le mod le de muta tion attendu de deux pas par deux pas ce sont tous des dinucl otides Dans ce cas la plupart des all les proviennent de mutations intervenues en
306. igni ficativit de ces diff rentes partitions en commengant par la plus incluse le site gt test within loci test Site within NrdWNS nperm 1000 p val 1 0 311 On voit bien que le site comme on le craignait n influence en rien la partition de l information g n tique Nous allons donc supprimer ce facteur de la hi rarchie gt levels lt data frame Cont NrdWessin Nr dWNS gt varcomp glob levels loci l oc bad hn Gd 3 4 ey R08 0 01232344 0 000808808 1 444965e 03 0 4355876 0 4906015 R25 0 01077746 0 002368730 2 440097e 03 0 4535566 0 4658385 I R27 0 29269212 0 001654562 8 948516e 05 0 2579981 0 2624521 R32 0 17763798 0 014577719 1 316236e 02 0 4309008 0 3006536 R39 0 01487489 0 043906268 6 184974e 05 0 2575165 0 6343434 overall Cont NrdWTessin Nr d WNS nd Error 0 47855610 0 02611407 0 01400616 1 83555962 2 15388915 F Cont NrdWTessin Nr d WNS nd Total 0 1061541 0 11194680 0 115053669 0 5222200 Cont 0 0000000 0 00648061 0 009956456 0 4654790 NrdWessin 0 0000000 0 00000000 0 003498519 0 4619924 Nr d WNS 0 0000000 0 00000000 0 000000000 0 4601036 gt test within loci test NrdWNS within NrdWessin nperm 1000 p val 1 0 121 Le facteur NrdWNS s parant les sites Dor naz Gorges du rient de l ensemble des sites suisses du Nord Ouest ne semble pas influencer davantage la structure g n tique des tiques Si nous le supprimons son tour nous obtenons gt levels
307. il faut utiliser mais l exp rience tend sug g rer que cinq est vraiment une limite inf rieure qu il est plus sage d viter quand on peut et que sept commence repr senter un bon chiffre Pour tre informatif un locus doit tre variable on dit polymorphe c est dire qu il pr sente plusieurs all les dans le groupe d individus chantillonn s et g notyp s ce locus On trouvera un exemple sch matique de marqueurs g n tiques polymorphes dans la figure 1 1 Exception faite des virus ARN qui ne sont proprement parler pas de r els tres vivants bien que faisant partie du monde vivant 19 NE MOINE NE NE NE IE Figure 1 rank sch matique chez une esp ce trois chromosomes et o cing marqueurs g n tiques ou loci ont t d finis On notera que dans cet exemple seuls deux loci sont h t rozygotes deux alleles diff rents symbolis s par des couleurs d intensit s diff rentes et que les autres sont homozygotes deux fois le m me all le Les m rites et diff rences entre les diff rents marqueurs disponibles ont t large ment tudi s et ont fait l objet de nombreuses revues plus ou moins exhaustives que l on pourra consulter pour plus de pr cisions RODERICK 1996 SUNNUCKS 2000 CATERINO et al 2000 Je ne ferai donc qu effleurer ce sujet que j ai choisi de sub diviser en trois parties in gales marqueurs cytoplasmiques marqueurs nucl aires dominants et marqueurs nucl
308. imation of effective population size and migration rate from one and two locus identity measures Genetics 157 2911 925 Virauis R Couvert D 2001c Two locus identity probabilities and identity disequilibrium in a par tially selfing population Genet Res 77 7 81 Wainruno S 1928 Zusammensetzung von populationen und korrelationsers chinungen von standpunkt der vererbungslehre aus betrachtet Hereditas 11 65 108 Wana J 2002 An estimator for pairwise related ness using molecular markers Genetics 160 1203 1215 Wane J Warriock M C 2003 Estimating effective population size and migration rates from genetic samples over space and time Genetics 163 429 446 Wav es R S 1989 A generalized approach for estimating effective population size from temporal changes in allele frequency Genetics 121 379 391 Wartes R S 2006 A bias correction for esti mates of effective population size based on linkage disequilibrium at unlinked gene loci Conserv Genet 7 167 184 Wap es R S Do C 2008 LDNE a program for estimating effective population size from data on linkage disequilibrium Mol Ecol Res 8 753 756 WASER P STROBECK C 1998 Genetic signatures of interpopulation dispersal Trends Ecol Evol 13 43 44 WATTIER R ENGEL C R SAUMITOU LAPRADE P VALERO M 1998 Short allele dominance as a source of heterozygote deficiency at microsate
309. ins mobiles que les m les ce sont ces derniers qui devraient tre les plus affect s par ce ph no m ne Ceci est testable en refaisant l analyse sur les tiques femelles et m les s par ment Cela suppose une survie au stress moins bonne des larves et ou nymphes infect es par Bba La cinqui me hypoth se est la plus s duisante Elle implique une manipulation des larves et nymphes par la borr lie Cette borr lie est sp cifique de petits rongeurs Il est donc plus int ressant pour elle d tre inject e dans un petit rongeur peu disper sant que dans un oiseau ou un grand mammif re h tes beaucoup plus mobiles Les Bba capables de manipuler les tiques qu elles infectent de sorte que ces derni res pr f rent se fixer sur un petit rongeur plut t que sur d autres h tes seraient donc avantag es Cette hypoth se est testable en laboratoire mais cela na malheureuse ment jamais t fait Cela implique aussi comme pour l hypoth se pr c dente que les femelles d j tr s peu mobiles seront moins affect es par le biais de structuration Bba sp cifique que les m les Biais de structuration sp cifique au pathog ne et au sexe Nous allons utiliser la m me proc dure que pr c demment mais en divisant le fichier en deux un fichier pour les tiques femelles et un autre pour les tiques m les Cette fois les tests seront faits de mani re unilat rale avec I infect s comme cat gorie la plus philopatrique Il y
310. inter valles de confiance que pour illustration Le Frs global reste donc tr s lev 0 39 inexplicablement variable entre loci et fort variable d un site l autre Ceci sugg re un r le possible pour des all les nuls ou de dominance alleles courts L tape sui vante sera donc de mettre en vidence l existence de tels all les et ou de ph nom ne de dominance 0 8 0 7 7 0 6 4 0 5 0 4 ia By D U Eh IS 02 0 1 IROB IR25 IR27 IR32 IR39 Global Loci Figure 20 Valeurs moyennes du F par locus et intervalle de confiance obtenus pour les microsatellites d Ixodes ricinus avec les m les cod s comme donn es manquantes pour le locus IRO8 Pour chaque locus les intervalles de confiance sont calcul s l aide de l erreur standard donn e par le jackknife sur les populations et la valeur du pour 11 ddl 12 1 la moiti des chantillons et 0 05 soit 2 201 voir le tableau 3 en suivant l quation 45 Pour la valeur globale l intervalle de confiance est issu du bootstrap sur les loci 124 Initiation a la g n tique des populations naturelles RECHERCHE D ALL LES NULS ET DE DOMINANCE D ALL LES COURTS Nous allons pour ce faire utiliser deux nouveaux logiciels Micro Checker va nous permettre d estimer la fr quence des all les nuls susceptibles d expliquer dans chaque sous chantillon et pour chaque locus les d ficits en h t rozygotes observ s
311. ion est la m me que pour le Frs multiall lique et ce sont donc les loci les plus polymorphes qui ont le plus d all les aux fr quences les plus quilibr es qui ont le plus de poids dans le calcul du Frs moyen Enfin il est plus fiable de calculer un F moyen sur plusieurs r plicats ind pendants chantillons la philosophie de pond ration restant la m me additionn des tailles respectives des diff rents chantillons si celles ci diff rent Il convient alors de d finir le Fy comme l indice de fixation ou degr relatif d homozygotie des individus dans les sous populations d o les lettres i et s en indice provenant d une rencontre non 42 Initiation la g n tique des populations naturelles al atoire des all les pour former les individus de chaque sous population La for mule 6 devient NEI et CHESSER 1983 H H rae ree ns 9 ioe o H repr sente l h t rozygotie attendue moyenne sur l ensemble des sites des loci et alleles ou plus exactement la diversit g n tique moyenne sur l ensemble des sous chantillons et H l h t rozygotie moyenne observ e Cependant afin de nous conformer aux notations et expressions modernes il nous faut maintenant exprimer cet indice en fonction des probabilit s d identit entre all les Soit Q la probabilit d identit de deux all les dans un individu un locus prix au hasard et Q la probabilit d identit de deux all les pris au hasard dans
312. iplication asexuce Figure 81 Le cycle de Trypanosoma brucei La ts ts injecte Ph te des trypomastigotes m tacycliques lors d un repas sanguin qui se transforment en stades trypomastigotes sanguins Apr s une phase de multiplication asexu e les trypomastigotes raccourcissent et peuvent alors tre ing r s par une nouvelle ts ts lors d un nouveau repas sanguin sur l h te Dans l intestin moyen de la glossine les trypomastigotes se transforment en trypomastigotes procycliques qui se multiplient par fission binaire Dans l intestin moyen ant rieur les trypomastigotes procycliques se transforment en trypomastigotes m socycliques qui migrent alors dans les glandes salivaires o ils se transforment en pimastigote puis enfin en trypomastigotes m tacycliques de nouveau Sch ma inspir d une figure du TDR Wellcome Trust http www who int tdr diseases tryp lifecycle htm 2005 Garcia et al 2006 En 2000 il a t estim qu environ 300 000 personnes taient infect es et que seulement 10 15 des 60 millions de personnes vivant dans les zones risque taient sous surveillance m dicale GARCIA et al 2006 Gr ce aux mesures de contr le il semble que nous soyons aujourd hui dans un contexte d limination Jamonneau communication personnelle La trypanosomiase animale africaine TAA ou nagana est caus e par diff rentes esp ces de trypanosomes classiquement T brucei brucei Tbb T congolens
313. ique qu ils notent H priori il mest pas n cessaire de s int resser aux autres tests Les r sultats figurent dans le tableau 33 Dans ce tableau nous constatons que le signal est fort puisque significatif partout pour IAM et TPM mais cependant nulle part pour SMM Pour obtenir des P values globales sur l ensemble des fermes nous allons utiliser le test binomial g n ralis de TERIOKHIN et al 2007 impl ment dans Multi Test V 1 2 DE MEEts et al 2009 Il y a huit tests et donc amp 8 Pour IAM cela va vite car toutes les P values 0 00781 On pose directement 0 0001 pour a on clique sur Test for k and look for alpha on laisse k k 2 4 recommand et on clique sur Go Le test ren voie un seuil de 0 0355 qui est tr s sup rieur 0 00785 Pour IAM la P value com bin e est donc inf rieure 0 0001 J estime en effet que des valeurs inf rieures n ont pas de sens en g n tique des populations naturelles et cest pourquoi je ne descends Tableau 33 R sultat des tests de signature de goulot d tranglement r cent chez les tiques Rhipicephalus microplus dans les diff rents levages chantillonn s en Nouvelle Cal donie Les P values correspondent aux tests de Wilcoxon unilat raux Ferme SMM Bouloupari 0 00781 0 01563 021875 Bourail 0 00781 0 00781 0 57813 Canala 0 00781 0 03906 071875 Gadji 0700731 0 01563 071875 La Foa 0 00781 0 02344 0 65625 Poquereux 0 00781 0 01563 0 57813 Port L
314. ique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 269 deux individus soient des immigrants venus d autres sous populations avec une proba bilit P m et qu ils viennent d une m me sous population parmi les 7 1 restantes soit Ps 1 n 1 mais sachant que les 7 1 sous populations peuvent ind pendam ment fournir ces deux individus Par cons quent q P P xP x n 1 ou 2 P 70 ine 1 q ig m Par ailleurs q4 est gal la probabilit de pr lever deux individus de deux sous popu lations diff rentes parmi les 7 puis parmi les 7 1 disponibles avec 7 possibilit s soit P 1 n 1 n 1 xn 1 n 1 et que tous les deux soient des migrants m et que avant migration l un provienne alors d une des 7 1 sous populations res tantes et lautre de cette m me sous population parmi les n 2 restantes soit 2 l l la 2 soit Ps m ln llla 2 UNE 2 ie n 1 in j 1 n l alors que le premier individu soit un immigrant et pas l autre ou l inverse 2m 1 m et que immigrant provienne d une autre des 7 1 sous populations 1 z 1 avec n possibilit s donc Pg 2m 1 m n 1 n 1 2m 1 m Par cons quent nous pouvons crire que gj P4x Ps Po ou encore m n 2 n in 1 l 1 t 2m 1 m Nous pouvons r arranger cette quation l sa q4 2m1 m T n 1 n I 4 l l qy 2m
315. ique uniquement car rien ne prouve que les loci sont li s physiquement proches sur le m me chromosome La liaison physique peut bien s r repr senter une cause possible d un d s quilibre statistique de liaison entre deux loci mais d autres ph no m nes peuvent conduire une telle observation Les syst mes de reproduction fer m s autof condation ou mieux clonalit sont par eux m mes susceptibles de g n rer d importants d s quilibres de liaison entre tous les loci du g nome La s lection naturelle quand elle favorise des combinaisons sp cifiques d all les diff rents loci ou quand elle est pistatique OHTA 1982 CHIPPINDALE et RICE 2001 peut elle aussi tre rendue responsable de la liaison entre certains loci Enfin et ce nest pas la moins importante des causes signaler l interaction entre mutation d rive et migration peut elle aussi g n rer des d s quilibres de liaison entre loci en particulier dans les populations tr s structur es petites sous populations changeant peu de migrants Comme nous n avons g n ralement pas acc s la phase haploide gam tique des organismes tudi s sauf chez des haplo des videmment l estima tion du d s quilibre de liaison ne peut se faire que de fa on composite 12_12 ne peut tre distingu de 21_12 Weir 1979 1996 Parce que les syst mes de repro duction sexu s ferm s comme l autof condation ou la parth nog n se ou encore les
316. iques classiques j utilise des logiciels commerciaux dont j ai la licence Cependant dans un souci de libre acc s tous j ai essay d adapter tous les tests utilis s pour des logiciels gratuits voir la liste des logiciels et URL de t l chargement en annexe Tous les jeux de donn es analys s ont fait l objet d articles publi s dans des revues scientifiques Cependant toutes les analyses pr sent es dans ce manuel n ont pas t publi es pour des contraintes d espace et de lisibilit des articles On ne publie en g n ral pas les simulations et ou analyses annexes redondantes que l on peut tre amen a faire pour v rifier la robustesse de certains r sultats Certaines am liora tions comme l utilisation d une m thode plus puissante non disponible l poque de l article ou parce que je n y avais simplement pas pens l poque sont gale ment pr sent es dans certains traitements des donn es et donc certaines conclusions peuvent parfois tre quelque peu modifi es par rapport l article princeps 114 Initiation la g n tique des populations naturelles a La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet INTRODUCTION Ce jeu de donn es publi dans trois articles DE MEE s et al 2002a 2004a 2004b repr sente un excellent exercice car nous allons y rencontrer bon nombre de situations d crites dans le chapitre pr c dent Nous allons ent
317. iques des loci qu elle affecte Il faut noter cependant que les taux de mutation sont en g n ral assez bas sauf pour quelques microsatellites et que la mutation seule ne peut donc pas repr senter une force tr s puissante de l volution des populations Il ny aurait n anmoins pas d volution sans mutation car c est la seule source de nou veaut h ritable et associ e la d rive et la s lection la mutation repr sente en effet la cl de l volution et de la structure g n tique des populations Migration Les populations naturelles ne sont pas isol es totalement les unes des autres Elles re oivent donc des propagules venant d autres populations plus ou moins loign es 32 Initiation la g n tique des populations naturelles et pr sentant l ensemble du g nome des fr quences d all les plus ou moins diff rentes Ces propagules peuvent tre des individus adultes larvaires des gam tes pollen ou des spores Ils peuvent donc tre haplo des ou diplo des La migration peut tre forte Elle a tendance homog n iser les populations entre elles g n ti quement C est donc une force potentiellement majeure de l volution des popula tions Notons ici que comme nous le verrons plus loin associ e la d rive et la mutation la migration peut conduire en population structur e l tablissement d un polymorphisme stable quilibre d une g n ration l autre et sans l i
318. ir si tenir compte des r sultats de BAPS microstructura tion change cette conclusion Pour ce faire il faut r analyser les donn es en tenant compte des clusters d finis par BAPS Structure g n tique sp cifique chaque sexe des donn es clusteris es par BAPS Nous prendrons ici le fichier de donn es 1996 de Suisse uniquement et les clusters obtenus en ne s parant pas les m les des femelles videmment Il faudra prendre garde ne garder que les clusters contenant au moins une femelle et un m le car sinon Fstat va planter comme on dit Nous allons dans un premier temps effectuer l analyse sur tous les clusters de tous les sites Le label Pop va donc se positionner entre chaque cluster On peut faire le test en unilat ral mais au vu des r sultats vous verrez vite qu il convient de repartir sur une base de tests bilat raux Les r sultats sont en effet spectaculairement divergents des pr c dents tabl 12 Tableau 12 R sultats du test de biais de dispersion sp cifique de chaque sexe d Ixodes ricinus dans les cinq sites du nord ouest de Suisse en tenant compte des clusters obtenus par BAPS en ne s parant pas les m les des femelles et contenant au moins une femelle et un m le Tous les param tres plaident fortement en faveur d un biais de dispersion m le ils dispersent moins avec des P values tests bilat raux tr s significatives sauf pour s AJ et Frs Pour le Fj le test a t r alis en
319. is ensuite suppri mer les colonnes de calculs interm diaires et ne garder que MLG en derni re colonne apr s le dernier locus donc Il faut ensuite rendre ce fichier lisible par Create ce qui nous permettra ensuite de le traduire pour nimporte quel logiciel Par commodit il convient de transformer d abord tous les 0 en 000000 Ensuite il faut s parer les deux all les de chaque locus en collant une colonne de tabulation entre les deux all les de chaque locus on obtient deux colonnes par locus donc Il faut r p ter donc sur la premi re ligne le nom des loci et faire en sorte que le nom de chaque locus ne d passe pas six caract res cer tains logiciels vont les tronquer sinon et ne comporte pas de caract res sp ciaux tels que ou Enfin certains loci ont des all les dont la taille est inf rieure 100 Il faut penser leur rajouter un 0 devant par exemple 085 Il faut coder aussi les MLGs avec trois caract res et dupliquer cette colonne rendre ce locus diploide homozygote Les MLGs seront utilis s pour des tests de randomisations d individus entre sous chan tillons et pour mesurer l indice de diff renciation soit 0 l estimateur du F7 Nous avons d j vu que le Fr ne d pend que de l homog n it interindividuelle dans et entre sous populations la diploidisation homozygote n a donc aucun effet ce niveau En principe nous pouvons commencer Nous allons d j nous d barrasser du
320. is il suffit sous Excel c est facile de faire un copier collage sp cial transposition partir du fichier IRTotIestPanmix lab Ensuite comme repr sent dans la figure 19 construite 4 partir du fichier de sortie nous pouvons voir qu part pour le locus IRO8 aucune tendance claire n appara t Tous ces loci pr sentent des d ficits importants et relativement variables mais sans lien r el avec le sexe des tiques Ce seraient plut t les m les qui auraient une tendance pr senter des d ficits d h t rozygotes plus importants nous verrons plus loin une explication possible Pour le locus IRO8 par contre avec un Frs 1 pour les m les il appara t clairement que ce locus est situ sur le chromosome X et qu il est donc haplo de chez les individus m les e IR08_F m IROS MelIR25_F mIR25 MOIR27_FnIR27 _M IR32_FmIR32 M IR39 FE IR39 M 1 o E E a a g a a E A o o 0 9 o o O 03 m m 7 O O o o 0 7 E E a z O fa 2 0 6 H O O O O O E o 8 E L 0 5 o g O a I O Oo O 0 4 al D E m 5 H o g z oO Q o 0 3 Q O a m O 0 2 6 O e 01 A 9 0 e Q 01 Ber_95 Ber_96 Cen_96 Dor_ 96 Ecl 96 Gor_95 Gor_9 Mon_96 Neu_96 Sta_ 95 Sta_ 96 Tun_96 chantillons Figure 19 Estimations des F5 par locus et par sous chantillon Les abr viations des chantillons sont identiques celles de la figure 15 Les chantillons de femelles sont repr sent s par des ronds et ceux des
321. is si on tire deux individus diff rents 1 1 N la probabilit de tirer deux all les identiques est Qg par d finition ce qui donne bien 1 1 N Q et donc au final si deux individus sont issus d une m me sous populations q la probabilit de tirer deux all les identiques chez eux est 1 N 1 Qyy 2 1 1 N Qso Enfin si les deux individus n taient pas initialement dans la m me sous population 1 g alors la probabilit de tirer deux fois le m me all le est Q7 par d finition Pour finir en ce qui concerne Qz les deux individus tir s de deux sous populations diff rentes pou vaient initialement avoir t dans la m me sous population 44 et dans ce cas la pro babilit de tirer deux all les identiques chez eux est 1 NV 1 Qx3 2 1 IN Qsoa comme vu pr c demment alors que dans le cas contraire 1 q la probabilit de tirer deux alleles identiques est Qr par d finition Nous allons supposer que les sous populations sont de taille VV suffisamment grande de telle sorte qu chantillonner dans une telle sous population ne change pas les fr quences d all les Nous savons qu il y a n sous populations Alors q repr sente la pro babilit que soit les deux individus pris au hasard dans une sous population soient tous les deux non migrants avec la probabilit P 1 m 1 m 1 m et auquel cas ils sont effectivement issus de la m me sous population avant migration soit que ces G n t
322. issociable de loption 8 pour une raison qui m chappe Tapez enfin pour lancer les calculs MSA cr e un r pertoire plein de sous r pertoires pleins de trucs inutiles Int ressez vous ce qu il y a dans le r pertoire Distance data dans le quel se trouve le fichier CAS_Pop txt qui nous int resse Il faut ouvrir ce fichier avec un tableur ou un bon diteur de texte Il contient la matrice des distances harmoniques de Cavalli Sforza et Edwards entre toutes les paires de sous 254 Initiation la g n tique des populations naturelles mega ITITLE Genetic distance data from T brucei 4 Format DstaType distance 4 Descriptiongy a Between Clusters Cavalli Sforca and Edwards Chord Distanced sever Bs Bicrosatellite q BonOOKIA BonOZKIA Bon0 RI Ron04B59 Bon04k1g EBonO4RIA REO OSKIA DULOZETA HODULOERIA 113934 20508 26111 20953 0 085084 0 21383 0 18584 23176 213220 2299679 21730 573629 45882 38105 oonoe oe ceo oO 4 4 0 16667 0 532602 0 43909 0 39050 O0 O0 22307 50151 389437 134547 26948 542300 4233y 3029s 0 158679 0 51877 0 41053 0 38359 0 537144 0 43489 0 41611 0 228369 0 36042 0 22946 Figure 84 Extrait du fichier de donn es de matrice de distances pour fabriquer un NJTree sous Mega les gt gt repr sentent des tabulations Bonon 2
323. it On remarque que l interaction entre facteurs est cod e avec un et que la r gres sion est logistique car on sp cifie bien quelle appartient la famille binomiale avec 170 Initiation la g n tique des populations naturelles un lien logit de la moyenne Le lien logit signifie juste que la fonction qui relie la probabilit moyenne de la variable expliquer Ppg probabilit de trouver une Bba est du type log Ppp 1 PBba et la variance gale Phba 1 Ppp Dans notre cas la variance est en fait inf rieure cette valeur et il y a sous dispersion ce dont nous discuterons plus loin Ensuite il s agit de tester le mod le par la commande gt anova Bbha test Chi Le test est en effet un Chi2 car nous comparons des fr quences Cette commande renvoie au r sultat suivant Analysis of Deviance Table Model binomial link logit Response Bba Terms added sequentially yrst to last Df Deviance Resid Df Resid Dev P gt Chi NULL 857 358 68 Sex t 0 32 856 358 36 do Site 7 35 69 849 322 66 8 290e 06 Year 1 8 84 848 313 83 2 951e 03 Sex Site 1 10 32 841 303 51 0 17 Sex Year L 0 62 840 302 69 0 36 Sex Site Year 4 2 88 836 299 81 0 58 Warning message In method x x varseq lt i drop FALSE y object y weights obj ect prior weights des probabilit s ont t ajust es num riquement 0 ou 1 Nous constatons que seuls les termes Site e
324. it efficace devient donc D 202 tiques par km En utilisant la taille de voisinage calcul e plus haut ainsi que son intervalle de confiance de Bootstrap 4 95 nous obtenons une dispersion entre adultes reproducteurs et leurs parents de 0 33 km 0 22 1 En utilisant le mod le de Rousset 1997 on obtient une estimation du taux de migration entre d mes adjas cents de m 2Do N 0 07 RECHERCHE DE LA SIGNATURE D UN GOULOT D TRANGLEMENT Le logiciel Bottleneck Prry et al 1999 voir aussi CORNUET et LUIKART 1996 que vous pouvez t l charger gratuitement a http www montpellier inra fr URLB bottleneck bottleneck html utilise des fichiers au format Genepop et impl mente son algorithme dans chaque sous chantillon fermes identifi Nous allons donc r utiliser le fichier BoophilusAdultsDataCattleFarm gen le m me que pour les analyses LDNe et Estim Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 241 Lancez Bottleneck Laissez la photo du martin p cheur disparaitre quelques secondes Un panneau appara t tel qu en figure 80 Cliquez sur le bouton Add data file et allez chercher votre fichier dans le menu qui apparait N h sitez pas a taper gen dans la case File name ou Nom du fichier pour trouver les fichiers avec extension gen Ensuite cochez le carr TPM et d cochez les carr s sign test et standardized differences
325. it Nm dans une sous population si cette derni re fait partie d un mod le en les Dans un mod le en les infini compos de sous populations panmictiques la proba bilit d identit entre deux all les pris au hasard entre deux sous populations est nulle En effet si le nombre de sous populations 7 est suffisamment grand cette probabilit est gale Qr 1 n 0 Ceci conduit naturellement ce que Fs7 Qs la probabilit d identit entre all les d individus r sidant dans la m me sous popu lation voir l quation 21 Soit Qs cette probabilit une g n ration quelconque La proportion d all les non identiques dans chaque sous population est donc gale 1 Qu A 1 la proportion d all les identiques se verra augment e par les all les chantillonn s deux fois parmi ceux diff rents au temps Sachant que la probabilit d chantillonner deux fois le m me all le parmi les 2 V existants est gale 1 2N et qu il faut r p ter l op ration 2N fois pour construire une sous popula tion on a donc 1 2N chances de pr lever deux fois le m me all le parmi les 1 Qs qui diff rent au temps Laccroissement de la probabilit d identit dans les sous populations sera donc de 1 Qs 2N et si on ignore la migration nous aurons Qsan Qsoa Qsiy 2N Avec la migration cette probabilit ne reste valable que pour les paires d all les non migrants avec la probabilit 1 1 car le
326. it d ouvrir le fichier TotBrutBorIR txt et dy remplacer dans l ordre tous les 1 en 22 et tous les 0 en 11 et de fusionner les colonnes Site year sex pour obtenir quelque chose de la forme fig 43 Bbss Bba Bog Bhundetf Bern95F 11 11 11 119 Bern95F 11 11 11 119 Bern95F 11 11 11 119 Bern95F 11 11 117 119 Bern95F gt 11 gt 11 gt 11 gt 119 Bern95F gt 11 11 11 gt 119 Bern95F 11 11 11 119 Bern95F gt 11 11 11 gt 119 Bern95F 11 11 11 gt 119 Bern95F 11 11 11 119 Bern95F 11 11 117 119 Bern95F 11 11 117 114 Figure 43 D but du fichier TotBrutBorIRCoOccur txt Enregistrons ce fichier en le nommant TotBrutBorlRCoOccur txt et importons le dans Genetix afin de le convertir au format Fstat Cliquez sur Fichier Importer Choisissez l option fichier texte et double cliquez sur TotBrutBorI RCoOccur txt Choisissez les options s parateur tabulation un chiffre par all le d cochez la case de l identifiant des individus et cliquez sur OK Il faut ensuite cliquer sur le menu Link Dis et choisir Black amp Kafsur comme sur la figure 44 ce qui aura pour effet de lancer une fen tre de choix que vous devrez rendre comme dans la figure 45 Cliquez ensuite sur OK et les r sultats s affichent dans TotBrutBorI RCoOccur lkd Cliquez ensuite sur Outils Conversion et FSTAT et nommez le fichier TotBrutBorlRCoOccu
327. it elle la clart du signal Pour le v rifier il suffit de proc der au m me test mais avec les donn es o un ou deux de chaque sexe individus par cluster avaient t gard s voir p 151 152 Le r sultat change du tout au tout puisque la relation devient tr s significative comme en t moigne la figure 36 Ceci permet de calculer le voisinage Nb 1 6 173 individus Watts er al 2007 le produit de la densit d individus par km par la surface de dispersion des descen dants reproducteurs par rapport leurs g niteurs en utilisant la m thode de La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 159 Un ou deux individus par cluster BAPS F 1 F 0 01 0 006 Ln distance P value 0 003 F a 1 sp Ln distance en km Figure 36 Repr sentation de l isolement par la distance entre sites suisses pour les tiques r colt es en 1996 en ne gardant qu un ou deux individus des clusters d finis par BAPS dans chaque site La distance minimale de 2 km a t choisie Rousset 1997 d crite en premi re partie p 88 90 ce qui donne Do 1 420 00577 13 78 On peut aussi estimer le nombre d immigrants pr sents dans une sous population Rousset 1997 Nm 1 276 28 individus par g n ration Il serait dommage de s arr ter ici et nous allons donc essayer d appr hender m me grossi rement dans quelle gamme de valeurs se situe la densit d
328. itation entre donn es Tab tabulations Cliquez ensuite sur l onglet Data file puis sur Load Allez chercher les fichiers contenant les donn es de Bonon 2000 auxquelles vous affecterez la g n ration 0 et Bonon 2002 auxquelles vous affecterez la g n ration 19 10 g n rations par an comme indiqu plus haut comme repr sent dans la figure 94 262 Initiation la g n tique des populations naturelles Pop t MLG MLGY Bon 39 014 0144 Bon 39 021 0214 Bon 39 022 0224 Bon 39 022 0229 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 026 0264 Bon 39 027 0274 Bon 39 034 0344 Bon 39 036 0364 Bon 39 040 0404 Bon 39 042 0429 Bon 59 008 0084 Bon 59 012 0124 Bon 59 015 0154 Bon 59 017 0174 Bon 59 020 0204 Bon 59 022 0224 Bon 59 029 0294 Bon 59 008 0084 Bon 59 010 0104 Bon 59 010 0104 Bon 59 022 0224 Bon 59 023 0234 Bon 59 029 0294 Bon 59 045 0454 Bon 79 001 0014 Bon 79 002 0024 Bon 79 004 0044 Bon 79 005 0054 Bon 79 007 0074 Bon 79 015 0154 Bon 79 024 0249 Bon 79 032 0324 Bon 79 035 0354 Figure 90 Le jeu de donn es MLG de tous les sous chantillons pour Create avant transformation pour ML
329. ite sont encore beaucoup trop rares CRISCIONE ef al 2005 Les agents pathog nes et leurs vecteurs sont en effet des organismes dont la biologie des popu lations leur cologie leur mode de reproduction d placements taille de popula tions sont difficiles voire impossibles d acc s par observation directe Or la compr hension de l pid miologie d une maladie infectieuse ou parasitaire ainsi que l valuation des risques d invasion ou d pid mie de m me que la perception du risque de diffusion de g nes de r sistance ou de l effet d une strat gie de lutte sur les populations cibles ne peuvent se passer d une connaissance minimale du fonction nement des populations concern es Par cons quent l cologie les modalit s et ou strat gies reproductrices reproduction sexu e ou asexu e croisements au hasard ou autof condation partielle ou totale etc la dispersion la taille des population de parasites et de leurs vecteurs sont des notions cl s qui ne peuvent la plupart du temps n tre inf r es que par des m thodes que SLATKIN 1985 appelle indirectes NADLER 1995 DE Meets et al 20022 b Dans ce cas de figure les m thodes indirectes se caract risent par l utilisation de marqueurs mol culaires g n tiques polymorphes variables et l tude des variations de ces marqueurs dans les individus entre individus et entre un certain nombre de groupes d individus pr d finis comme sous popula
330. kd Toutes pops regroup es racine Ikd F Composantes d Ohta racine oht Fr quences all liques racine fre Traitement sur Totalit des donn es C Une partie des populations et locus Figure 45 Choix a faire dans le menu de Black et Krafsur fichier TotBrutBorIRCoOccur out Vous constatez que seulement 2 640 permuta tions ont t effectu es Recommencez donc avec le niveau 1 100 pour le menu Nominal level for multiple tests Le r sultat peut tre synth tis dans le tableau 18 On y voit clairement une association positive entre Bbss Bba et Bbg m me si les 176 Initiation a la g n tique des populations naturelles Fstat for windows Processing TotBrutBorlRCoOccur dat Fie Options Utilities Biased dispersal Mantelise t Help Gene diversities and F Statetic Pet locus and sample statechic FF Allele hequencies Global statistic Net s Fstatistics I Weir and Cockerham Fstatistics Abo st Fst pes pair of samples PF Genotypic frequencies PF Number of alleles Allelic richness Tests between all pairs of loci Tests between all pars of loci in each sample Nominal level for multiple test f 5 100 100 1 1000 Hardy Weinberg within samples T Hardy Weinberg overall samples Test NOT assuming HW within samples Aun C Test assuming HW within samples I HW tests per locus and sample Nominal level for multiple t Paswase
331. l 2007b DE Meets et al 2010 L introduction unique partir de peu d individus en 1942 est compatible avec la signature d un goulot d tranglement assez fort En fait selon la figure 3A de CORNUET et LUIKART 1996 avec moins de 10 loci une moyenne de 170 alleles g notyp s 85 individus par sous chantillon et 100 de d tection en IAM cette d tection nest possible que si le goulot d tranglement s est fait avec un rapport taille de population avant taille de population apr s 100 1 000 et un para m tre T 0 25 1 Avec 244 g n rations nous obtenons un effectif post bottle neck N t 2T 122 488 ce qui converge bien avec les autres r sultats Si on consid re que la population d origine des premi res microplus colonisatrices avait une taille sensiblement quivalente celle des NV trouv s en Nouvelle Cal donie on peut inf rer que ce nombre W Nala 1 5 tiques c est dire partir d excessivement peu d individus reproducteurs Il est probable qu il s agit d une introduction unique car sinon plus difficile d tecter g n tiquement et donc que les dispositifs de restriction mis en place sur l le ont t efficaces jusqu pr sent Il est clair que la qualit des loci utilis s pas d all le drop out au nombre de six seulement ainsi que celle de l chantillonnage ont seules permis d aller aussi loin dans nos investigations voir m me beaucoup plus loin
332. l Evol 12 313 317 Scuerup M H MiIkKELSEN A M HEIN 2001 Recombination balancing selection and phylogenies in MHC and self incompatibility genes Genetics 159 1833 1844 SCHOFIELD C J KaBayo J P 2008 Trypanosomiasis vector control in Africa and Latin America Parasit Vect 1 24 SHAW C R 1970 How many genes evolve Bioch Genet 4 275 283 SHE J X AUTEM M KOTOULAS G PASTEUR N BonHomme F 1987 Multivariate analysis of genetic exchanges between Solea aegyptiaca and Solea senegalensis Teleosts Soleidae Biol J Linn 00 02 3 57 SHUKER D M Reece S E WHITEHORN P R West S A 2004 Sib mating does not lead to facultative sex ratio adjustment in the parasitoid wasp Nasonia vitripennis Evol Ecol Res 6 73 480 SIEGEL S CASTELLAN Jr N J 1988 Nonparametric Statistics for the Behavioral Sciences Second Edition New York McGraw Hill Inc Simo G Nyroxou E Tume C LUEONG S De Meets T Cuny G Asoncany T 2010 Population genetic structure of Central African Trypanosoma brucei gambiense isolates using micro satellite DNA markers Infect Genet Evol 10 68 76 SKALAMERA J P RENAUD FE Raymonp M De Meets T 1999 No evidence for genetic dif ferentiation of the mussel Mytilus galloprovincialis between lagoons and the seaside Mar Ecol Prog Ser 178 251 258 298 SLATKIN M 1985 Gene flow in natural popula
333. l et chaque locus est impliqu au moins une fois dans une liaison significative ce seuil Nous pouvons conclure qu une liaison statistique tr s significative existe entre tous les loci c est dire que cette association concerne l ensemble du g nome des trypanosomes Exc s d h t rozygotes locaux Globalement il existe un important exc s d h t rozygotes avec un Frs 0 611 et un intervalle de confiance 95 de 0 76 0 473 Cet exc s est tr s significatif P value lt 0 0001 Globalement Fstat ne teste que Fy gt 0 mais il suffit de prendre 1 P value qui est ici de 0 9999 ce qui donne 0 0001 Regardons ce qui se passe locus par locus Dans le fichier T BruceiFoyAnCI amp Guin out il s agit maintenant 256 Initiation a la g n tique des populations naturelles 0 6 7 0 4 T 02 4 i 0 2 wi a 0 4 E 0 6 0 8 T 7 lif T 4 micbg1 micbg5 micbg6 msate4 msate9 m6c8 mt3033 trbpa All Figure 86 Valeurs de Frs par locus et sur l ensemble All intervalles de confiance a 95 de jackknife sur les sous chantillons pour les loci ou de bootstrap sur les loci pour la moyenne globale All de r cup rer les valeurs de Frs smallf par locus sur l ensemble des sous chantillons leur erreur standard de jackknife StrdErrFis sur les sous chantillons over popula tions Pour six sous chantillons donc 6 1 5 ddl le param tre 2
334. l y a un biais de structuration sexe sp cifique 182 Initiation la g n tique des populations naturelles Tableau 21 Compilation des r sultats des tests de diff renciation parmi les tiques infect es par paire en fonction de l esp ce de bact rie pr sente et pour les paires effectivement trouv es Quand plusieurs tests ind pendants sont disponibles ils sont combin s les F7 sont des moyennes non pond r es alors que les P values ont t obtenues par la proc dure Z il y a en effet syst matiquement moins de quatre tests ici Borr lies Sous chantillon For P value Bbss Bba Dor96F 0 0095 0 8577 Gor96F 0 0000 0 6628 Combin s 0 0047 0 8540 Bba Bbundet Mon96F 0 0357 1 Sta96F 0 1025 0 0662 Sta96M 0 0454 0 1687 Combin s 0 0374 0 7657 Bba Bbss Bba Dor96F 0 0501 0 8560 Bbss Bbss Bba Dor96F 0 0004 0 5998 Bba Bba Bbundet Sta96M 0 0269 0 0676 Bbundet Bba Bbundet Sta96M 0 0394 0 8043 signifie la co occurrence de deux esp ces de borr lies ainsi que des diff rences d infection les femelles et les m les sont analys s s par ment Cependant parce que la taille des chantillons est tr s faible peu de borr lies trouv es et identifi es nous combinerons le tout dans un seul fichier gain de puissance On prendra soin de distinguer les tiques d ann es et de sexe diff rents comme appartenant a des populations diff rentes s par es par un pop dans le fichier Quand le fichier est consti
335. lations C est exactement le m me principe que le pr c dent sauf que ce sont les populations ou ce que l on consid re comme telles les sous chantillons qui sont ici r chan tillonn es Attention on ne peut pas faire cela pour le F57 Seul donc le Fy est concern Cette proc dure permet de comparer les loci entre eux Il est en effet important de v rifier si les diff rents loci convergent vers le m me signal car sinon il sera utile de d terminer les causes responsables des discordances entre loci Le jackknife Jackknife sur les loci Ici il s agit de prendre chaque locus un a un et de calculer la valeur du F sur ceux qui restent On obtient ainsi amp valeurs sur lesquelles on peut calculer une moyenne et une variance et donc une erreur standard Lerreur standard d une statistique x valu e sur n mesures se calcule en fonction de sa variance s x voir quation 28 et de 7 selon la formule s x n 44 So Il est ensuite facile de calculer partir de l Pintervalle de confiance voulu IC en faisant l hypoth se que la distribution des jackknives suit une distribution normale ce qui n est probablement pas tout fait exact mais passons ICS Fi tgs 45 o Fest le F de Wright tudi et 1 le param tre de la loi normale pour 1 degr de libert n correspond ici au nombre de loci et au seuil a 0 05 pour un IC 6 Le bootstrap r chantillonne avec remise et peut donc
336. lations de Trypanosoma brucei gambiense en Afrique de l Ouest 271 qu il ny a que deux sous populations telles que Boffa et Dubr ka en Guin e il existe un troisi me foyer Forecariah mais qui reste assez loign et en C te d Ivoire avec Bonon et Sinfra Kasa et al 2006 Enfin dans la mesure o nous avons pu constater que la diff renciation entre foyers tait assez forte nous ferons pour le troisi me cas de figure l hypoth se d une seule population isol e Nombre infini de sous populations C est le mod le d crit dans DE MEEts et BaLLoux 2005 Dans ce cas on montre que puisque 70 2 q 1 ml Tea 1 ml et l 4 n da Le syst me de trois quations 73 devient Qs i t m Let ae Lo i lili wl 0p A 2N N Or FOr Il y appara t clairement que la solution pour Q est Qr 0 et donc l l ml 1 Qi l ml Et le Q A partir de l on peut poser l 1 1 y l m 1 j 1 m Qs 1 1 7 z il m T d o il est facile d extraire pJi m 2 Q 2N Prea ro N Nous pouvons r arranger cette quation 1 ml 2 0 2N F y 1 m 2N y 1 m l2N 2 2N y1 m 2N 2 2N 272 Initiation la g n tique des populations naturelles Sachant que y 1 u nous pouvons poser IE ui m SF Zn OMI alle met Air oP me Nous allons consid rer maintenant que tous les termes en u et m sont n gligeables devant 1 L quation pr c dente peut donc s
337. le http www cefe cnrs fr gene tique et ecologie evolutive patrice david LE CAS TR S SP CIAL DE LA DOMINANCE DES ALLELES COURTS Point de vue th orique La dominance des all les courts ou short allele dominance ou encore large allele dropout est un ph nom ne rare mais possible WATTIER et al 1998 DE MEE S et al 2004a La logique qui se cache derri re ce terme est la suivante Si par un m canisme qui reste mettre en vidence une comp tition existe au cours de la PCR entre les deux portions d ADN correspondant aux deux all les d un m me locus devant tre amplifi s alors il semble logique que ce soit l all le le plus court s il y a une diff rence de taille entre les deux bien entendu qui sera le mieux amplifi Une tentative de mod lisation du ph nom ne peut tre trouv e dans DE MEEUs et al 2004a Dans ce mod le on suppose une population panmictique et un locus pour lequel la PCR favorisera l amplification de l all le le plus court de fa on pro portionnelle la diff rence de taille qui l oppose l autre all le ainsi qu un para m tre variant entre 0 pas de dominance et 1 dominance totale des all les courts Si les all les existant ce locus se rangent dans un ordre de tailles croissantes Tests statistiques 107 de s s et que la fr quence d un all le quelconque est not e p on peut poser que la fr quence observ e d h t r
338. le Ces derniers indiquent que les femelles sont bien mieux assign es que les m les ZA 0 36 et JA 0 56 pour les femelles et les m les respectivement P value 0 0005 et que les femelles sont localement mois diverses g n tiquement 7 0 79 que les m les H 0 81 P value 0 027 ce qui va dans le sens d un biais de dispersion femelle les femelles disperseraient moins Par contre le Fs7 et la variance d assignement r pondent en sens inverse mais non significativement heureusement Pourtant ce sont ces derniers para m tres F57 et variance d assignement qui doivent th oriquement signaler les pre miers un biais de dispersion qui donnent les tests les plus puissants GOUDET et al 2002 Nous discuterons de ce paradoxe plus loin Afin de tester si la Tunisie n est pas responsable seule de ce r sultat recommen ons avec les donn es de Suisse 1996 Dans ce cas on a des r sultats comparables avec une P value 0 0004 pour l assignement mais une P value 0 06 marginalement significative pour Cantonnons nous normal pour la Suisse au Plateau Suisse en excluant le site Monte Ceneri du Tessin Cette fois les P values tombent 4 0 0002 et 0 02 pour les assignements et H respectivement En restreignant l chantillon nage aux sites du nord ouest de la Suisse il faut supprimer les sites Gorges du Trient et Dor naz sans oublier de le signaler en en t te du fichier de donn es il n y a plus que cinq
339. le de croisements pangamiques de 1 b dans une grande population avec un nombre infini d all les nous pouvons poser F b1 4 1 2F Fy 1 40 l quilibre g notypique entre croisements fr re s ur et pangamie F F F2 nous pouvons alors poser que le Fy est une mesure de la consanguinit ainsi cr e et que ce dernier v rifie l galit lt 2Ft Fr 4 D ot on tire facilement 4F IS 1 3F Notons qu il s agit la d une approximation tr s grossi re Fs b R ponse 12 Le crit re d information d Akaike pour choisir le meilleur mod le de r gression LAIC Akaike Information Criterion dont la valeur doit tre minimale est une mesure de la qualit d ajustement d un mod le statistique consid r estim par rap port des donn es Il prend ses racines du principe d entropie en offrant une mesure relative de la perte d information lorsqu un mod le est utilis pour d crire des don n es r elles On peut aussi dire qu il correspond un compromis entre biais et variance ou encore entre la complexit et la pr cision du mod le Il n existe pas d AIC seuil en de duquel un mod le est rejet Il ne s agit donc pas d un test mais d un outil d aide la s lection du mod le le plus simple permettant d expliquer au mieux les donn es le mod le dot du plus petit AIC tant le meilleur Si on pose que est la somme des carr s des r sidus part de la dispe
340. le p re et la m re pour le transmettre au zygote est aussi de 1 2 donc 1 Np i 1 2 1 2 pour le g ne de la grand m re et 1 16N pour le g ne du grand p re Les individus tant diploides cet v nement 306 Initiation la g n tique des populations naturelles poss de deux chances de se r aliser ou deux essais possibles La probabilit pour un individu donn que deux g nes pris au hasard d coulent d un m me g ne anc tre coalescence est donc gale 1 Nt Na IGN 16N 8N N Nous recherchons l effectif efficace N tel qu une population monoique de cette taille d rive la m me vitesse m me coalescence que notre population dio que Sachant que pour une population mono que la probabilit de tirer deux fois le m me g ne est gale T 1 2N on cherche donc JN tel que 7 T soit 1 N f Ny 2N 8N Nin AN N N N R ponse 11 Estimer un taux de croisements fr re s ur partir du F5 CQFD Cette m thode a d j t utilis e dans CHEVILLON et al 2007a Si on observe l vo lution de la consanguinit F entre la g n ration 2 et dans une population o les croisements ne se font qu entre fr res et s urs on obtient l image suivante fig 99 On cherche exprimer la consanguinit d un individu de la g n ration c est dire que l on recherche avec quelle probabilit cet individu aura deux g nes identiques par ascendance issus d un seul g
341. le sexe ratio le biais de dispersion sexe sp cifique ainsi que les strat gies de reproduction PRUGNOLLE et DE MEE S 2002 PRUGNOLLE et al 2003 Ensuite il est probable que l ADNmt ne soit pas enti rement neutre GERBER et al 2001 et ne serait dans ce cas pas le reflet d v nements d mographiques seuls mais aussi de l histoire s lective de la population Enfin ce sont tous des marqueurs haplo des qui ne peuvent par cons quent en aucun cas renseigner clairement sur le r gime de reproduction local de l esp ce tudi e au sujet duquel nous verrons que Leffectif efficace not habituellement N repr sente une mesure de la vitesse avec laquelle une population de taille V perd de la variabilit g n tique par d rive g n tique al atoire En effet l inverse de l effectif efficace 1 N ou 1 2N pour des diploides donne la pro babilit sur le long terme que deux all les d un m me g ne locus pris au hasard dans la population sont des r plicas ou des descendants d un all le unique ancestral Le fait que de tels v nements de coalescence interviennent r guli rement plusieurs g nes des cendent alors d un seul implique que d autres all les doivent avoir disparu Autrement dit la diversit g n tique s rode Le ratio entre l effectif r el de la population W census size qui veut dire taille de recensement en anglais et l effectif efficace WV exprime donc une mesure de la dynamique de quantit
342. les ph nom ne dans ces donn es Nous allons rechercher un possible effet Wahlund comme une cause possible d exc s d homozygotie chez les ts t ts d une m me zone d abord en analysant le F une chelle plus r duite pi ge ensuite par analyse bay sienne de clusterisation comme pour les tiques et enfin en recherchant un isolement par la distance entre individus le long du cours d eau Analyse par pi ge En prenant chaque pi ge comme une sous population potentielle et en recalculant le Fx on obtient une valeur plus faible de 0 144 significativement inf rieure la pr c dente test de Wilcoxon pour donn es appari es comme pour les tiques P value 0 0391 mais toujours significativement sup rieure 0 P value 0 0001 Il semble donc bien que chaque pi ge rec le au moins en partie des mouches plus apparent es que des mouches prises au hasard dans chaque zone A cause de la faiblesse des chantillons Micro Checker ne peut tre utilis ici Nous devons donc trouver une m thode alternative afin de rechercher si les all les nuls peuvent contribuer expliquer les d ficits en h t rozygotes rencontr s Une m thode pratique consiste regarder sil existe une relation entre le nombre de blancs par locus et le Fys effectivement mesur ce locus dans chaque sous chantillon Nous obtenons ainsi les donn es du tableau 25 On lance ensuite une analyse de corr lation Pour plus de s curit on utili
343. les avant la sortie du pr sent ouvrage Vous verrez aussi l application d un autre logiciel de m me nature Flock plus loin dans cette partie Construction des fichiers BAPS Il faut construire un fichier pour chaque sous chantillon Le type est semblable un fichier Genepop mais avec des tabulations comme dans la figure 26 symbolis es par des gt qui donne un exemple pour le fichier des m les de Staadswald On note que les m les sont cod s homozygotes pour IR08 afin que l information multilocus soitpr serv epourcinqloci Parcommodit j aiappel cefichier IRTotBrut1Stad95M gen mais vous faites comme bon vous semble Ensuite il est commode de cr er un fichier texte contenant le chiffre 30 r p t un grand nombre de fois ici 50 fois avec un espace entre chaque r p tition et sur une seule ligne Le logiciel BAPS vous demandera en effet de taper un nombre maximal probable pour les clusters Ici 30 m est apparu comme largement raisonnable compte tenu des tailles de sous chantillons C est partir de ce chiffre que BAPS d marre et recherche une partition la plus probable en se limitant ce nombre maxi mum de clusters Le logiciel reprend ensuite le processus autant de fois que l on a rentr ce chiffre ici 50 et ne gardera que la meilleure de toutes les partitions explo r es Avoir tap 50 fois ce chiffre dans un fichier permet de copier et coller cette s quence directement sans avoir la retaper po
344. les deux Commentaires sur les allozymes Les lecteurs soucieux d approfondir leurs connaissances sur les techniques li es P lectrophor se des prot ines trouveront beaucoup plus d informations dans PASTEUR et al 1987 et BEN ABDERRAZAK et al 1993 Qu est ce qu un marqueur g n tique 25 Locus 2 All le 1 Locus 2 All le 2 Locus 1 ligxddp 0 Figure 4 Cas d une enzyme monom rique cod e par deux loci diff rents dont un celui ayant le moins migr est monomorphe et l autre polymorphe avec deux all les Les allozymes repr sentent ce qu il y a de plus conomique en temps et en argent Malheureusement ils sont rarement polymorphes notamment chez les organismes parasites et requi rent de travailler sur du mat riel frais maintien de la cha ne du froid ce qui s av re souvent difficile en particulier dans les pays du Sud Le mat riel biologique utiliser doit se trouver en quantit suffisante par individu ce qui est souvent difficile avec les organismes parasites souvent de taille modeste si ces der niers ne sont pas cultivables en les clonant Ces loci correspondent des s quences codantes de ADN Leur polymorphisme est de par ce fait souvent suspect de ne pas tre enti rement neutre JARNE et LAGODA 1996 Or la neutralit absence de s lection est une hypoth se qui s av rera importante voir plus bas Ces diff rents arguments permettent d expliquer pourquoi les a
345. les sauvegarder dans un fichier que nous appellerons IR9GCH mig Ce fichier doit tre configur comme pr sent dans la figure 34 From file IRCH964 8 pop Intraclass estimate Fuc st 0 000297 0 0080 0 00129 0 0003 0 0049 0 0040 0 0015 0 0040 0 0085 0 0005 0 0033 0 0116 0 0058 distances 85 534 50 00 46 059 43 42 52 63 7 894 19 74 65 79 26 32 19 7449 105 26 78 95 102 63 102 63 102 634 115 79 82 89 110 53 111 84 113 16 H1 84 q 171 05 218 42 213 16 207 89 190 79 160 53 165 794 00724 0049 0 00159 0224 0 0078 0 01439 0042 0 0015 0 0014 0 00599 0136 0 0132 0 0042 0 0209 0 00894 Oo Oo a Figure 34 Pr sentation du fichier pour tester l isolement par la distance entre sites de pr l vement d Ixodes ricinus en Suisse en 1996 sous Genepop La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 157 Tableau 15 Distances g ographiques en km et diff renciation g n tique mesur e par le F57 Theta par paire de sites d chantillonnage d Ixodes ricinus abr viations comme dans la figure 15 Gor 0 0049 0 0015 0 0049 0 0015 0 0085 0 0224 0 0078 0 0143 0 0005 0 0033 0 0042 0 0015 0 0014 0 0116 0 0058 0 0136 0 0132 0 0042 0 0089 Distance en kilom tres Ecl 85 53 Mon 50 00 46 05 Neu 43 42 52 63 7 89 Sta 19 74 65 79 26 92 19 74 Dor 105 26 76 95 102 03 10263 102 63 Gor Mte 32 09 05 111 84 111516 11 84 Cen ARUS
346. levages de Bos taurus de l le et est devenue r sistante tous les acaricides utilis s contre elle depuis DUCORNEz et al 2005 CHEVILLON et al 2007b Elle semble aussi commencer s adapter un nouvel h te le cerf rusa BARR et al 2001 DE Meets et al 2010 lui m me envahissant en Nouvelle Cal donie mais ceci est une autre histoire que nous naborderons pas ici Plusieurs questions se posent que la g n tique des populations peut aborder sous un certain angle Nous avons pour ce faire r alis un chantillonnage datant de 2003 de 698 tiques adultes pr lev es sur vaches et g notyp es au niveau de six loci deux loci ont t rejet s car donnant des r sultats aberrants voir Korri et al 2006a dans huit levages r partis sur l le fig 62 Le cycle sp cial de cette tique permet de pr dire une forte consanguinit l int rieur des individus h tes due la colonisation massive par une ou plusieurs pontes de tiques fr res et s urs de la m me ponte hautement apparent es entre elles et h t rog nes entre pontes diff rentes On s attend donc une forte homozygotie relative moyenne intra h te fort Frs mais tr s variable d un h te l autre en fonction du nombre de fratries pr sentes corr l e une forte h t rog n it inter h te dans chaque levage fort Fsg avec S pour sous population et E pour levage On com prend qu ici c est l individu h te qui caract riser
347. lit s vrai ou faux pr sence ou absence noir ou blanc ou comme ici significatif ou non Elle est d finie par le nombre d essais ou taille de l chantillon amp les probabilit s Tests statistiques 83 compl mentaires d tat de l v nement p et q 1 p pour significatif et non significatif respectivement et amp le nombre de fois o l v nement significatif a effectivement t observ parmi les N essais Dans notre cas correspond donc au nombre de tests que l on souhaite combiner et au nombre de tests significatifs au seuil de 5 parmi ces k tests On souhaite avoir la probabilit d obtenir par hasard un nombre de tests significatifs aussi grand ou plus grand que amp Cette probabilit est izk P Aj Get 3 48 AR i o k k k 1 k 2 k k 2 Donc si on a dix tests dont cing sont significatifs on a P 0 00006 valeur haute ment significative donc Pour un seul test significatif observ sur 10 cette P value devient 0 4 Il existe depuis peu une version g n ralis e Binomial g n ralis de ce test TERIOKHIN ef al 2007 impl ment e par le logiciel MultiLocus V2 2 DE MEE Ss et al 2009 La philosophie de ce test est d crite en d tail dans l aide qui accompagne le logiciel et je ne reviendrai donc pas dessus La proc dure de Fisher FISHER 1970 qu il ne faut pas confondre avec le test exact du m me auteur car cela n a pas de rapport propose la fo
348. lites les plus polymorphes de par les contraintes issues du m canisme mutationnel de ces s quences particuli res d ADN beaucoup d al l les sont identiques par tat sans tre identiques par descendance ou ascendance en fonction de la direction vers laquelle nous regardons On parle alors d homoplasie Pour certains ce ph nom ne est r dhibitoire en g n tique des populations Tout d abord en ce qui concerne le Fj il a t d montr que ce dernier est virtuellement ind pendant du processus de mutation ROUSSET 1996 En ce qui concerne les mesures de diff renciation nous avons vu avec l quation 25 que le biais du Fsr est proportionnel K K 1 quand K est le nombre d all les possibles Ce biais est donc faible pour des nombres raisonnables d all les La figure 9 illustre bien la modestie de l influence de l homoplasie sur les param tres courants utilis s en g n tique des populations Cette influence quasi nulle sur le F7 notez la faiblesse de l chelle devient rapide ment n gligeable d s que le nombre d all les possibles d passe 5 voire m me 2 quand les taux de mutation sont au dessous de 10 Si on ajoute que les variances des estimateurs de ces param tres sont telles qu il n est pas raisonnable d esp rer une pr cision en de de deux d cimales l homoplasie n est absolument pas un probl me pour le Fys et donc pour les inf rences li es au syst me de reproduction et ne repr
349. llite loci experimental evidence at the dinucleotide locus Gv1CT in Gracilaria gracilis Rhodophyta Mol Ecol 7 1569 1573 300 Watts P C Rousser FE SAccHERI I J LeBLois R Kemp S J THomrson D J 2007 Compatible genetic and ecological estimates of dispersal rates in insect Coenagrion mercuriale Odonata Zygoptera populations analysis of neighbourhood size using a more precise estima tor Mol Ecol 16 737 751 WEDEKIND C Penn D 2000 MHC genes body odours and odour preferences Nephrol Dial Transplant 15 1269 1271 WEINBERG W 1908 Uber den Nachweis der Verebung beim Menschen Jahresh Verein f Vaterl Naturk in W ttemberg 64 368 382 WEI B S 1979 Inferences about linkage dise quilibrium Biometrics 35 235 254 Weir B S 1996 Genetic Data Analysis Sinauer Associates Inc Sunderland Massachusetts Weir B S COCKERHAM C C 1984 Estimating F statistics for the analysis of population structure Evolution 38 1358 1370 WauitLock M C 2005 Combining probability from independent tests the weighted Z method is superior to Fishers approach J Evol Biol 18 1368 1373 Wuittock M C McCaurEy D E 1998 Indirect measures of gene flow and migration FST 1 4Nm 1 Heredity 82 117 125 WHO 2006a Human African trypanosomiasis sleeping sickness epidemiological update Weekly Epidemiological Record 82 71 8
350. llozymes sont aujourd hui peu uti lis s en g n tique des populations naturelles et en particulier en pid miologie mol culaire avec cependant quelques exceptions notables telles que celles repr sen t es par de r centes tudes sur diff rents types d organismes tels que des cafards Corey et al 2001 des dipt res NrKLAssoN et al 2004 des champignons pathog nes ARNAVIEHLE et al 2000 Bapoc et al 2002 DE MEEdSs et al 2002b N BAVI et al 2006 et des parasites kin toplastid s et leurs vecteurs BARNAB et al 2000 Borces et al 2000 Hine et al 2001 BRENI RE et al 2003 Nyroxou et al 2004 Les microsatellites Les microsatellites correspondent des courtes s quences d ADN r p t es en tan dem Le plus g n ralement sont consid r s comme microsatellites les motifs r p t s suivants dinucl otides exemple GTGTGTGTGTGT trinucl otides exemple CATCATCATCATCAT t tranucl otides exemple GATAGATAGATAGATAGATAGATAGATA 26 Initiation a la g n tique des populations naturelles Les mononucl otides sont rarement utilis s car trop instables et les pentanucl o tides et au del deviennent plus rares Au del on a faire ce qui est appel des minisatellites La structure particuli re de ces s quences les rend tr s susceptibles la mutation C est dire que les taux de mutation des s quences microsatellites seront souvent tr s lev s
351. lt data frame Cont NrdWessin gt varcomp glob levels loci l oc 1 a2 Led 4 R08 0 01229331 0 0003464944 0 4351133 0 4906015 R25 0 01083164 0 0004024918 0 4543119 0 4658385 R27 0 29269022 0 0017259148 0 2579689 0 2624521 R32 0 17789976 0 0042513096 0 4354972 0 3006536 R39 0 01487632 0 0438573712 0 2574958 0 6343434 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 155 Soverall Cont NrdWessin nd Error 0 47883861 0 03713116 1 84038709 2 15388915 F Cont NrdWessin nd Total 0 1061668 0 11439947 0 5224453 Cont 0 0000000 0 00921047 0 4657228 NrdWessin 0 0000000 0 00000000 0 4607561 gt test within loci test NrdWessin within Cont nperm 1000 p val 1 0 058 Si nous choisissons de garder le facteur NrdWTessin marginalement significatif P value 0 058 cela aboutit gt test between loci rand unit NrdWessin test Cont nperm 1000 p val 1 0 331 Si on limine le facteur NrdWTessin il faut alors repasser par Fstat Il n y a en effet plus que trois niveaux hi rarchiques avec deux sous populations repr sent es par l ensemble des tiques suisses d une part et par celles de Tunisie d autre part On aboutit un Fsr 0 113 tr s significatif P value lt 0 0001 entre les tiques de Suisse r unies en une seule population et la Tunisie Avec un H 0 832 cela correspond un Fsr Fil FsTimax 0 113 1 0 832 0 673 ce qui est relativement con
352. m Dubr ka 5 16 3 0 315 0 918 10 052 1 65 14 66 0 17 likelihood MLNE Bonon 42 0 050 2 12 Moment Dubr ka 77 0 036 DD Mod le Bonon 0 13 0 05 10 22 infinit Boffa 0 05 0 01 0 10 Le Dubr ka 0 23 0 10 0 45 Mod le Bonon 64 re 109 deux Boffa 25 7 150 10 016 0 005 Infini 0 39 0 26 Infini ues Dubr ka 117 49 223 0 010 0 003 Infini 1 15 0 73 Infini Mod le Bonon DNS SN 2 lls iles Boffa 50 14 100 poire Dubr ka 234 98 446 Moyennes Bonon 68 31 152 0 207 0 112 0 836 1 65 0 34 5 61 Boffa 38 10 75 0 016 0 005 Infini 0 22 10 14 0 10 Dubr ka 106 48 254 0 010 0 003 Infini 1 19 15 16 0 31 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 281 Il est important de sp cifier que pour les m thodes bas es sur les diff renciations spatiales temporelles ou spatio temporelles cest un effectif efficace de g notypes multilocus que l on obtient Des simulations effectu es avec une version de Easypop modifi e par Franck Prugnolle disponible sur demande montrent que dans ce cas on obtient un N tr s inf rieur N taille de recensement Tableau 39 R capitulatif des valeurs utilis es pour le calcul des effectifs clonaux partir des mod les Les Fy ont t calcul s avec les donn es des sept meilleurs loci et en s parant les m thodes d isolement plus d chantillons Les intervalles de confiance des Fjs correspondent aux bo
353. m me sous population alors la r currence d une g n ration l autre pour Qr Qs et Qr peut s crire It Qh 2 Qran am CQ ny l c s iG 5 Qs 1 1t Qe ita 1 4 N E i N Qs 1 4 Qro 69 1 lt Qo 1 Qran 4a N gt ae WN Qsi t 1 da Qro Pour que deux all les restent identiques il faut qu aucun des deux n ait mut nous n gligeons homoplasie soit y Pour Q les zygotes issus de reproduction clonale pro babilit c gardent la m me probabilit de poss der deux all les identiques qu la g n ration pr c dente Parmi ceux issus de reproduction sexu e 1 c ceux issus d autof condations s ont d j deux g nes identiques qui le restent avec la probabi lit Qx ou sachant qu ils n taient pas identiques 1 Qx la probabilit de tirer deux fois le m me apr s autof condation est de 12 soit donc Qr 1 Qyy 2 1 Qx 2 Les zygotes issus de croisements panmictiques 1 s obtiennent deux all les identiques avec la probabilit Qs par d finition Pour Qs la probabilit de tirer deux all les identiques de deux individus de la m me sous population il faut que ces deux individus aient t issus de la m me sous population g Parmi ceux ci on tire deux fois le m me individu 1 2 et ce dernier a les deux m me all les avec la probabilit Qx ou ils ne le sont pas 1 Qr et on tire deux fois le m me avec la probabilit 1 2 ce qui donne 1 N 1 Qxp 2 ma
354. maximum de clusters ainsi que le nombre de cha nes dit rations effectuer fig 29 comme expliqu en p 136 Supprimez le chiffre par d faut 20 et rempla cez le par la cha ne de 30 que vous copiez partir de 50fois30 txt collez cette cha ne dans la case idoine et cliquez sur OK Les calculs d marrent et se poursuivent jusqu la fin o la meilleure partition est sauv e dans IRTotBrut1Ber95FBAPSRes txt Apparaissent un graphique cens repr senter la partition clusters de diff rentes couleurs dont on ne va pas se servir ainsi qu un dialogue final vous demandant si vous souhaitez sauver ces donn es en vue d une analyse ult rieure R pondez non Ceux qui souhaitent plus de d tails sur BAPS et ses diff rentes possibilit s et menus sont invit s consulter la documenta tion livr e avec le logiciel Il s agit ensuite de r p ter le processus avec chacun des sous chantillons Ensuite on charge le jeu de donn es brutes afin de le modifier N oubliez pas de cr er un nouveau fichier de sortie chaque fois Dans chaque fichier de r sultat BAPS sont donn s les clusters avec les individus qu ils contiennent Ces individus sont identifi s par leur rang d entr e dans le jeu de donn es 1 2 3 Par exemple pour les femelles de Berne 1995 le fichier de r sultat donne en d but de fichier RESULTS OF NDI VIDUAL LEVEL MIXTURE ANALYSIS Data yle I RTotBrutlBer95F gen Number of clust
355. mble des sous populations Le Fs7 corres pond la consanguinit entre individus d une m me sous population relativement la consanguinit entre sous populations de la population totale Il mesure l effet Wahlund ou structuration des populations c est dire la part d homozygotie des individus de la population totale d o l indice T provenant de la subdivision de ces derniers en sous populations de tailles limit es indice S on dit aussi qu il mesure la diff renciation g n tique entre sous populations Enfin le Fyr mesure l homozygotie des individus de la population totale r sultant des deux ph no m nes pr c dents H H AO a H H ae 19 T H H Fr a T A partir des quations 19 il est facile d obtenir la relation classique au moins pour les personnes ayant d ja entendu parler de g n tique des populations struc tur es 1 Frm 1 Fr U Fsr 20 Il n est pas inint ressant de pr ciser que ces indices de fixation mesurent gale ment un certain degr la consanguinit des individus celle due au nombre restreint de partenaires dans des sous populations isol es et de tailles finies F57 et celle due aux d viations par rapport un r gime panmictique de repro duction Frs Comme nous l avons vu le Fy varie de 1 1 voir p 41 Le F57 varie de 0 pas de structuration 1 toutes les sous populations sont fix es pour l un ou l autre des all les Le
356. melle ceci peut se traduire par un sch ma discontinu de migration comme pour les mod les en pas japonais stepping stone models Kimura et Weiss 1964 SLATKIN 1985 Le mod le de diffusion peut tre continu dans le cas de mod les en voisinage neighbourhood models WRIGHT 1965 Rousset 2000 LEBLoIS et al 2004 Ces mod les de populations peuvent se pr senter en une dimension comme dans le cas d esp ces inf od es un cotone bien d fini cosyst mes c tiers bordures de chemins de routes de for ts etc deux dimensions paysage quelconque ou trois dimensions milieux aquatiques forestiers etc La figure 8 illustre ces diff rentes possibilit s pour un mod le en stepping stone Dans cette figure les migrants ne peuvent passer que d une population directement adjacente l autre Il existe gale ment des mod les mixtes entre stepping stone et mod le en les voir HARTL et CLARK 1989 317 318 Enfin le probl me des individus ou sous populations marginales en situation de bordure est souvent r solu par la connexion entre elles de ces bords libres aboutissant l tablissement d un cercle mod les en une dimension ou d un tore mod le en deux dimensions Dans de telles configurations de populations plut t que d tudier un Fsy global il est plus informatif d examiner la corr lation qui relie les distances g n tiques avec les distances g ographiques s parant les paires d individus
357. ment ces referees d sobli geants qui empoisonnent si souvent nos soumissions d articles Donc Bbss borr lie d cureuil en Suisse est plus fr quente chez les tiques adultes femelles que m les sugg rant ainsi une pr disposition de ces femelles se nourrir sur cet h te quand elles sont aux stades larvaire et ou nymphal Co occurrence des diff rentes esp ces de borr lies Les diff rentes esp ces de borr lies peuvent se retrouver en comp tition car elles partagent la m me esp ce de vecteur Elles sont donc potentiellement en conflit et on pourrait s attendre un vitement Au contraire il pourrait y avoir association positive si les int r ts convergent ou si l une des deux esp ces immunod prime ses h tes et favorise ainsi l entr e d autres pathog nes Il est donc int ressant de tester si ces borr lies se rencontrent au hasard ou non La probl matique est identique une recherche d association statistique entre deux tats infect non infect de 174 Initiation la g n tique des populations naturelles deux caract res esp ce x esp ce y On peut donc simplement appliquer la m me proc dure que pour un test de d s quilibre de liaison Il suffit donc de coder la pr sence de chaque borr lie comme un locus et l absence par 11 et la pr sence par 22 Il y a donc quatre loci Bba Bbg Bbss Bbundet avec chacun deux all les 1 ou 2 toujours homozygotes ou haploides Pour ce faire il suff
358. mutation convergent vers cette conclusion g utilisation de plusieurs m thodes pour estimer N pourra tre d un grand secours L e 8 pour convaincre les referees toujours r ticents si les valeurs obtenues par diff rentes m thodes convergent bien entendu LE CAS SP CIAL DES ALLELES NULS Pr sentation g n rale Les all les nuls correspondent des all les qu on ne peut pas d celer avec la m thode de d tection biochimique utilis e Ils sont invisibles l tat h t rozygote car r cessifs par rapport aux autres all les et mal d tect s l tat homozygotes blancs car il est souvent difficile de s parer les cas o la manipulation a chou mauvaise amplifica tion mat riel d grad etc des cas o on a r ellement faire un homozygote nul Les all les nuls sont fr quemment rencontr s dans les tudes de g n tique des popu lations naturelles bien que fr quemment ignor s Il est m me probable que bon nombre de d ficits en h t rozygotes document s dans de nombreux articles soient en fait dus ce ph nom ne alors que d autres causes sont privil gi es dans les articles en question Les all les nuls peuvent tre fr quents m me dans le cas des allozymes GAFFNEY 1994 N BAVI et al 2006 o on ne les attend pourtant gu re car ils correspondent dans cette circonstance des enzymes non fonctionnels bien qu in dispensables la vie pour la plupart On augurerait don
359. n 2 La Foa bovin 3 La Foa bovin 4 La Foa bovin 5 Port Laguerre bovin 1 Port Laguerre bovin 2 Port Laguerre bovin 3 Port Laguerre bovin 4 Port Laguerre bovin 5 Total Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 0 004306 0 030853 0 067008 0 039708 0 041236 0 181052 0 141193 0 237409 0 064224 0 087719 00227 0 006741 0 04795 0 070247 0 273734 0 033541 0 003524 0 062013 0 041535 0 016508 0 0455861 0 9084 0 4458 0 1957 0 3115 0 927 0 2836 0 1078 0 0057 0 4947 0 2988 0255 0 9561 0 7655 0 4543 0 0884 0 2091 0 8774 0 0243 0 1094 0 534 0 0468 0 5458 O Ol 0 09685 015575 0 839 0 1418 0 9461 0 00285 0 75265 0 1494 0 12575 052195 0 38275 022715 0 0442 0 89545 0 5613 0 01215 0 9453 0 267 0 0221 P value 0 0219 en unilat ral Si cette corr lation est due 4 des croisements entre fr res et s urs au taux voir plus haut de 16 on aurait obtenu une corr lation beaucoup plus forte Par exemple avec 20 couples r alis s dont 16 donc 3 ont un apparentement de 0 522 car des pleins fr res de consanguinit Frs ont un apparente ment de 1 4x 1 Fys x2 et le reste un apparentement de 2F 0 088 voir r ponse 14 on obtient sur l ensemble des 400 couples possibles et r alis s une cor r lation de 0 35 et une P value bilat rale de 0 0095 Il doit donc exister une autre explication pour rendre comp
360. n Africa Proc Natl Acad Sci USA 106 209 214 Korri M Sorano P BARNAB C De MEEts T BucHETON B N Dri L Cuny G JAMONNEAU V 2007 Genetic characterisation of Trypanosoma brucei ssp by microsatellite typing new perspec tives for the molecular epidemiology of human African trypanosomosis Infect Genet Evol 7 675 684 Kumar S Tamura K Net M 2004 MEGA3 Integrated software for Molecular Evolutionary Bibliographie 293 Genetics Analysis and sequence alignment Brief Bioinf 5 150 163 Kunz W 2002 When is a parasite species a spe cies Trends Parasitol 18 121 124 Lasruna M B Naranjo V MANGOLD A J THOMPSON C EsTRADA PENA A GUGLIELMONE A A JONGEJAN F DE LA FUENTE J 2009 Allopatric speciation in ticks genetic and repro ductive divergence between geographic strains of Rhipicephalus Boophilus microplus BMC Evol Biol 9 46 LATCH E K DHARMARAJAN G GLAUBITZ J C Ruopss O E 2006 Relative performance of Bayesian clustering software for inferring popula tion substructure and individual assignment at low levels of population differentiation Conserv Genet 13299 302 LAWRENCE M J 2000 Population genetics of the homomorphic self incompatibility polymorphisms in flowering plants Ann Bot 85 221 226 Le T H Brar D McManus D P 2002 Mitochondrial genomes of parasitic flatworms Trends Parasitol 18 206 213 LE
361. n a vu que la proportion de 1 1 produite est de p la fr quence de l all le 1 chez les zygotes n a pas de raison d tre diff rente de celle de la population On a donc Daras D Y H 1 5 py 36 Initiation a la g n tique des populations naturelles Pour H seuls les h t rozygotes 7 peuvent produire d autres h t rozygotes n 1 yg n P P y8 par autof condation s pour moiti car le reste se r partit en de 1 1 et de 2 2 comme on l a vu et la panmixie 1 s en produit 2p p2 donc Hyma s 2 H s 2p1 po Pour on a la situation sym trique celle de D Raal 3 LR V4 H 1 s Pr Nous avons maintenant toutes les informations n cessaires pour calculer la fr J41 savoir quence d quilibre des h t rozygotes si elle existe l quilibre plus rien ne bouge par d finition et nous obtenons donc H H H s 2 H 1 s 2p pz et donc H s 2 H 1 z s 2p Pw d o fH 1 WY s 1 s 2p P2 d o H Nous pouvons alors poser ge Un is app p Es 155 l 15 1P2 Er le 2P1P 2 l 3 5 et donc pour D et R on a de la m me fa on D p PA Pi Piha M et R pit pipa 5 DE D apr s l quation 3 on voit que si s 0 on retrouve Hardy Weinberg Sis 1 on obtient H 0 ce qui revient dire qu il ne reste pas d h t rozygotes l quilibre seulement p 1 1 et p 2 2 facile
362. n de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 229 ML Relate File Edit Summary Nulls Relatedness Relationship Input Data Summary Nuls Relstedness ML RELATE Output Runtime 20 04 2010 17 01 53 Data Couples de Canala 61 LIST OF MAXIMUM LIKELIHOOD ESTIMATES OF RELATEONESS bicosF bicooF 1 0000 bicoor aptari bicosr D1CLiF bicosr bic1lim ptaka bicieF b1C03F bicizM bicosFr bicidF bicosF bici4m bicosF bicisr Ey bicosF bicieM 0910 bicosF b1C19F 5000 bicosr ble Lo 2000 bicosm bicosr COQ bicoom bicoomM poga bicosm bicilF bicosm b1C11M b1C03M plc iF bicosh b1C1 M bicosh bIiCi4F bicooM blish aptari aptat i i 0 1621 bicoom bicism J 000D bicoom biCcisF T bicosm bic19mM b1C11F bicosF biC11F bicosm b1c11F bicliF 0000 H1C11F b1C11M 0 1378 bIC11F bici2F ooo00 HLELIF BLELSM J 1598 HICLIF b1C14F DODD bic1iF bicim b1C11F b1C18F biciiF bici1sm b1C11F bicisF b1C11F b1Cc19M Hie liv bicosFr Hic lin a bie TIM bICilF HLC1TiM BLELIM oo oe Figure 71 S lection des r sultats de calculs d apparentement pour les B microplus du premier bovin de Canala dans la fen tre de ML Relate pas Lancez Fstat et allez directement dans le menu Mantelize it et dans le menu File chargez votre fichier Le logiciel vous demande alors un fichier de sortie r sul tats Personnellement je prends le m me nom mais je mets extension man U
363. n voit bien que les diff rents sous chantillons se regroupent essentiellement par esp ce d h tes points de m me couleur dans le nid desquels les tiques ont t chantillonn es et non par la localisation g ographique sauf pour les Guillemenots d Horngya Norv ge septentrionale qui se retrouvent excentr s des autres sous chantillons des tiques de cette esp ce en haut gauche Un r sultat similaire est galement observable dans l h misph re sud pour les tiques de diff rentes esp ces de manchots consulter McCoy et al 2005 Le pourcentage d inertie est pr sent pour les deux axes qui se sont montr s significatifs par permutation Analyse canonique des correspondances ACC LACC CCA en anglais est malheureusement impl ment e actuellement par un logiciel commercial qui s appelle CANOCO TER Braak 1986 1987 TER BRAAK et SMILAUER 2002 Il s agit d une m thode complexe d ordination des donn es visant directement corr ler des tableaux de donn es multivari es ordination des donn es coupl es aux techniques de r gression suivies de tests par permutation des donn es offre une m thode sophistiqu e pour corr ler les donn es g n tiques des variables environnementales Elle offre galement l opportunit d obtenir une pro jection en deux dimensions des centro des barycentres des donn es g n tiques de chaque sous chantillon d fini autour de laquelle une ellipse correspondant Pin
364. nce 95 voir la figure 10 Nombre d observations d une valeur donn e durant le processus 25 Valeur 25 observ e Intervalle de confiance 95 Figure 10 Repr sentation graphique de l obtention de l intervalle de confiance 95 d une mesure partir de la technique du bootstrap Tests statistiques 71 Dans la figure 10 on voit que la valeur observ e n est pas centr e car le bootstrap g n re des distributions d cal es Cette proc dure sert comparer des statistiques F entre diff rents chantillons ou groupes Elle n est pas tr s puissante mais fournit la possibilit de faire des graphiques l gants En g n ral on l accompagne d un autre test plus puissant par exemple un test de Wilcoxon pour donn es appari es par loci si les loci tudi s sont les m mes ou un test de Kruskal Wallis si les loci ne sont pas les m mes les deux tests sont impl ment s dans tous les logiciels de statistiques Attention si les loci ne sont pas les m mes la diff rence observ e entre groupes pourra provenir des loci et non des groupes D une mani re g n rale il vaut mieux s assurer de travailler avec les m mes loci et que ces derniers soient en nombre suffi sant au moins sept De toutes les fa ons un bootstrap sur les loci ne commence avoir du sens qu partir de quatre loci et est vraiment puissant bien au del voir RayMOND et ROUSSET 1995a pour discussion Bootstrap sur les popu
365. ncernant l ensemble du g nome au cours duquel les individus les plus h t rozygotes en nombre de loci sont favoris s survie et ou reproduction accrues H t rosome Synonyme de chromosome sexuel Chez les esp ces dio ques le d terminisme du sexe peut tre chromosomique Dans ce cas la composition en chromosome sexuel diff re entre les deux sexes chromosomes XY des mammif res chromosomes ZW des oiseaux antonymique d autosome H t rozygote tat d un locus chez un individu diploide pr sentant deux all les diff rents antony mique d homozygote Glossaire 317 Hitchhiking Voir Auto stop HLA Human Leukocyte Antigen quivalent du MHC des vert br s pour l homme Homogamie Processus de reproduction sexu e au cours duquel les individus ou leurs gam tes sont d autant plus attir s entre eux pour la reproduction qu ils se ressemblent g n tiquement antonymique de l h t rogamie voir aussi assortative mating Homoplasie Ph nom ne d crivant l identit entre deux all les ne r sultant pas d une parent commune r cente qui sont alors qualifi s d identiques par tat Les microsatellites et plus encore les SNP sont par nature homoplasiques Homozygote tat d un locus chez un individu diplo de pr sentant deux fois le m me all le anto nymique d h t rozygote IAM Infinite Allele Model Mod le de mutation o chaque mutation g n re un nouvel all le qui n exis
366. ncipaux de l analyse faite partir de donn es sur neuf loci enzymatiques Les g notypes B barbus purs sont cercl s de rouge les B meridionalis purs sont cercl s de bleu et les hybrides de vert Chaque rond correspond un poisson les ronds noirs tant les poissons parasit s par D gracile Les individus superpos s m me coordonn es dans le plan sont cercl s de noir Le nuage de points en U invers est typique de donn es changeant progressivement d un tat un autre comme les all les dans une zone hybride et s appelle Effet Guttman WOLFF 1996 On voit bien que les parasites suivent fid lement cette forme en devenant de plus en plus fr quents au fur et mesure que la fr quence des all les de B meridionalis augmente dans le g notype multilocus des individus h tes graphique tir de DE MEEUS et al 2007a Tests statistiques 95 Il existe aussi une astuce conna tre par rapport au fait que ce type d analyse est tr s sensible la pr sence d individus porteurs d un all le rare outliers en anglais En effet les individus porteurs d un all le rare vont tirer le nuage vers eux Le r sultat est n faste car les autres individus se retrouveront compact s dans un nuage trop dense pour qu on puisse y d tecter quoi que ce soit Cela va aussi remettre s rieuse ment en cause toute utilisation des coordonn es car les coordonn es de chaque individu seront alors conditionn es majoritairement
367. nde la distance minimale Comme cela n a pas beaucoup d importance ainsi que nous l avons d j vu et que de toutes fa on le test de Mantel men tiendra pas compte tapez une toute petite valeur 0 tant exclu cause de la transformation log Jai pour ma part tap 0 01 puis Entr e Pour le nombre d it rations de la cha ne de Markhov tapez 1 000 000 Genepop g n re plusieurs fichiers Le premier regarder sinon le seul est celui portant l extension iso On y voit que la r gression de pente 0 00362341 est marginalement significative selon le test de Mantel P value 0 066394 Cette pente est cependant significativement diff rente de 0 selon l intervalle de confiance issu de bootstraps IC 95 0 00039310987 0 0078657635 Ce r sultat est en fait similaire ce qui avait t trouv dans Korri et al 2006a 0 00054 ou Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 237 DE Meets ef al 2010 b 0 0017 qui n avaient pas utilis tout fait les m mes donn es qu ici et avaient consid r chaque infra population s par ment pour gagner en puissance les P values deviennent en effet tr s significatives Nous allons garder nos valeurs puisque nous savons qu isolement par la distance il y a et que cela ne changera de toutes mani res pas grand chose Ici nous avons l illustration de la d cision statistique que doit toujours prendre le biologiste Ici le M
368. ne nouvelle fen tre appara t Il vous faut choisir la variable d pendante qui est ici le statut du couple S lectionnez donc Couple et mettez le dans la case Dependant avec le bouton gt comme indiqu dans la figure 73 Appara t alors la case de la variable explicative qu il faut remplir avec R le coefficient d apparentement Tapez 10 000 pour le nombre de randomisations et sur Run comme dans la figure 74 Dans les r sultats ne gardez ici que la valeur de corr lation 0 18 ici et celle de la P value 0 28 Constatez que cette P value est une P value bilat rale Or nous 230 Initiation la g n tique des populations naturelles SI A2 C2 1 0 2 b1C09 F b1C09 M b1C09 F b1C11 M 0 0 4 b1C09 F biCI2 M 0 0 b1C09 F biCI4 M 0 1636 0 6 b1C09 F biCI8 M 0 091 0 b1C09 F biC19 M 0 0 8 b1C11 F b1CO9 M 0 0468 0 9 b1C11 F b1C11 M 0 1378 1 10 b1C11 F b1C12 M 0 1598 0 b1C11 F biCI4 M 0 0 12 b1C11 F biCI8 M 0 0 13 b1C11 F biC19 M 0 0 14 b1C12 F b1C09 M 0 0 L15 b1C12 F b1C11 M 0 2162 0 16 b1C12 F b1C12 M 0 1 17 b1C12 F b1C14 M 0 0 18 b1C12 F biC18 M 0 1775 0 19 b1C12 F biCI9 M 0 0 20 b1C14 F b1CO9 M 0 0 b1C14 F b1C11 M 0 0 22 b1C14 F biCI2 M 0 0 23 b1C14 F b1C14 M 0 4694 1 24 b1C14 F bIC18 M 0 0 25 b1C14 F b1C19 M 0 0429 0 26 b1C18 F b1co9 M 0 1621 0 27 b1C18 F b1C11 M 0 0 28 b1C18 F biCI2 M 0 0 29 b1C18 F b1C14 M 0 0
369. nes 195 Test de la panmixie dans les quatre zones d chantillonnage 195 Analyse par OR E E A EEEE E E 196 Mise en vidence d une sous structuration l int rieur des zones A H C et D 196 AE 16 O a R T A R A E A eer 197 ES E E E 199 Isolement par la distance entre individus 200 R Sp LAT ck See eee AE PET OEY Oe OT OR Bee nett ee SEP REE OR TREE Ee ne ar 203 DE R eae NA AAA AANA dees EA uaa aust AA E eee eens 208 Conclusions isolement par la distance intra zone rolling on the river c e 209 Diff rentiation entre les quatre zones 210 Analyse HierFstat du jeu de donn es total partitionn par BAPS essees 210 Comprendre le manque de structure inter zones avec un peu de th orie 211 Comprendre le manque de structure inter zones avec un peu de simulations 213 CONCUSSIONS ptestycoecietecencacu ees ecto arnt nee nasa E E EEE E den oe EEEE DE 216 Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus h t rog n it locale dispersion et goulots d tranglement 0 cee eeteeeeteeeeeetees 217 RO OS ON EEE no keep hee ae te eevee E A cere eee EA 217 SE Ca ne Cr 217 Analyse de la consanguinit relative intra h te 220 Table des mati res 333 Homozygotie et d s quilibre de liaison intra h te ccc cccecccccccccccee ee eeeceeecceteeeeeeeeeceesettaeeeeeeeens 220
370. nible WANG et WuiTLock 2003 Un logiciel appel MLNE estimant N et m en m me temps peut tre t l charg gratuitement a partir de http www zoo cam ac uk ioz software htm D tection de goulots d tranglement Ce paragraphe figure ici car les notions d effectifs efficaces de goulot d tranglement bottleneck en anglais et de biologie de la conservation sont troitement li es Une population qui subit une forte r duction d effectif goulot d tranglement va avoir tendance pr senter une r duction simultan e du nombre d all les par locus et de Tests statistiques 103 leur diversit g n tique que nous avons plus haut appel e H Durant un goulot d tranglement le nombre d all les est r duit plus fortement que la diversit g n tique Il en r sulte qu une population ayant subi un goulot d tranglement r cent pr sentera une diversit g n tique sup rieure celle attendue l quilibre mutation d rive compte tenu du nombre d all les observ s sous l hypoth se d une taille constante de la population Plusieurs mod les de mutation peuvent tre utilis s selon les situations Selon CORNUET et LUIKART 1996 dans le cas de microsatellites il vaut mieux utiliser le mod le de mutation SMM ou deux phases m me si c est avec un IAM que la d tection semble la plus ais e Il s agit donc de faire un choix entre ce qui de la d tection ou de la non d tection d un goulot d
371. nibles La pr sence ou l absence de chaque esp ce de borr lie trouv e est not e par un 1 ou un 0 dans la colonne cor respondante Un grand nombre de borr lies n ont pu tre d termin es au niveau de l esp ce colonne Bbundet et seules trois esp ces ont t trouv es B burgdorferi Bbss B afzelii Bba et B garinii Bbg trouv e trois fois Distribution des diff rentes borr lies dans les femelles et males d ricinus Pour cette analyse nous allons devoir effectuer une r gression logistique pour chaque esp ce de borr lie Bbundet Bbss et Bba Bbg trop rare sera laiss e de c t On va chercher expliquer la pr sence de telle ou telle autre esp ce de borr lie par le site l ann e et le sexe de la tique ainsi que les interactions Nous allons donc avoir besoin de R une fois de plus Comme c est le sexe que l on souhaite tester ici nous allons mettre ce facteur en premier l ordre compte dans les mod les de R Apr s avoir lanc R et s tre positionn dans le r pertoire appropri on tape les commandes suivantes gt data lt read table TotBrutBoriR txt header TRUE gt attach data afin de faire lire l ensemble du jeu de donn es R NB le gt est automatiquement ins r par R On sp cifie ensuite le mod le en tapant la commande sur une ligne gt Bba lt glm data formula Bba Sex Site Year Sex Site Sex Year Sex Site Year family binomal link log
372. nk logit gt summary Bbss ce qui renvoie au r sultat suivant je ne garde que ce qui est le plus utile Coefycients Estimate Std Error t value Pri gt tl Intercept 20 31649 1194 11613 0 017 0 9864 SexM 0 76071 0 31416 2 421 0 0157 SiteCeneri 0 07671 2020 60021 3 80e 05 1 0000 SiteDorenaz 19 46080 1194 11614 0 016 0 9870 SiteEclepens 19 00830 1194 11616 0 016 0 9873 SiteGorges du Trient 16 48119 1194 11620 0 014 0 9890 SiteMontmollin 17 41997 1194 11624 0 015 0 9883 SiteNeuchatel 17 083837 1194 11618 0 014 0 9886 SiteStaadswald 0 10793 1486 92130 1 26e 05 0 9999 SION Es Codes 0 FF 0 001 D201 205 G1 1 Dispersion parameter for quasibinomial family taken to be 0 5155861 Nous voyons donc que le le coefficient de dispersion est petit 0 52 il y a donc bien sous dispersion pour Bba 0 93 il ny a pratiquement pas de sous dispersion La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 173 pour cette esp ce ci Nous voyons galement que le sexe des tiques est important significatif avec une estimation n gative pour les males les donn es partielles corrig es des autres effets sont centr es sur 0 Ceci est v rifiable en tapant la commande anova Bbss test F les mod les quasi se testent avec un F ce qui donne Df Deviance Resid Df Resid Dev F Pri gt F NULL 857 286 155 Sex 1 12233 856 278 922 14 029 0 0001922 Site 7 80 730 849 198 192 22 369 lt 2 2
373. nt au hasard panmixie globale et H correspond a l h t ro zygotie moyenne attendue si les individus se croisaient au hasard l int rieur de chaque sous population panmixie locale En fait pour le cas le plus g n ral Hy et H correspondent respectivement la diversit g nique de la population totale et celle trouv e au sein des sous populations moyenn e sur l ensemble Les statistiques F de Wright 1965 D finitions classiques Il est possible que les sous populations de notre mod le en les ne soient pas panmictiques Dans ce cas le d ficit en h t rozygotes global r sultera de deux effets 46 Initiation la g n tique des populations naturelles effet Wahlund et l effet des croisements non al atoires dans les sous populations On aura alors NEI et CHESSER 1983 H H E IT H 18 Nous pouvons ainsi d finir les trois statistiques F de Wright ou indices de fixation de Wright Le Frs I pour individu et S pour sous population mesure la consan guinit des individus eux m mes relativement la consanguinit entre individus d une m me sous population parent C est aussi une mesure de la part d homo zygotie qui provient d une d viation par rapport au r gime de reproduction pan mictique id al dans les sous populations rencontre au hasard des gam tes dans chaque sous population on dit souvent aussi que le Fy mesure le d ficit en h t rozygotes local moyen sur l ense
374. nt n gliger les termes en u devant 1 ce qui donne e l gs 8 Null q t fe g 79 24 24 1 V9 a 8 Nul1 7 t 1 g Nous allons maintenant poser que q 1 2m 1 m lt 1 Cette valeur maximale corres pond ici m lt 1 En effet dans le cas de deux sous populations m 1 est quivalent une absence de migration puisque cela signifie que tous les individus d une sous popu lation migrent ensemble dans l autre et vice versa Nous allons en fait ne consid rer que les cas o 0 lt m lt 0 5 o m 0 5 correspond dans ce cas au maximum d change de migrants possible Nous pouvons donc simplifier le syst me d quations 79 en Fs 1 nn MEN DURE For 2gs 1 ne re 276 Initiation la g n tique des populations naturelles gt 8NuF ys t Fis J 8 Nut 1ll1 q For Aug gt Qu D CE L 8uFrs q 8 Nui 1 For 4u gt 2u 8 Nut 1 For gt Fret 1 Nn 24S 8ul 7s g _ 8 Nut 1 Fort 2u es 8 Nut 1 For Au gt F 1 Ner E SuFrs Fret 1 8 aa Es u t 1 Fort 2u DAE Port 2u 8uFrs Fis qs l Frot 1 8 PRIT ut 1 Fort Au l IS Port Au 8ul 7s Firs gt Fret 1 ey aS SU Ts F 80 Qu ST a Frs _ 2uFrs ST S F Au Fe 4uF ys Por G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 277 Nous savons aussi qu ici 7 2 sous populations g 1 2m 1 m soit g l 2m 2m gt PE 2 2 2 mtm n n N
375. nt possibles et en particulier le calcul de diff renciation entre populations Fs7 Selon le logiciel d analyses tudi il suffit juste de coder les donn es d une mani re sp ciale en g n ral on code les individus homozygotes tous les loci Certaines esp ces ont une reproduction sexu e avec des sexes s par s esp ces dites dio ques ou gonochoriques Chez ces derni res il peut arriver que le d terminisme du sexe soit chromosomique Dans ce cas l un des deux sexes est d termin par la possession de deux chromosomes identiques alors que le second sexe est d termin par une h t rog n it ce niveau d o le terme h t rogam tique qualifiant ce der nier Dans le sexe h t rogam tique un chromosome d termine le sexe chromo some Y ou chromosome W il my aura en g n ral que tr s peu de g nes et rarement les m mes loci que sur l autre chromosome Dans certains cas c est m me son absence qui d termine le sexe m les X0 par exemple Il y aura donc pour les individus h t rogam tiques haplo die de fait pour les loci situ s sur les chromo somes sexuels en g n ral donc sur l X ou le Z Les mammif res et les drosophiles CHIPPINDALE et Rice 2001 ont par exemple un d terminisme du sexe XY femelles XX et m les XY C est galement le cas de la plupart des tiques Argasidae et Ixodes KiszEwsKI et al 2001 Les oiseaux ont quant eux un d terminisme du type ZW ZZ femelles ZW
376. nterven tion d une quelconque forme de s lection On peut m me observer dans certains types de populations structur es l tablissement d un cline g ographique des fr quences all liques S lection La s lection est videmment une force majeure de l volution Elle peut prendre de multiples formes et peut affecter un quelques uns ou plusieurs loci en m me temps et agir diff rents niveaux g nomique individuel populationnel avec diff rents effets et interactions Il s agit donc d un domaine d investigation tr s large Nous ne passerons en revue que quelques exemples parmi les plus simples et les plus utiles la suite de notre propos S lection directionnelle Comme son nom l indique la s lection directionnelle tend augmenter ou diminuer la fr quence d un all le dans la population en affectant la survie ou la reproduction des porteurs de cet all le pour le locus concern La vitesse du pro cessus d pend de la force de la s lection de la dominance ou r cessivit de l all le vis vis de la s lection du syst me de reproduction et de la taille de la population Sans mutation l aboutissement de cette s lection est la fixation de l all le le plus favorable la survie et ou reproduction des individus qui le portent Cette s lection n est d tectable qu exp rimentalement ou par des tudes corr latives car seule elle n affecte pas ou tr s peu le sch ma g noty pique p1 2
377. ntially rejective multiple test procedure Scand J Stat 6 65 70 Hoocstraa H AESCHLIMANN A 1982 Tick host specificity Mitt Schweiz Entomol Ges 55 5 32 Hussard M J CANN K J BAKER A S 1998 Lyme borreliosis a tick born spirochaetal disease Rev Med Microbiol 9 99 107 HURTREZ BOUSSES S Duranp P JABBOUR ZAHAB R GU GAN J E MEUNIER C BARGUES M D Mas Coma S RENAUD F 2004 Isolation and characterization of microsatellite markers in the liver fluke Fasciola hepatica Mol Ecol Notes 4 689 690 Jamonneau V BARNABE C Korri M SANE B Cuny G Sorano P 2003 Identification of Trypanosoma brucei circulating in a sleeping sick ness focus in C te d Ivoire assessment of genotype selection by the isolation method Infect Genet Evol 3 143 149 Jarne P Lacopa J L 1996 Microsatellites from molecules to populations and back Trends Ecol Evol 11 424 429 JoNGEJAN E UILENBERG G 2004 The global importance of ticks Parasitology 129 S3 S14 Kasa D Dje N N CourTN E Ore E KOFFI M Garcia A JAMONNEAU V SOLANO P 2006 The impact of war on the evolution of sleeping sickness in west central C te d Ivoire Trop Med Int Health 11 136 143 KALINOWSKI S T 2002 Evolutionary and statis tical properties of three genetic distances Mol Ecol 11 1263 1273 KALINOWSKI S T WAGNER A P Taper M L 2006 ML RELAT
378. nu des fr quences g notypiques observ es Dans ce cas la P value du test sera simplement la somme des probabilit s aussi faibles ou plus faibles que celle observ e dans le sous chantillon voir le syst me d quations 25 divis e par la somme de toutes les probabilit s obtenues lors de la proc dure de randomisation Autrement dit si Pop est la probabilit du tableau des g notypes observ s pour la paire de loci L1_L2 dans le sous chantillon S1 P la probabilit d occurrence d un tableau randomis et Rand le nombre total de randomisations nombre de fois que les g notypes ont t recombin s librement alors la P value du test de d s quilibre de liaison sera i Ran r Le pac a 47 C est ce qui est fait dans Genepop 3 4 Raymond et Rousset 2003 mis jour de Raymon et Rousset 1995b On peut aussi calculer une autre statistique telle quun G comme dans le logiciel Fstat 2 9 3 GOUDET 2002 mise jour de GouDET 1995 et Genepop 4 RoussET 2008 ou sur un coefficient de corr lation comme dans Genetix 4 03 BELKHIR et al 2004 ou encore sur un estimateur mul tilocus comme dans Multilocus 1 3b Agapow et Burt 2003 mis jour d AGapow et Burt 2001 A partir dici plusieurs points importants doivent tre pr cis s Nombre de randomisations Certaines proc dures de randomisations peuvent tre tr s gourmandes en nombre de randomisations Ce nombre sera fonction du nombre de combinaisons
379. nzyme t tram rique Locus III 2 Figure 3 Ror non sch matique des diff rents types de profils rencontr s avec des loci enzymatiques polymorphes Le Locus I montre trois all les diff rents 1 2 et 3 et enzyme correspondante est monom rique puisque les h t rozygotes pr sentent deux bandes ou taches Le Locus II correspond une enzyme dim rique avec trois all les galement Dans ce cas les h t rozygotes pr sentent trois bandes ou taches une tache pour chacun des deux homodim res et une tache centrale et plus importante correspondant la combinaison des deux ou h t rodim re Le Locus III correspond une enzyme t tram rique avec deux all les Les taches des h t rodim res sont toujours plus grosses que celles des homodim res car statistiquement plus probables il est facile de le v rifier en construisant un tableau L interpr tation g notypique de ces diff rents loci devrait donc tre 1 1 2 2 3 3 1 2 1 3 et 2 3 pour A B C D E et F aux loci I et II et 1 1 2 2 et1 2 pour A B et C au locus III Autres cas Une m me fonction enzymatique peut tre assur e par plusieurs loci g nes Dans le cas de deux loci il y aura donc deux types de bandes a interpr ter La figure 4 donne un exemple d une enzyme correspondant a deux loci avec un locus monomorphe et l autre monom rique et polymorphe deux alleles Cependant il existe des cas o les deux loci sont monomorphes ou polymorphes tous
380. oci Nous allons pour ce faire cr er un nouveau fichier o les sites et les dates seront dis tingu s mais aussi le sexe des tiques car on ne sait jamais l avance si des diff rences peuvent exister entre les deux sexes PRUGNOLLE et DE MEE S 2002 PRUGNOLLE et al 2003 auquel cas les r sultats obtenus pourraient s en ressentir mais surtout la discussion serait r orient e Donc autant distinguer le sexe des individus d s le d part quitte ignorer ce facteur par la suite si on ne voit rien Nous allons nommer ce fichier TRTotTestPanmix dat et le mettre au format Fstat qu il faut donc t l charger et ouvrir pour voir comment constituer un fichier ce format Vous pourrez aussi cr er un fichier contenant le nom des sous chantillons IRTotTestPanmix lab car un fichier de donn es Fstat ne contient que des chiffres Ce fichier est constitu d une colonne avec le nom des sous chantillons Vous pourrez aussi coder les donn es au format CREATE qui n existait pas au moment de r analyser ces donn es et vous servir de ce logiciel pour convertir ce fichier au format appropri PREMIERES ANALYSES INDEPENDANCE ENTRE ALLELES DANS ET ENTRE LOCI DANS LES SOUS CHANTILLONS Nous allons donc tester s il existe des d ficits en h t rozygotes et des d s quilibres de liaison Pour ce faire il faut ouvrir Fstat Une fois dans Fstat il faut ouvrir le fichier IRTotTestPanmix dat et cocher les cases qui vont nou
381. ocus par all le et sur l ensemble des all les sur l ensemble des loci Puis suivent les r sultats des jackknives et bootstraps et enfin des permutations En compilant ces r sultats dans le tableau 7 et la figure 17 nous constatons de tr s forts et tr s variables d ficits en h t rozygotes tous tr s significa tifs avec des P values toutes inf rieures 0 0001 visibles en fin de fichier Tableau 7 Valeurs moyennes de f estimateur du F5 par locus et intervalle de confiance tels que d finis par Li et Ls limite inf rieure et sup rieure obtenus pour les microsatellites d Ixodes ricinus Pour chaque locus Li et Ls sont calcul es l aide de erreur standard StdErrFis donn e par le jackknife sur les populations et la valeur du pour 23 ddl 24 1 et a 0 05 soit 2 069 voir le tableau 3 en suivant l quation 45 Pour la valeur globale Pintervalle de confiance est issu du bootstrap sur les loci Global Moyenne 0 489 0 490 0 490 0 624 0 315 0 475 Li 0 286 0 440 0 422 0 533 0 253 0 386 Ls 0 692 0 540 0 558 0 715 037 0 562 StdErrFis 0 098 0 024 0 033 0 044 0 03 120 Initiation la g n tique des populations naturelles 0 7 0 6 w 0 5 N E E o 0 4 i m _ 0 3 i _ 0 2 EE IROS IR25 IR27 IR32 IR39 Global Loci Figure 17 Valeurs moyennes de f estimateur du F5 par locus et intervalle de confiance obtenus pour les microsatellites d Ixodes ricinus Pour chaque locus les int
382. ocus et dans chaque sous chantillon la valeur du Frs pour chaque all le On peut demander Genetix de le faire en choisissant 4 chaque traitement le locus et le sous chantillon a La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 129 analyser en noubliant pas de zapper les males au locus IRO8 On peut aussi cr er autant de fichiers Fstat qu il y a de sous chantillons analyser ensuite et parce que malheureusement Fstat ne permet pas d analyser qu un seul sous chantillon il faut cr er dans chaque fichier une deuxi me population fictive de taille identique 4 celle analyser et fix e tous les loci par exemple tous homozygotes 170170 150150 123123 235235 129129 pour les cing loci respectivement Il s agit ensuite de r cup rer dans chaque sous population les F7 de chaque all le pour chacun des cinq loci et de cr er cing fichiers de donn es un par locus contenant pour chaque allele son Frs sa taille on s en doute le sous chantillon sa fr quence all lique p dans ce sous chantillon le produit p 1 p le nombre d individus g notyp s dans ce sous chantillon N et enfin le produit p 1 p N Le tableau 9 donne une id e de la forme de ce fichier pour le locus IRO8 que j ai appel IRTotL08MalMangqFisAllSizeL08 xt Pour fabriquer ce fichier une feuille de calcul Excel est id ale ensuite il suffit d enregistrer le fichier en format texte seul On peut aussi utiliser
383. ocus et sur l ensemble Tous correspond l erreur standard de Fstat Il s agit de comparer maintenant les F de chaque loci et leurs intervalles de confiance de jackknife sur populations voir p 70 74 en partie 1 avant et apr s clusterisation par BAPS ainsi que les valeurs globales et leur intervalle de confiance de bootstrap sur les loci voir p 70 74 en partie 1 La compilation des r sultats prend alors la forme de ce qui est repr sent dans la figure 31 Dans cette figure il est ais de voir que les clusters de BAPS pr sentent des d ficits en h t rozygotes significativement inf rieurs au Frs de d part Un test de rang de Wilcoxon pour donn es appari es confirme cela Pour effectuer ce test sous R il faut construire un fichier avec une colonne Delta o chaque ligne correspond a un locus Chaque valeur repr sente la diff rence entre le Fy brut et le Fy BAPS au locus cor respondant ici cinq valeurs Appelons ce fichier DeltaFisBrutBAPS txt Ensuite sous R les commandes sont les suivantes gt data lt read table DeltaFisBrutBAPS txt header TRUE gt attach data gt wilcox test Delta alternative greater Le test est unilat ral car ce que nous recherchons est bien un effet Wahlund Nous attendons au d part une chute du Frs d o l instruction greater La P value 0 031 obtenue est significative Notons aussi que la plupart des loci mis part IR08 gardent un fort Frs qui prov
384. oin de recoder les males homozygotes pour les locus h t rosomiques on obtient une forte valeur pour Fsz 0 22 et une valeur n gative pour Fz 0 03 Il semble que toute l information soit contenue l int rieur des zones et quil ne reste plus assez de variation pour distinguer les zones entre elles Le sup plementary information de ROUGERON et al 2009 pr sent ci dessous permet de mieux comprendre ce probl me inh rent aux statistiques F hi rarchiques et renforc par homoplasie des microsatellites Comprendre le manque de structure inter zones avec un peu de th orie Quand nous avons comme c est le cas ici quatre niveaux hi rarchiques indivi dus sous populations archipels et totalit quatre param tres d identit peuvent tre d finis Q la probabilit que deux all les d un locus d un individu pris au Figure 61 Repr sentation sch matique d une population structur e en quatre niveaux hi rarchiques individu sous population archipel et population totale d apr s ROUGERON et al 2009 Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 211 hasard soient identiques Q la probabilit que deux all les un locus de deux individus pris au hasard dans la m me sous population soient identiques Q la probabilit que deux all les un locus de deux individus pris au hasard dans deux sous populations diff rentes dans un m me archipel
385. ologie de ces pathog nes reste largement mal connue et les r sultats obtenus pr c demment par nos analyses suscitent un certain nombre de questions S il y a sp cificit diff rente des tiques immatures sachant que les borr lies sont sp cifiques des h tes les tiques des deux sexes devraient pr senter des pr valences diff rentes pour les diff rentes esp ces de La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 169 borr lies En particulier les femelles devraient porter davantage de borr lies d h tes peu mobiles B burgdorferi B afzelii et les m les celles d h tes plus mobiles B gari nii B valaisiana Ensuite il est possible que l infection par les borr lies puisse modi fier le sch ma de migration Enfin dans la mesure o un conflit coop ration pourrait exister au sein des tiques existe t il une corr lation entre la pr sence des diff rentes esp ces de borr lies au sein de tiques Pr sentation des donn es Toutes les tiques chantillonn es en Suisse pour cette tude avaient t coup es en deux et une moiti envoy e l Institut de zoologie de Neuchatel pour d termina tion de pr sence de borr lies et d termination de l esp ce sondes mol culaires L autre moiti a t gard e dans l alcool et un grand nombre utilis pour g notypage microsatellite Les donn es sont contenues dans le fichier TotBrutBorIR txt o toutes les informations n cessaires sont dispo
386. olym rase b gaie et amplifie deux fois un al l le de m me taille pour un individu h t rozygote si les deux all les ont une taille proche Il doit donc exister une relation entre d fi cit observ et diff rence de taille entre all les le d ficit devant tre plus impor tant pour les individus h t rozygotes pour des alleles de tailles proches Ceci est d tect automatiquement par Micro Checker Tests statistiques 111 PARTIE II Applications a des exemples concrets Il n est pas n cessaire de pr ciser qu avoir lu la premi re partie de ce manuel avant d attaquer la partie pratique facilitera grandement la lecture et la compr hension de cette section m me si on peut tr s bien commencer directement ici Je consid rerai les notions de g n tique des populations et de statistiques utilis es comme un mini mum connues Je ne m tendrai donc jamais sur un concept ou une notion Dans le doute les lecteurs sont invit s 4 se r f rer aux chapitres de la partie pr c dente de ce manuel Tous les jeux de donn es utilis s dans cette partie sont disponibles sur internet a t l charger sur mon site web http gemi mpl ird fr SiteSGASS SiteTDM Data Tous les logiciels utilis s ou presque sont gratuits En ce qui me concerne j utilise Excel Microsoft corporation pour g rer mes donn es faire des calculs transforma tions de donn es par exemple et des graphiques comme des courbes Pour les analyses statist
387. ondant repr sente mais est aussi fonction du nombre total d axes plus il y a d axes et moins chaque axe peut avoir une tr s forte inertie LAFC est une proc dure qui peut s av rer utile pour classer les individus en fonction de leur proximit g n tique Exemples Lutilisation de l AFC s est av r e payante pour analyser la pr sence de tr matodes parasites dans une zone d hybridation de leur h te moule de bouchot Mytilus edu lis avec une autre esp ce moule d Espagne M galloprovincialis incompatible pour le parasite Coustau et al 1991 ou de fa on plus spectaculaire dans le cas du monog ne Diplozoon gracile sp cifique du poisson Barbus meridionalis en zone d hybridation avec B barbus un h te moins favorable au parasite comme pr sent dans la figure 11 Cette technique peut galement tre utilis e pour d tecter une structure cach e dans un chantillon comme celle qui proviendrait d un effet Wahlund d ficits en h t rozygotes tous les loci non expliqu s par le syst me de reproduction comme cela a t r alis dans SOLANO et al 2000 voir le paragraphe suivant GENETIX 4 05 4 d velopp par Belkhir ef al et t l chargeable gratuitement http www univ montp2 fr genetix genetix genetix htm offre une interface extr mement convi viale en fran ais qui plus est assez rare pour tre soulign pour produire des AFC en deux ou m me trois dimensions pas n cessairement les
388. ons en premier suivi des tests de d s quilibre de liaison pour se d barrasser de ces derniers Comme certains ont d j d le remarquer j ai en effet pris l habitude de regarder d abord ce qui se passe le plus localement avant d essayer de comprendre ce qui se passe des chelles plus globales Homozygotie et d s quilibre de liaison intra h te Nous allons donc diter BoophilusAdultsDataCattle txt et ne garder que la colonne correspondant aux fermes et aux individus h tes et celles des loci Il faut recoder le label des individus h tes en les fusionnant avec celui des fermes N oubliez pas que Fstat que nous allons utiliser n accepte pas beaucoup de caract res pour les labels de population ou de loci Notez que ferme et localit sont synonymes ici Il faut recoder les all les de chaque locus en les s parant pour pouvoir convertir ce fichier avec CREATE En ce qui me concerne cela donne le fichier que j ai appel BoophilusAdultsDataCattleIndivHostFisLD txt fig 63 14 Voir la d finition dans le glossaire 220 Initiation a la g n tique des populations naturelles Loca Host Bi Bl2 COT cr Boul 1l gt 192 194 145 is Boul 2 200 200 179 Boul 2 192 194 175 if Boul 2 192 198 145 1s Boul 2 192 194 179 17 Boul 3 198 200 145 A Boul 3s 194 198s 179 gt 1 Boul 3 gt 194 198 145 it Boul 3s 194 198 145 l Boul 3 194s 198 179 u BA Boul 3 194
389. ont maintenant disponibles Elles per mettent d inf rer la vraisemblance avec laquelle certains individus peuvent tre regroup s et donc consid r s comme appartenant la m me sous population clus ter ce qui peut conduire la d tection d une structure cach e Diff rentes m thodes avec diff rents logiciels sont disponibles On peut citer ici les deux principaux que sont STRUCTURE de Pritchard et al 2002 PRITCHARD et al 2000 FALUSH et al 2003 librement t l chargeable a http pritch bsd uchicago edu software structure2_1 html et BAPS 4 de Corander et al 2006 CORANDER et al 2003 2004 t l chargeable http www rni helsinki fi jic bapspage html BAPS a notamment permis de d tecter une structure cach e dans deux chantillons s par s dans le temps de Glossina palpali palpalis de Bonon C te d Ivoire RAVEL et al 2007 Dans les deux algorithmes STRUCTURE et BAPS l hypoth se de panmixie est suppos e dans chaque cluster que le logiciel cherche 4 construire Cependant la notion de panmixie telle qu affirm e par les auteurs n est pas claire et nous verrons que les clusters obtenus ne sont pas n cessairement conformes Hardy Weinberg D une mani re g n rale il est tr s difficile de savoir ce qui est fait et les diff rences entre ces m thodes m riteraient d tre mieux explor es dans diff rentes situations de populations structur es y compris l absence de structure et pour
390. ont pas repr sent s dans ce tableau Vous pouvez essayer avec une autre strat gie de regroupement pour v rifier si on retrouve des valeurs quivalentes Pour Estim il faut recoder les donn es de d part au format Genepop avec donn es manquantes pour les m les aux loci h t rosomaux et les regroupements du tableau 27 Pour NeEstimator Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 203 d s quilibres de liaison il faut autant de fichiers qu il y a de groupes de pi ges d finis dans le tableau 27 avec les males cod s homozygotes pour les loci li s a PX Les m me fichiers que pour Estim pourront tre utilis s pour l estimation des Fis par groupe de pi ges soit en utilisant Genepop directement soit en traduisant les fichiers pour un autre logiciel Fstat Genetix Notez que NeEstimator donne aussi une estimation bas e sur les exc s d h t rozygotes LUIKART et CORNUET 1999 mais contenant des inexactitudes corrig es par la m thode de Balloux On peut aussi utiliser le fichier recod Genepop pour une analyse par LDNe Waptes et Do 2008 qui impl mente une m thode bas e sur les d s quilibres de liaison non biais e ou beaucoup moins pour les petits chantillons alors qu on sait que la m thode de Bartley est biais e quand la taille des chantillons est inf rieure 4 la taille efficace des populations tudi es ENGLAND et al 2006 Wares 2006 Ceux qui s en rappellent constateron
391. os donn es et diff rents menus et boutons en bas de l cran Analyses des loci autosomiques du premier sous chantillon par Micro Checker Il y a un encadr en bas gauche o il faut choisir le motif de chaque locus micro satellite Il affiche par d faut le premier des loci ici IR25 et un blanc pour le motif Choisissez le motif Mononucleotide comme sur la figure 21 Nous avons d j remarqu que nos loci microsatellites taient peu orthodoxes L option mononucl otidique correspond en fait l option qui permet de faire face toutes les situations Cliquez ensuite sur le bouton All pour signaler que cette option est valable pour tous les loci Cliquez ensuite sur le bouton Analyse un peu La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 125 fee SE Boo hesr he h ooo ao a hes o 2 S w C e e z s fis fist fis ns Figure 21 Capture d cran de Micro Checker plus droite Appara t alors une fen tre d avertissement comme celle pr sent e en figure 22 Comme il y a des donn es manquantes Micro Checker vous demande s il faut ou non en tenir compte Autrement dit les donn es manquantes corres pondent elles 4 des homozygotes nuls blancs et faut il les utiliser pour le calcul des fr quences des all les nuls par la seconde m thode de BROOKFIELD 1996 La r ponse tant positive cliquez donc directement sur Procee
392. otstraps sur les loci ceux du F574 un jackknife sur les quatre loci disponibles dans ce cas trois ne varient pas d un locus l autre et donnent un 6 de Weir et Cockerham ind fini Sous chantillon Ls Bonon 0 663 0 825 0 534 Boffa 0 833 0 947 0 714 Dubr ka 0 517 0 719 0 359 bsy Li Ls Boffa Dubr ka 0 051 0 054 0 156 Dans le cas des estimations effectu es partir des mod les de populations clonales c est un effectif clonal que l on estime population clonale d une taille NV d rivant la m me vitesse que celle observ e en principe assez proche de JN sauf si la popu lation n est pas totalement clonale auquel cas on risque de surestimer l effectif r el Mais ce n est pas le cas ici comme on l a vu La premi re chose que l on remarque est que les effectifs efficaces et clonaux sont du m me ordre de grandeur et correspondent assez bien aux nombres de per sonnes infect es tels qu estim s pour chaque foyer dans le tableau 34 Ceci est tonnant car on sait que les JV devraient tre tr s petits par rapport au nombre r el de souches pr sentes Par ailleurs comme cela avait t montr dans l article initial Korri et al 2009 si un taux de mutation de 10 est utilis au lieu de 0 001 comme ici les effectifs clonaux se trouvent multipli s par 10 sugg rant une sous estimation du nombre de souches circulantes estim par les prospec tions m dicales Ceci ne devrait cependant p
393. ou reproduction par quelque proc d que ce soit constituerait donc une contrefa on passible des peines pr vues au titre Ill de la loi pr cit e IRD 2011 ISBN 978 2 7099 1 32 2 ISSN 1142 2580 A Soumeia et Nicolas la plus importante partie de ce que je suis dre PRO RO a m0 he eee 9 OO A ean 9544s 13 1 Concepts th oriques et statistiques 17 Qu est ce qu un marqueur g n tique 19 Concepts de base en g n tique des populations 29 Tests statistiques 67 2 Applications des exemples concrets 113 La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 115 Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 189 Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus h t rog n it locale dispersion et goulots d tranglement 217 G n tique des populations de Trypanosoma brucei gambiense en Afrique de I Ouest 247 BIBLIOGRAPHIE 000 eee eet eee eee 287 R PONSES AUX QUESTIONS sn rea cii merencana abo headend ee ESEA aeaea 303 EEDE eU E eee ee E E E EE E E E 313 ANNEKE correer ee ae a a a e E E E TS 325 TABLE DES MATI RES
394. oup plus h t rog nes que les m les l int rieur de chaque cluster mais beaucoup moins diff rentes d un cluster l autre peut tre interpr t de deux fa ons La premi re sugg rerait que le biais de dispersion sp cifique chaque sexe s inverse petite chelle mais on ne voit pas bien comment La seconde suppose que les clusters correspondent plus ou moins des fr res et s urs issus d une m me ponte et que les femelles ont une r ussite beaucoup plus homog ne que les m les Ne parviendraient l ge adulte selon cette hypoth se que beaucoup de m les par ponte mais de peu de pontes alors que les femelles repr senteraient un chantillon plus al atoire des pontes moins de s urs que de fr res dans chaque site Pour confirmer cette interpr tation une approche th o rique de mod lisation simulation serait n cessaire mais d passerait alors le cadre ambitionn par cet ouvrage Enfin ces clusters pourraient correspondre des cohortes diff rentes chevauchement de g n rations tr s diff renci es d rive forte et cela surtout pour les m les dont beaucoup viennent d ailleurs Ici aussi une approche 152 Initiation la g n tique des populations naturelles th orique s av rerait n cessaire Il est cependant raisonnable d imaginer que si les larves et les nymphes m les sont plus souvent retrouv es sur des h tes tr s dispersants alors il y a de fortes chances que chacun de ces indivi
395. outes la m me taille et les propagules tombent au hasard Notons que cette probabi lit est cependant faible car n grand Ce mod le est illustr dans la figure 7 Concepts de base en g n tique des populations 43 etc Population Population j G j CtCunmunum munmunns CCC Population Population U 1 C191 CtCannuuuus sunnnuux EC Figure 7 Le mod le en les de Wright Chacune des n sous populations est constitu e de N individus dont une proportion m provient de l ext rieur migrants et 1 7 d autochtones O Q ct EEE O Q O Q Le d ficit en h t rozygotes d la structuration effet Wahlund Pour l instant on ne fait pas d hypoth se sur le r gime de reproduction on va donc consid rer que la reproduction est panmictique Si on laisse ce syst me voluer les fr quences all liques des diff rents loci vont donc voluer galement l int rieur des sous populations m me si elles restent inchang es sur l ensemble Nous avons en effet suppos que 7 tait tr s grand m oo Il ny a donc pas de d rive l chelle globale Par contre NV et m sont limit s il y a donc possibilit de d rive g n tique dans chaque sous population comme d crit en p 31 et interaction avec la migra tion La d rive va tendre faire diverger les fr quences all liques entre les diff rentes sous populations et la migration va tendre homog n iser ces fr quences Si on admet quil y a panmixi
396. ozygotes pour cet all le avec un autre all le j sera de S S 2 P P 1 1 4 Si 5 gt 5S 59 is et 5 7 2p p 1 1 Si 5 lt 5 60 n 1 Dans les quations 59 et 60 on voit bien que le biais sera maximal pour l cart maximal de taille c est dire pour un h t rozygote pour les all les 1 et 7 et mini mal entre deux all les les plus proches En utilisant ces deux quations on en d duit que la proportion observ e dh t rozygotes pour l all le i avec tous les autres all les sera de ET E f TE H 207 d eee 2 7 i 61 21 SS jil Sy SY soit l jil jin H 2p Q p _ s s p t G s p 62 Sn ST jit L quation 63 nous donne donc l h t rozygotie attendue sous panmixie moins la proportion des g notypes h t rozygotes erron ment interpr t s comme homo zygotes pour le plus court des alleles La proportion d homozygotes observ s pour l all le 7 sera donc celle attendue sous panmixie plus la proportion d individus por tant l all le 7 et un all le plus long que j et interpr t s comme homozygotes pour cet all le Cette homozygotie observ e sera donc de I KON 63 s A jai Fi p pt 2 Lutilisation des quations 1 62 et 63 nous permet alors d estimer la fr quence erron ment observ e de l all le z dans chantillon comme 2F A ji Jp a i FY A 64 7 Z P Z En utilisation l quation 6 nous pouvons alors
397. p Piprok is d o on peut tirer que He i H 6 a 6 Fe o Fis repr sente donc le ratio d h t rozygotie en plus ou en moins observ par rapport l h t rozygotie attendue 7 sous les hypoth ses de Hardy Weinberg Ce nouveau param tre d fini par Wright WRIGHT 1965 est appel indice de fixation F des individus dans les sous populations s ou d ficit en h t rozygotes Il varie entre 1 et 1 Les valeurs n gatives correspondant donc un exc s d h t ro zygotes les valeurs positives un d ficit en h t rozygotes et une valeur nulle corres pondant donc Hardy Weinberg Il est int ressant de noter que 1 ne peut tre atteint que par une population o tous les individus sont h t rozygotes pour les m mes deux all les par exemple 1 2 alors que 1 signifie seulement qu il ny a aucun h t rozygote et donc tous les homozygotes que l on veut Il y a donc une contrainte sur les fr quences all liques pour les F7 n gatifs pour Frs 1 on a donc n cessairement deux all les avec p po 2 On peut donc exprimer les fr quences g notypiques en fonction du F5 D pit Pip2Fy H 5 2p p l1 Fy 7 R pot Pi PoP s ce qui correspond aux formules g n ralis es de Wright Nous pouvons donc calculer un d ficit en h t rozygotes standardis ind pendant des fr quences all liques et donc comparable d un locus l autre et d une tude l autre
398. p 60 Pour la construc tion d arbres dendrogrammes il semble aussi que les distances harmoniques donnent de meilleurs r sultats TAKEZAKI et Ner 1996 En fait la performance de diff rentes mesures et leur choix vont d pendre des situa tions rencontr es m me si en principe toutes les distances devraient aboutir en th orie a des r sultats concordants Ceci peut tre illustr par la corr lation que PRUGNOLLE et al 2005 ont montr e entre les distances g n tiques entre infra populations de schistosomes et celles mesur es entre les rats qui les portaient ou leur apparentement si on pr f re en Guadeloupe Dans l article c taient la distance de CAVALLI SFORZA et Epwarps 1967 qui avait t utilis e entre infra populations de schistosomes et la shared allele distance Bowcocx et al 1994 entre les individus rats Le logiciel MSA DIERINGER et SCHLOTTERER 2003 t l chargeable http i122server vu wien ac at calcule cette distance La corr lation obtenue tait tr s significative P value 0 0005 mais De MEE S et al 2007a ont montr que si le Fr est utilis pour les deux matrices la corr lation n est plus significative P value 0 15 et elle l est beaucoup moins P value 0 0113 quand cest Cavalli Sforza et Edwards qui est utilis pour les deux matrices Le choix d une statistique n est donc pas enti rement neutre Ajoutons enfin que d autres mesures d apparentement entre indi
399. parant l indice d un individu pour diff rentes populations on peut aussi essayer de d tecter sa population d origine pour autant que cette population ait t chantillonn e bien entendu On peut aussi analyser ces indices pour d tecter des individus parasites mieux adapt s telle ou telle autre esp ce d h te races d h te en comparant les indices d assigne ment des individus parasites aux diff rentes esp ces h tes sur lesquelles ils ont t pr lev s ainsi qu aux diff rentes localit s de pr l vements o les chantillons ont t effectu s voir par exemple McCoy et al 2005 On utilise galement ces indices pour tudier des cat gories d individus femelles versus m les h tes parasit s versus sains 64 Initiation la g n tique des populations naturelles L indice d assignement 47 PAETKAU et al 1995 d un individu amp chantillonn dans une population correspond la probabilit que ce g notype soit retrouv par chance dans cette population compte tenu des fr quences all liques dans cette population fr quences calcul es en y incluant l individu focal Pour un locus donn si les fr quences des all les 7 et j dans la population sont p et p respectivement la probabilit d appartenir cette population est de p pour les homozygotes et 2 iPjl pour les h t rozygotes Les probabilit s obtenues pour chaque locus p doivent tre multipli es entre elles pour obtenir
400. parateur Figure 78 Menu Genetix pour importer le fichier des donn es microsatellites de Rhipicephalus microplus au format Genepop Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 239 D thierry BouquinGenetPop TP DataCattleTick Ne BoophilusAdultsDataCattleFarm gen Fichier Edit AFC Link Dis ase Variabilit Distances Mantel Permutations Outils Aide El 30 Gal Ca Weir amp Cockerham RE Get de Nel Test sur permutations Traitement par paire Test sur Fis 1812 192194 200200 192194 192198 145192 092112 162153 192194 ara 092100 162162 T96199 TE 196200 145179 112118 162153 196197 146154 1194196 179179 108112 152153 196197 146154 194196 1145194 032100 153154 196197 146168 194196 145145 092102 152163 197199 154154 194196 179179 112112 152153 196197 154165 1194196 145179 1106112 153153 196197 154154 198200 145192 0920 153154 196197 154154 1194198 179190 092112 154155 197199 146154 194198 145178 092112 153154 196197 168168 149108 146107 nan 164184 147190 AREA 95197 146152 ol oe a ET nm Fis p ae Lh ee Figure 79 S lection de option de calcul de bootstrap sur les F7 par sous chantillon sous Genetix Le fichier appara t alors dans le cadre Cliquez deux fois dessus et il s ouvre sous Genetix S lectionnez le menu Fstats Test sur Fis et Bootstrap sur Fis par pop P comme indiqu dans la figure 79 Un men
401. parent Fal grand parent R ponses aux questions 307 o e F ee F ee F M me grand m re lool M me grand p re O Figure 99 lon de la consanguinit dans un syst me de croisements fr res s urs Les femelles sont repr sent es par des ronds et les m les par des carr s Les g nes examin s sont repr sent s par des petits ronds En bas sont repr sent s les diff rents petits enfants possibles en fonction des g nes pr sents chez leurs deux grands parents ce qui donne P Id m me grand parent 1 2 1 2 1 2F 2 Pour le cas o ces g nes proviennent chacun d un grand parent diff rent ces g nes ne peuvent tre identiques par ascendance que si les deux grands parents sont apparent s Sachant que la probabilit de tirer deux g nes identiques par ascendance chez les deux grands parents est gale l apparentement entre ces deux grands parents et correspond tr s exactement la consanguinit de leurs descendants z 1 F on obtient alors ta Li2F 4 F Id grands parents diff rents grands parents diff rents partir de l il est facile de poser i t7 l Id m me grand parent P Id grands parents diff rents 1 2 1 2 1 2F 9 1 2F t l Soit de mani re plus compacte F 1 4 1 2F Fa 308 Initiation la g n tique des populations naturelles Si on suppose alors que la proportion de croisements fr re s ur est de 6 et cel
402. pas sanguin Les m les retrouv s adultes dans nos chantillons correspondraient alors aux quelques groupes d apparent s ayant eu la chance de tomber ensemble dans un site favorable Les larves ou nymphes femelles seraient quant elles plus souvent retrouv es sur des h tes tr s peu dispersants comme des petits rongeurs tr s territoriaux Il en r sulterait un apparentement r parti beaucoup plus al atoirement pour les femelles dans chaque site Il y a un fort biais de dispersion sp cifique 4 chaque sexe les 168 Initiation la g n tique des populations naturelles femelles dispersent tr s peu Ce biais est partiellement masqu par l effet Wahlund et il est plus facilement visible quand cet effet est corrig donn es r duites et l indice d assignement corrig AT semble cet gard beaucoup plus robuste que sa variance vAL et le For Cet effet Wahlund nuit consid rablement l image per ue au niveau de la structura tion l chelle de la Suisse Quand cet effet est contr l au moins en grande partie on observe un isolement par la distance tr s significatif et les adultes non gorg s d I ricinus paraissent distribu s en populations locales de tailles importantes plus de 1 000 tiques par km et se dispersant difficilement plus de 200 m par g n ration Il reste cependant bien d autres questions et toutes ces hypoth ses doivent tre tes t es sur le terrain Cette tude ouvre de nombreuses e
403. pe de fratrie 1 2p 125 l p p soit 1 p i p 2 h t rozygotes Sur l ensemble nous obtenons la moyenne pond r e _ Pit P fe 2p pl ijti Z La fr quence de est gale la fr quence des homozygote ii plus 1 2 de celle des h t rozygotes contenant cet all le dans ce type de fratries Donc 1 2p 1 2 1 2p 1 2p 2 1 p p soit 2 p 1 2 De la m me fa on la fr quence de j sera de 1 2 p 1 2 et enfin celle des autres all les tous h t rozygotes sera de Y2 1 p p Par cons quent on attend comme h t rozygotes sous hypoth se de panmixie ij en fr quence 242 p 1 2 2 p 1 2 i autre en fr quence 242 p 1 2 2 1 p p j autre en fr quence 2 2 p 1 2 A 1 pr p autre autre en fr quence o Pi p 1 1 1 ls p p po T 22 T mo K R ponses aux questions 311 o K est le nombre d all les que l on suppose assez grand ici pour simplifier les choses Cela donne donc en moyenne pond r e l l Hep 2er eas 5 Pj Sii Pi PAE pit plt i jt i o est une quantit n gligeable Donc l l H ane AL 1 ait pile pit pil i jt i 2 2 que l on peut crire 2 Hop Pid Ut Pit E pit p gt 2 Par cons quent le F7 moyen attendu dans les fratries est H pui ii H n obslij ISlFraterie Hpt H exp ii exp ij En fonction des fr quences d all les cela donne Pi l pli 1 2a 1 7 1 i jt i
404. pelle Create v 1 1 Coomss et al 2008 Vous lancez Create et remplissez la fiche comme dans la figure 53 Quand vous s lectionnez le fichier Excel le programme vous demande dans quelle fiche Excel se trouvent les donn es Cliquez sur celle qui convient la 1 en principe Cliquez ensuite sur Proceed Le programme vous demande de v rifier qu il a bien pris en compte ce qu il fallait en vous montrant l exemple du premier individu R pondez oui si a colle Un second menu appara t qu il vous faut remplir comme en figure 54 Vous obtenez ainsi quatre fichiers deux pour les donn es en format Genepop et Fstat et deux pour le nom des populations Faites la m me chose pour TsetseJerCoordGeo amp Trap amp S ex otDataMalManq xls Nous allons dans un premier temps tester les d s quilibres de liaison avec TsetseMouhouMalHomo ESTAT dat et les Frs avec Data TsetseMouhoun MalMangq FSTAT dat fichiers Fstat que vient de cr er Create Vous pouvez renommer ces fichiers avec des noms moins longs Vous pouvez aussi diter les fichiers lab et sup primer les colonnes suppl mentaires qu a cr Create je ne sais pas pourquoi il fait a 12 On peut aussi charger un fichier de donn es au format texte seul Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 191 SUUO OS xnop odn55o snooj un nb ZSJON DOI SJaTUJop say mod nbuox sa nes qe1 aT unoynoA ej op uoj a segamjdeo 3dr SNPIAIPUI sop sa
405. plus faciles lire en ce qui me concerne Recommandations et astuces pour les utilisateurs de l AFC Quand on proc de une AFC FCA ou FA en anglais le programme g n re diff rents fichiers tels que celui contenant les coordonn es des individus sur les diff rents axes On peut tre tent d utiliser ces coordonn es qui sont donc des donn es ordi nales continues issues de donn es qualitatives disjointes pour proc der a des ana lyses de type analyse de variance Anova ou r gression V rifier si les coordonn es des individus sur le premier axe de AFC sont expliqu es plus ou moins bien par telle ou telle autre variable cologique peut en effet repr senter une perspective s duisante Je sais que beaucoup de personnes consid rent qu il n est pas valide de proc der ce genre d analyses partir d une AFC alors qu ils consid rent que cela est possible partir d une ACP trait e plus loin qui transforme des donn es 94 Initiation la g n tique des populations naturelles discr tes born es 0 1 ou 2 en donn es continues de distribution incertaine Mon opinion a ce sujet est que si on peut sen passer on vite les ennuis mais sinon je ne vois pas vraiment o est le probl me partir du moment o certaines pr cautions sont prises comme de v rifier la distribution des donn es avant de proc der une Anova Figure 11 AFC d individus h tes Barbus sur le plan d fini par les deux axes pri
406. plus subdivis e mais doit tre aussi cod e dans cette colonne La troisi me colonne NrdWNS correspond l appartenance ou non au nord ouest 1 ou au sud ouest Gorges du Trient Dor naz 2 de la zone du nord des Alpes suisses Le Tessin et la Tunisie tant cod s 3 et 4 respectivement dans cette colonne La quatri me colonne Site correspond aux sites eux m mes 1 9 Les cin qui me a neuvi me colonnes correspondent aux cinq loci le premier IRO8 tant cod homozygote pour les tiques m les Appelons le fichier ainsi construit RTot96HierFstat txt L analyse va se faire sous HierFstat 0 04 4 Goudet 2006 mis jour de GOUDET 2005 comme d crit dans DE MEE S et GOUDET 2007 N oubliez pas de remplacer les donn es manquantes 000000 par NA Lancez le logiciel R Chargez le package HierFstat Menu Package Chargez le package hierfstat Changez de r pertoire pour travailler dans celui o le fichier de donn es IRTot96HierFstat txt se trouve Menu Fichier Changer le r pertoire courant Dans la console R tapez la succession de commandes chaque ligne correspond une commande devant tre suivie d un retour charriot en respectant les majuscules et minuscules distinctes en langage R data lt read table IRTot96HierFstat txt attach data loci lt data frame R08 1R25 1R27 1R32 1R39 levels lt data frame Cont NrdWTlessin NrdWNS Site varcomp glob le
407. population BARTLEY et al 1992 Cette m thode ainsi que celle de Waples chantillons temporels est impl ment e par le logiciel NeEstimator Version 1 3 logiciel non publi de Peel D Ovenden J R Peel S L 2004 NeEstimator Version 1 3 software for estimating effective population size Queensland Government Department of Primary Industries and Fisheries t l chargeable gratui tement a http www dpi qld gov au fishweb 11629 html Ce logiciel propose aussi une m thode bas e sur les niveaux d h t rozygotie observ s LUIKART et CORNUET 1999 mais priori moins pr cise que la m thode propos e par BALLOUx 2004 voir plus bas Dans tous les cas et quand le calcul est possible le logiciel donne les intervalles de confiance 95 La m thode de Bartley tant biais e quand les chan tillons sont de taille inf rieure au N ENGLAND et al 2006 Wares 2006 Waples et Do proposent LDNe Waptes et Do 2008 qui donne rarement des r sultats utilisables mais corrige le biais d aux faibles chantillons et est donc utile pour v rifier qu on ne sous estime pas les V BaLLoUx 2004 propose un estimateur cor rig par rapport la m thode de Luikart et Cornuet et facile calculer en utilisant l estimateur de Weir et Cockerham N 1 2F is Fis 1 Fis Enfin il est important de signaler quune approche synth tique alliant les deux types d informations spatiale et temporelle est galement dispo
408. pour plusieurs raisons D abord parce que nous ne sommes pas arriv s jusqu ici pour se mettre bailler aux corneilles ensuite parce que c est la nuit qu il est beau de croire la lumi re RosTAND 1908 D finir diff rents niveaux de subdivision pour l analyse hi rarchique Nous ne consid rerons ici que les chantillons de 1996 Nous pouvons envisager gr ce HierFstat GOUDET 2005 n importe quelle structure du moment que cette derni re reste hi rarchique Nous allons donc dans un premier temps consid rer r f rez vous au besoin la figure 15 PEurope Afrique comme tout suivi de la Tunisie versus la Suisse puis le Tessin versus le nord des Alpes et enfin le groupe Gorges du Trient Dor naz contre le plateau Suisse Eclepens Montmollin Neuchatel Staadswald Bern R f rez vous DE MEEUts et GOUDET 2007 pour des d tails sur la confection d un fichier HierFstat Analyse hi rarchique sur donn es brutes pas de cluster BAPS Il faut donc cr er un fichier avec quatre hi rarchie plus cinq loci colonnes La premi re colonne correspond donc au continent Cont avec 1 l Europe la Suisse et alors et 2 pour l Afrique Tunisie La deuxi me colonne NrdW Tessin va coder pour l appar tenance aux cantons du nord et nord ouest de la Suisse 1 pour celle du Tessin 2 La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 153 Monte Ceneri ou la Tunisie 3 qui n est pas
409. prement parler Dans certaines circonstances il est possible de tester la panmixie plus directement si on a acc s aux couples natu rellement form s dans le milieu En g notypant les adultes accoupl s en copula tion on peut tester si ces adultes se sont associ s ind pendamment de leurs g notypes c est dire on peut tester la pangamie Pour ce faire il suffit d adapter un test de MANTEL 1967 test que nous d taillerons davantage plus loin pour les tests de corr lations entre matrices de distances pour tester la corr lation entre la matrice des distances g n tiques apparentement entre les individus possibles entre les diff rents individus accoupl s et la matrice d accouplement en codant 0 pour les paires d individus non accoupl s et 1 pour les paires dindividus effectivement trouv s accoupl s Pour des organismes sexes s par s les matrices concernent les femelles d un c t contre les m les de l autre Attention ce test de Mantel ne peut tre effectu par Genepop qui ne g re que des demi matrices en excluant les valeurs diagonales dont on a besoin ici Il faut donc effectuer le test avec un logiciel qui utilise des donn es en colonne comme Fstat ou RT de Manty 1997 En permu tant les cases d une des deux matrices et en calculant un coefficient de corr lation chaque fois on obtient ensuite la probabilit d observer une valeur aussi extr me ou plus extr me que celle observ e Cette proc
410. pulation sont g n tiquement identiques Qs 1 mais ne sont pas n cessairement identiques ceux r sidant dans d autres sous populations Qr lt 1 Par cons quent Fsr 1 signifie une ind pendance compl te des sous populations et donc des individus qui les composent entre elles ce qui est attendu si ces sous populations sont rest es isol es les unes des autres pendant une dur e suffisamment longue Le Fyr varie entre Frr 1 quand tous les individus de la population totale sont h t rozygotes pour les deux m mes all les et Fyr 1 quand tous les individus sont homozygotes avec au moins deux all les dans la population totale Quand la probabilit d chantillonner deux all les identiques d un m me locus sur l ensemble de la m tapopulation devient ind pendante de la localit d origine et des individus d o l on peut les tirer alors Q Qs Qr et une conformit globale aux proportions attendues sous Hardy Weinberg est observ e avec Frs For Frr 0 48 Initiation la g n tique des populations naturelles Inf rer Nm partir du Fs dans un mod le en les Nous avons vu pr c demment qu en utilisant les cons quences analytiques de l auto f condation nous pouvions estimer un taux possible d autof condation partir de la connaissance du Fy quation 8 Nous allons voir maintenant que la connais sance d un Fs peut permettre l inf rence du nombre d individus migrants le pro du
411. que lev s Ensuite il existe des proc dures plus ou moins complexes pour estimer 4 chaque locus et dans chaque sous chantillon la fr quence d all les nuls n cessaires pour expliquer les d ficits observ s BROOKFIELD 1996 Le logiciel Micro checker V 2 2 3 VAN OOSTERHOUT et al 2004 t l chargeable librement de http www microchecker hull ac uk permet de faire ces estimations pour chaque locus et chaque sous chantillon Ces fr quences estim es d all les nuls peuvent ensuite permettre d valuer la proportion attendue d individus blancs sous l hypoth se de panmixie et si ces all les nuls expliquent la totalit du d ficit Trucs et astuces pour tester la pr sence des all les nuls Il est important d insister encore sur le fait que si tous les loci convergent vers le m me d ficit en h t rozygotes tous pr sentent un F7 comparable a celui des autres il n est alors pas n cessaire d invoquer les all les nuls mais plus parcimonieu sement une cause biologique autof condation effet Wahlund Dans ce qui suit nous partons donc du principe qu une forte variance entre loci a t observ e Il faut tout d abord savoir que Micro checker est con u sp cifiquement pour les microsatellites Avant de proc der l analyse il est demand le type de motif pour chaque marqueur Si vous n tes pas s r de vos donn es quelques mutants atypiques d un pas diff rent du motif de base il vaut en g
412. que d un type qui augmente l homozygotie pour des descriptions des diff rents modes La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 121 d automixie voir par exemple DE MEEts et al 2007b Seules les femelles sont en g n ral capables de parth nog n se Il existe cependant une esp ce de cypr s et une esp ce de phasme o les m les se reproduisent asexuellement voir encore DE MEEts et al 2007b et une esp ce de fourmi o m les et femelles sont clonaux chacun de leur c t Foucaup et al 2010 Mais ce sont des exceptions Si parth nogen se il y a les femelles devraient donc pr senter de beaucoup plus gros d ficits en h t ro zygotes que les m les tous issus d une reproduction crois e Nous allons donc r analyser le fichier en demandant Fstat de nous donner les Frs par sous chan tillon puisque nous avons fort judicieusement il faut bien l avouer maintenant d entr e de jeu distingu les deux sexes Sous Fstat vous ouvrez le m me fichier IRTotTestPanmix dat et vous d cochez toutes les cases et cochez celle qui indique Fis dans le cadre Per locus and sample statistics comme indiqu dans la figure 18 Si vous souhaitez rep rer encore une fois les noms des sous chantillons n oubliez pas de signaler nouveau l existence du fichier IRTotIestPanmix lab dans le menu Options FSTAT is Processing IRTotTestPanmix dat eS ed Geno
413. que visible dans l chantillon sous la forme d un d ficit en h t rozygotes effet Wahlund Le site d chantillonnage peut par exemple correspondre une aire de nourrissage d individus provenant d unit s de reproductions tr s s par es Il existe diff rentes m thodes permettant de regrouper les individus d un chantillon par affinit g n tique en diff rents groupes sous populations putatives en utilisant leur g notype multilocus Par exemple de tr s importants d ficits en h r rozygotes sont souvent trouv s pour les loci microsatellites des mouches ts ts En particulier SOLANO et al 2000 sur Glossina palpalis gambiensis avaient mis en vidence de tr s impor tants Fis Ces forts d ficits ne pouvant tre expliqu s facilement et en tous les cas pas en totalit par la pr sence d all les nuls ou par la dominance d all les courts voir p 105 111 une structure cach e a t recherch e l poque o ces donn es ont t analys es une AFC avait t r alis e et avait permis d identifier des sous groupes de ts ts o le d ficit en h t rozygotes se retrouvait inf rieur au d ficit initial indi vidus regroup s ce qui confirmait que ces d ficits provenaient bien d un effet Wahlund dont l origine exacte reste elle m me identifier fig 13 D autres m thodes bas es sur les statistiques pseudo bay siennes et des simulations de Monte Carlo par cha ne de Markhov s
414. r dat Genetix construira donc un fichier o seront consid r es comme appartenant a des populations diff rentes les tiques de sites d ann es et de sexes diff rents Ouvrons ce fichier sous Fstat et s lectionnons les m mes options qu en figure 46 Constatez que nous ne gardons que les fr quences all liques cela pourrait servir et ce qui nous int resse le test de d s quilibre de liaison On choisit dans un premier temps le niveau 5 100 pour aller plus vite Cliquez sur Run et ensuite ouvrez le La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 175 Fichier Edit AFC Bis anes Black amp Krafsur Test sur permutations D thierry BouquinGenetPop TP Datalxodes BorreliaGenet Ticks TotBrutBorIRCoOccur txt Fstats Variabiit Distances Mantel Permutations Outils Aide BbSS Bba omor 001001 001001 001001 001001 001001 001001 1001001 001001 001001 001001 1001001 001001 001001 001001 001001 001001 001001 001001 1001001 001001 001001 001001 lootoot 001001 001001 001001 001001 001001 001001 001001 001001 001001 001001 001001 001001 1001001 001001 001001 001001 001001 001001 001001 001001 Figure 44 Menu Link Dis Desequillibre de liaison Racine des fichiers r sultats tBrutB onRCoOccur Seuil de significativit pour afficher les d tails si 0 pas d affichage Type de sortie Texte seul C Html R sultats sortir M Pop par Pop racine I
415. r du fait qu tre infect par une des trois borr lies tend favoriser l infection par les deux autres par immunosuppression par exemple Ceci peut tre test en ne regardant que les tiques infect es La corr lation existe t elle toujours Nous allons donc recommencer la m me op ration mais avec un fichier ne contenant que les tiques infect es par au moins une borr lie donc sensibles Le r sultat de cette analyse est pr sent dans le tableau 19 L image qui en ressort est totalement diff rente puisque les associations sont presque toutes n gatives t moignant d une exclusion entre esp ces de borr lies au sein des tiques avec deux exclusions tr s significatives entre Bbundet vraisemblablement compos e de Bbg et Bbv et les deux borr lies les plus fr quentes Bbss et Bba RAJ 0 6 P value lt 0 003 Il y a donc dans les populations d I ricinus des tiques plus sensibles ou plus expos es que d autres aux borr lies de toutes esp ces o ces derni res s accumulent Par contre au sein de ces tiques plus sensibles ou davantage expos es les diff rentes esp ces de borr lies tendent s viter en particulier 178 Initiation la g n tique des populations naturelles Bbundet que l on peut raisonnablement soup onner d tre essentiellement compos e de borr lies d oiseaux Bbg et Bbv et les borr lies de micromammif res Bbss et Bba Ceci relance le d bat sur l existence de sp cificit s diff
416. r nos donn es si celles ci proviennent d une population respectant l hypoth se nulle Si cette probabilit est inf rieure un seuil choisi a on d cide que les donn es d vient significativement de ce que l on attend sous Hp Par cons quent et par d finition pour un seuil choisi de a 0 05 le plus classique on s attend ce que sous Hp 5 des tests soient significatifs par hasard Autrement dit si j chantillonne 100 fois dans une population panmictique et que 82 Initiation a la g n tique des populations naturelles j effectue un test du F7 pour chaque chantillon je m attends trouver en moyenne cing tests significatifs au seuil a 0 05 si la taille des chantillons et si le polymor phisme des loci sont suffisants Par cons quent la r p tition de tests pose un probl me Plusieurs m thodes existent q P P P pour r soudre le probl me des tests r p t s et dont l application d pend de la ques tion pos e et du type de tests r p t s Les tests r p t s sont ind pendants Ces tests r p t s peuvent correspondre diff rents cas de figure dont voici une liste non exhaustive je voudrais combiner diff rents tests de la m me A trouv s dans la litt rature pour lesquels je n ai pas les donn es brutes je cherche savoir si le F de chaque locus d vie significativement de 0 dans un sens ou dans l autre je dispose de donn es de structuration de plusieurs sites comp
417. res en h t rozygotes Dans ce cas il n y a pas d autre solution que de yg y q proc der une correction de Bonferroni tr s conservatrice Horm 1979 Rice 1989 ou de facon moins conservatrice sauf pour la plus basse P value p p le Bonferroni s quentiel Il faut ordonner les N P values de chaque test de la plus petite la plus grande La plus petite des probabilit s est multipli e par W la deuxi me plus petite par N 1 la troisi me par NV 2 etc Les tests significatifs sont ceux dont la P value ainsi corrig e reste inf rieure au seuil choisi a 0 05 On peut aussi plus classiquement corriger le seuil lui m me par le nombre de tests correspondants a a N a al N 1 a3 al N 2 etc ce qui revient au m me mais personnellement je pr f re disposer d une P value exacte Le tableau 4 donne un exemple d une s rie de 10 tests tri s par ordre croissant de leur P value leur P value corrig e par la proc dure du Bonferroni s quentiel le seuil corrig correspondant 0 05 ainsi que la d cision statistique concernant chaque test compte tenu du nombre de tests effectu s Dans cet exemple on d cide que trois des dix tests ont donn une valeur d viant significativement de ce qui est attendu sous Hp On remarquera que cette proc dure est tr s conservatrice Il faut le savoir au moment d chantillonner et ne pas l siner Tests statistiques 85 Tableau 4 Exempl
418. reste explorer concernant le fonctionnement de ces m thodes dans diff rentes situations Il faudra donc v rifier si la partition obtenue car le logiciel en donne tou jours une correspond quelque chose de viable et pas seulement une vue de l esprit Si la partition a r ellement mis en vidence des groupes cryptiques au sein des sous chantillons susceptibles d expliquer en partie effet Wahlund nos fameux d ficits en h t rozygotes il faudra ensuite trouver et explorer les hypoth ses susceptibles d expliquer le plus raisonnablement possible mais en aveugle ces r sultats esp ces La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 135 ou races d h tes cryptiques sous structures familiales isolement par la distance entre individus sur de courtes distances Il existe d autres logiciels qui en principe font la m me chose Lavantage de BAPS r side dans sa convivialit dans le fait qu il accepte des fichiers de type Genepop un peu modifi s et qu il ma toujours donn de bons r sultats Le logiciel STRUC TURE est par exemple beaucoup moins commode utiliser et cest un euph misme et sur un m me jeu de donn es glossines ma pas offert de partitions aussi satisfaisantes que BAPS Ravet ef al 2007 Des tudes comparatives de diff rents logiciels de clustering sont en cours mais la longueur et la quantit des analyses font que des r sultats concrets ne seront sans doute pas disponib
419. rmule suivante Ki Lm 72 Log P 49 1 o P correspond a la P value obtenue au i me test Cette expression suit normalement une loi du y Chi 2 avec 2k degr s de libert ddl dont on peut donc extraire la P value associ e partir d une table du y d un logiciel ou en tapant la formule LOI CHI DEUX X ops 2 k sous Excel Le test de randomisation SGM de sym trie autour de 0 5 de la moyenne g om trique la moyenne g om trique correspond la racine kieme du produit des k P values entre elles GOUDET 1999 est impl ment par le logiciel SGM distribu sur demande par l auteur lui m me Le test de transformation Z de Stouffer WHITLOCK 2005 consiste en la transformation des P values en leur quivalent Z avec par exemple la commande Excel LOI NORMALE NVERSE P 0 1 ou LOI NORMALE STANDARD NVERSE P mettre 0 9999 pour les P 1 qui donne un Z pour chaque P que l on combine en la statistique Z k Z a 50 hk 0 Vk La P value globale est obtenue en comparant cette statistique la loi normale avec par exemple la commande Excel LOI NORMALE STANDARD Z D une fa on g n rale si on combine peu de tests amp lt 4 il vaut mieux appliquer le test Z de Stouffer et dans les autres cas k gt 3 le binomial g n ralis ou le Z 84 Initiation la g n tique des populations naturelles DE Mests ef al 2009 Par ailleurs d une fa on qui ne concerne pas vraiment
420. rs utiliser des distances g n tiques Cependant ici il n y a que trois sous populations subdivis es parfois en G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 259 Tableau 37 R sultats des mesures de diff renciation par paire d chantillons de Tbg1 aux chelles spatiales et temporelles Tous les tests restant significatifs au seuil Bonferroni s quentiel en consid rant sept tests sont indiqu s en gras La mesure standardis e du F57 Fsr Esr 1 H est aussi indiqu e Temporelle Loci Bonon 2000 2002 0 0096 0 0182 0 5959 0 0238 Bonon 2000 2004 0 0160 0 0063 0 6129 0 0413 Bonon 2002 2004 0 0031 0 1836 0 6119 0 0080 Dubr ka 1998 2002 0 0352 0 0330 0 6594 0 1033 MLG Bonon 2000 2002 0 1157 0 0010 0 8418 0 7311 Bonon 2000 2004 0 1140 0 0009 0 8592 0 8094 Bonon 2002 2004 0 0250 0 0590 0 9380 0 4032 Dubr ka 1998 2002 0 1006 0 0059 0 8570 0 7033 Spatiale Poe Entre pays Bonon Boffa 0 2940 0 0001 0 5760 0 6934 2002 Bonon Dubr ka 0 2127 0 0001 0 6177 0 5564 Guin e Boffa Dubr ka 0 0514 0 0017 0 5988 0 1281 MLG Entre pays Bonon Boffa 0 1769 0 0001 0 8783 1 0000 Bonon Dubr ka 0 1207 0 0153 0 9219 1 0000 Guin e Boffa Dubr ka 0 0452 0 0203 0 8795 0 3751 deux ou trois p riodes ann es d chantillonnage J ai donc cr un nouveau fichier contenant les sept loci ne pr sentant pas de probl me et les MLG T
421. rsion des points non expliqu e par le mod le pour un chantillon de taille N alors on peut crire que AIC 2k NILn 2rRSS N 1 o amp est le nombre de param tres dans le mod le On voit bien qu augmenter le nombre de param tres m me s il permet un meilleur ajustement aux donn es en diminuant RSS augmente par ailleurs la valeur de AJC k augmente R ponse 13 La famille quasi des mod le lin aires g n ralis s Lestimation dite guasi likelihood permet de proc der une r gression sans conna tre enti rement la distribution des r sidus de la variable expliquer il faut sp cifier le R ponses aux questions 309 lien binomial ou poisson et l estimation se fera en tenant compte de la relation entre variance et moyenne soit pour un lien de type binomial l4 l p o p est la probabilit moyenne Var p est sa variance et le coefficient de dispersion Var p Pour plus de pr cisions sur les mod les quasi likelihood laide en ligne de R conseille les ouvrages de Cox et SNELL 1981 Dosson 1983 MCCuLLAGH et NELDER 1989 le plus souvent cit par les sp cialistes et CHAMBERS et HASTIE 1992 tr s souvent cit galement Selon mon exp rience personnelle pour les mod les logistiques les estimations quasi peuvent conduire des r sultats aberrants en particulier quand les occurrences d un v nement sont rares notamment au niveau des tests P value 0 alors qu
422. s Evolution 56 1802 1807 DE Meets T Duranp P RENAUD F 2003 Species concepts what for Trends Parasitol 19 425 427 DE Meets T GOUDET J 2000 Adaptive diver sity in heterogeneous environments for popula tions regulated by a mixture of soft and hard selection Evol Ecol Res 8 981 995 De Meets T GOUDET J 2007 A step by step tutorial to use HierFstat to analyse populations hierarchically structured at multiple levels Infect Genet Evol 7 731 735 290 DE MEE S T GU GAN J E TERIOKHIN A 2009 MultiTest V 1 2 a program to binomially com bine independent tests and performance compari son with other related methods on proportional data BMC Bioinformatics 10 443 DE Mests T Humar P E DELAYE C GRUNAU C RENAUD E 2004a Non Mendelian transmis sion of alleles at microsatellite loci an example in Ixodes ricinus the vector of Lyme disease Int J Parasitol 34 943 950 DE Meets T Korri B B BARR N DE GARINE Wicuatitsky M CHEVILLON C 2010 Swift sympatric adaptation of a species of cattle tick to a new deer host in New Caledonia Infect Genet Evol 10 976 983 DE Mre s T LEHMANN L Barroux E 2006 Molecular epidemiology of clonal diploids a quick overview and a short DIY Do It Yourself notice Infect Genet Evol 6 163 170 De Meets T LORIMIER Y RENAUD F 2004b Lyme borreliosis agents and the genetics and se
423. s tre utiles ici fig 16 Si vous souhaitez voir appara tre les noms des sous chantillons il faut le 118 Initiation la g n tique des populations naturelles Pour limiter le nombre de permutations Curseur d avanc e ici gal 24x5x 5 1 2 5 100 Pour avoir les r sultats de randomisations soit 4 800 randomisations pour chaque paire de loci dans chaque sous chantillon toutes fins utiles FS AT is Processing IRTetTestPanr tix dat Fila of Biased depeksal Manthice il Help TE F statistics Tepting and Disequilbium Omp ampng groups of samples Gene diveehhes and F Statimlica Genotypic dec S saaa D A IF Mers Fanie Pb acca Genotype frequence Fe Wee and Cockerham Fuatstics Tests between all pairs of loci M Number of alekes M Fiho_st 5 Tests between all pairs of foci in each sample M Allelc nchners Fst pet par of samples I Gene dversiy Fa al vel lou mulig s tests S00 1100 i 11000 Testing Save Tables Global Tests Fr Hardy Weinberg wethin samples I Nady Weinberg overall samples pon dihansentatian NO best C Ten NAT anumng HW thin samples HW teste per locie and rampie Morral level for mie tests S700 1100 C 11000 Paire tests of il Pour tester s il existe Suffisant pour une tr s bonne pr cision un d ficit significatif sans que cela dure trop longtemps d h t rozygotes dans les sous chantillons Figure 16 Capture d cran de Fstat lors de la premi re analyse sp c
424. s des F statistiques de Wright pour diff rents taux de mutation u Les valeurs sont obtenues pour un mod le en les infini avec N 20 individus par sous population un taux d autof condation de s 0 2 et un taux de migration de m 0 05 IAM nombre infini d all les Concepts de base en g n tique des populations 63 peut tre tudi en consid rant chaque habitation s par ment et en calculant un F7 alors que l analyse de l effet habitation se fera dans chaque village s par en ne gar dant les parasites que d un seul individu h te par habitation en calculant de nouveau un Fy et en regardant de combien celui ci est diff rent du pr c dent Cette t che devient rapidement irr alisable et de toutes fa ons assez contestable car il existe une solution beaucoup plus l gante Le logiciel HierFstat GOUDET 2005 disponible http www2 unil ch popgen softwares hierfstat htm offre la possibilit d estimer les F hi rarchiques pour toute structure hi rarchis e de population et ce en une seule analyse comme cela a t utilis avec profit dans TROUV et al 2005 ou N BAVI et al 2006 Dans notre exemple on aurait donc obtenu Fpyrasites H te Hote Habitation Fiabitation_Villager Village Total Ces diff rents F sont calcul s et estim s suivant des prin cipes analogues ceux d crits en 21 et 40 et donnent donc les parts respectives des diff rents niveaux hi rarchiques dans la partition de la
425. s gr gation ni recombinaison am iotique et se retrouve donc g n tiquement strictement iden tique l individu parental la mutation somatique pr s CMH MHC en anglais Complexe majeur d histocompatibilit Complexe de g nes qui d termine entre autres la reconnaissance du soi et du non soi Voir aussi HLA Coalescence Ph nom ne qui d crit l ascendance commune de deux g nes d une population Le temps de coalescence d crit par exemple le nombre de g n rations qu il est n ces saire de remonter pour atteindre le g ne anc tre commun de deux g nes pris au hasard dans la population tudi e Codominant D crit un marqueur g n tique pour lequel tous les h t rozygotes sont distinguables des homozygotes ni dominant ni r cessif Consanguinit Indique la proportion de loci identiques par descendance au sein des individus r sultant d un syst me de reproduction ferm autof condation croisement entre 314 Initiation la g n tique des populations naturelles apparent s ou d une taille limit e de la population Notons que dans le cas o cette consanguinit probabilit d identit par descendance intra individuelle ne r sulte que de la taille de la population celle ci devient gale l apparentement entre individus de cette population probabilit d identit par descendance inte rindividuelle Crossing over Ph nom ne chromosomique intervenant lors de la m iose et consistant
426. s immigrants ne peuvent tre identiques personne Q7 0 En tenant compte de l ensemble de ces informations et en esp rant que les lecteurs ne sont pas encore enti rement perdus nous pouvons poser qu la g n ration 1 ee oes Qs D 1 Qc j 1 Qs 2N 22 A l quilibre entre migration et d rive nous aurons 1 m Qs e41 Qs E Q 2N _ 1 1 m Q m IN ce qui donne ao m Qs 2Nm2 m 1 2mt m Ici nous pouvons supposer que 7 est suffisamment petit pour pouvoir le n gliger en face de 1 Si alors nous remplacons Qs par Fsn nous pouvons retrouver la formule classique a 23 S A4ANm 1 oe Concepts de base en g n tique des populations 49 De cette quation il est facile d extraire la non moins fameuse galit Nm 1 Fsr l4Fsr Nous pouvons introduire ici le fait que si les all les sont affect s par un taux de mutation constant correspondant au mod le IAM alors l quation 23 devient l 4 AN m u 1 va En partant de l quation 24 il est tr s facile de constater que pour des loci soumis ST de forts taux de mutation et donc tr s polymorphes la valeur maximale du Fs ne pourra jamais atteindre la valeur 1 m me quand m 0 Cela signifie galement qu un petit F7 peut tre obtenu dans des populations tr s structur es Nm petits si les loci utilis s sont tr s polymorphes beaucoup d all les taux de mutation lev Il existe une
427. s les individus ou une partie de leur corps sont broy s dans une solution tampon ou de l eau distill e et ces extraits sont ensuite d pos s soit directement sur gel soit sur des supports absorbants comme du papier whatmann et ces supports absorbants sont eux m mes d pos s sur ou dans un gel gel d amidon polyacrylamide ac tate de cellulose Un champ lectrique est ensuite appliqu sur le gel On parle d lectrophor se des prot ines Les Qu est ce qu un marqueur g n tique 23 enzymes tant en g n ral charg es n gativement celles ci migreront donc vers le pole positif du champ anode et beaucoup plus rarement vers la cathode si char g es positivement La vitesse de migration de ces prot ines tant fonction de leur charge la distance parcourue en fin d lectrophor se refl tera donc aussi cette charge Les enzymes sont ensuite r v l es l aide de leur fonction On utilise en effet le substrat ou un analogue qu elles sont cens es transformer ainsi qu une substance qui provoque un pr cipit color en pr sence du produit de la r action de l enzyme avec son substrat partir de l plusieurs cas de figure peuvent tre rencontr s Pas de tache o des train es non interpr tables sont pr sentes sur le gel Il faut mettre au point ou passer un autre locus Les taches r v l es de tous les individus se retrouvent toutes au m me niveau C est ce qui se passe comme dans la
428. s bas Les tudes des variations spatiales des fr quences des all les permet d estimer ce que les sp cialistes encore eux appellent l effectif efficace de consanguinit Les estima tions produites par ESTIM 1 2 appartiennent cette cat gorie VITALIS et COUVET 102 Initiation la g n tique des populations naturelles 2001a t l chargeable gratuitement par FTP anonyme ftp isem isem univ montp2 fr pub pc estim Ce logiciel utilise l information monolocus fournie par le Fr et celle offerte par le d s quilibre d identit par paire de loci afin de pouvoir en tirer N et m effectif efficace et taux de migration sans avoir besoin de conna tre le mod le ni le taux de mutation ou de migration ViTALIs et COUVET 2001b c Cependant les taux d autof condation et de recombinaison entre les loci utilis s doivent eux tre connus La fa on d utiliser la m thode temporelle effectif efficace de variance et la m thode spatiale de VitaLis et CouveT 200 1a effectif efficace de consanguinit une com paraison ainsi que les probl mes possibles que l on peut rencontrer en les utilisant sont discut s dans MEUNIER et al 2004b ESTIM donne souvent des effectifs peu informatifs 0 ou infini Il fournit galement quand le calcul est possible les inter valles de confiance 4 95 des valeurs estim es Il existe une autre m thode utilisant l information des d s quilibres de liaison entre loci dans une seule
429. s certains cas comme celui d une reproduction clonale partielle on s attend des d viations dans les deux directions BALLOUx et al 2003 DE Meets et al 2006 Dans ce cas et comme les logiciels disponibles ne donnent pas de tests bilat raux il faut cumuler les r sultats des deux tests unilat raux Frs gt 0 et Frs lt 0 en sommant Pain 1 Paav o PP et P ae max correspondent la plus petite test unilat ral le plus puissant et la plus grande des deux P values des deux tests ou si Panax 1 comme c est le cas ici en doublant Puin Risques de premi re et de seconde esp ce En r gle g n rale on consid re arbitrairement qu un test est significatif quand la P value laquelle il est associ est inf rieure ou gale 0 05 Mais dans certains cas que nous verrons plus loin il peut s av rer n cessaire d tre plus s v re et de baisser ce seuil Personnellement je me sens plus laise avec une P value lt 0 01 pour reje ter Ho et une P value gt 0 1 pour l accepter Le seuil partir duquel on d cide qu une statistique est significative rejet de Ho est appel risque de premi re esp ce ou erreur de type I et not a Il s agit du risque de se tromper en rejetant Hy quand elle est vraie Le risque de seconde esp ce ou erreur de type II not B correspond au risque de se tromper en acceptant l hypoth se nulle quand elle est fausse Ce risque qui est fonction de la puissance du test
430. s d s quilibres de liaison 80 Nombre de FAN OS AU ONS ae eN ete nee ne a ST Ne nt en 81 COCO outa ec cscs eae sie cular agence 81 Remarques sur les tests de d s quilibres de liaison et leur interpr tation 82 Le probl me des tests F D ICS ne nn ii one 82 Les tests r p t s sont ind pendants 00 ccccccccccessecceceesseececceseeesccceeseeeececeseeececsssaeeesesteaeeeesestiaeeess 83 Tester si un signal global existe sens snnrnmenenseenenrtenmbenennennnnessonmebenmuebemmennerenstebenseneesitnne 83 D terminer quels sont les tests significatifs proc dure de Bonferroni ccceecccceeececeeseeceeeeeeeeeueeeeeeneeees 85 Les tests r p t s ne sont pas ind pendants ccccccccccccccesteceecccssseeeeeccssseeececssseeeeeecseeesesesteeeess 86 Tester si un signal global existe a ee ete 86 D terminer quels sont les tests significatifs proc dure de Bonferroni s sssiiessiisesiiserrieerrrerrirerrrrerrrren 87 Le cas des d s quilibres de liaison iii 87 Tester la corr lation entre distantes esses dans 88 Distances g n tiques et g ographiques iii 88 Les sous chantillons sont align s en une seule dimension 89 Les sous chantillons sont distribu s sur deux dimensions 89 AO OR nn a 90 Tester les biais de dispersion de certaines cat gories d individus 0000 cece cece cena 91 Tester la diff rence entre d OS a a nee een 92 ASS AR cakes deaascuseen 93 Analyse factorielle des correspondances AFC
431. s dans le cadre de campagnes de contr le et ou d limination DIFF RENTIATION ENTRE __LES QUATRE ZONES Analyse HierFstat du jeu de donn es total partitionn par BAPS Nous savons qu une diff renciation existe bien une mini voire micro chelle l int rieur de chacune des zones H et D Nous devons donc tenir compte de ce niveau de structuration micro chelle avant d estimer et tester l existence d une diff rencia tion entre zones Cette information est utile car elle pourrait permettre d estimer le temps n cessaire une recolonisation d une zone limin e par la zone la plus proche Nous allons devoir utiliser HierFstat une nouvelle fois Consid rant que les regrou pements d finis par BAPS pourraient mieux regrouper les individus de la m me unit populationnelle par rapport aux pi ges et pour faire autre chose que dans le papier initial nous allons prendre comme niveau le plus imbriqu les clusters BAPS de chaque zone d finis en p 199 Le niveau suivant sera la zone A H C D et enfin la totalit Il y aura ainsi quatre niveaux d finis avec leur F l individu F5 le 210 Initiation la g n tique des populations naturelles sous groupe d fini par BAPS dans la zone Fs7 la zone dans le tout F27 auxquels s ajoutent bien s r les Fry Frr et Fs7 moins int ressants pour nous En proc dant comme pour les tiques voir p 156 dans la seconde partie de ce manuel et en prenant s
432. s estim exactement gal 0 pareil pour le F7 pour les d s quilibres de liaison l isolement par la distance ou nimporte quel autre param tre Le test statistique est la pour nous aider prendre une d cision quant la disparit observ e entre les donn es et l attendu La diff rence observ e peut elle tre expliqu e par le hasard et avec quelle probabilit Le but d un test statistique sera donc de fournir une r ponse cette question en donnant un crit re la valeur P ou P value du test ou risque de premi re esp ce ou encore probabilit de se tromper en r pondant par la n gative cette question appel e hypoth se nulle On peut ajouter ici qu en g n tique des populations la variance d chantillonnage est d autant plus importante prendre en compte que l chantillonneur lui m me n arrive qu la fin d un processus d chantillonnage qui a lieu naturellement chantillonnage parmi les gam tes disponibles pour fabriquer les zygotes chantillonnage des zygotes qui participeront la reproduction suivante L hypoth se nulle Comme son nom l indique c est une hypoth se qui stipule qu il ne se passe rien ou que la population est conforme une norme un mod le pr tabli ou mod le nul par exemple les fr quences g notypiques sont conformes Hardy Weinberg ou les deux populations ont les m mes fr quences all liques ou encore le Fy ou le F7 nest pas diff rent de 0 On nomme
433. s filles partir d ovules non f cond s 320 Initiation la g n tique des populations naturelles Pas japonais Mod le en Stepping stone model Mod le th orique de population subdivis e o les migrants ne s changent qu entre sous populations adjacentes PCR Polymerase Chain Reaction qui permet d amplifier une portion d ADN encadr e de s quences connues partir de deux amorces d ADN courtes sp cifiques d une zone de ces s quences flanquantes plus de pr cisions dans Google Ph notype Il s agit de l expression d un caract re ventuellement h r ditaire comme la couleur des yeux Pour des marqueurs codominants le ph notype peut directement tre traduit en g notype Philopatrique Se dit d un individu qui montre une tendance significative au retour vers son lieu de naissance Phylog ographie Discipline visant tablir les relations de parent entre populations g ographi quement loign es de la m me esp ce afin par exemple d tablir un sc nario de colonisation de laire g ographique occup e par cette esp ce Pl iotropique Se dit d une s lection ou de l effet d un seul g ne ou famille de g nes qui affecte deux caract res diff rents comme par exemple les g nes du CMH HLA chez l homme qui affectent la fois le syst me immunitaire et la s lection du partenaire sexuel Poissonienne Se dit d une distribution de donn es ordinales discontinues comptag
434. s nuls ne suffisent pas expliquer enti rement les d ficits en h t rozygotes m me si ces derniers sont pr sents comme l attestent la pr sence fr quente d individus blancs ainsi que la forte variance du Fj entre loci 146 Initiation a la g n tique des populations naturelles STRUCTURE DES POPULATIONS ET SCHEMAS DE DIFFERENCIATION Nous avons ici une esp ce sexes s par s La premi re chose tester est s il n existe pas une diff rence entre femelles et m les tiques li e par exemple un biais de dis persion sp cifique de chaque sexe GOUDET et al 2002 PRUGNOLLE et DE MEEts 2002 En plus on sait que c est probablement le cas ici puisque ce signal fut d tect pr c demment DE Megts et al 2002a mais aussi lors de notre recherche de dominance des all les courts Par ailleurs il est int ressant de v rifier si le signal persiste en tenant compte de la microstructure en clusters m me s il a t montr que celle ci a peu pas d effet sur la structure a plus large chelle si la microstructure nest pas trop forte FONTANILLAS et al 2004 Structure g n tique sp cifique a chaque sexe des donn es brutes sans tenir compte de BAPS Comment suspecter qu un biais de structuration existe entre m les et femelles Soit en effectuant directement le test Sex biased dispersal de Fstat soit comme cela a t le cas pour les donn es pr sentes en testant la diff renciation locale entre
435. s significa tive m me si la P value reste relativement faible 0 17 Ceci illustre les limites de notre jeu de donn es beaucoup trop de donn es manquantes CONCLUSIONS SUR LES BORR LIES ET RICINUS EN SUISSE Au cours de nos analyses nous avons constat que Bbss borr lie d cureuil tait plus souvent retrouv e chez les tiques m les que femelles ce qui est attendu si comme le sugg rait le biais de dispersion sexe sp cifique d tect chez ces tiques les larves et nymphes femelles pr f rent se nourrir sur des rongeurs peu disper sants Rien de tel na pu tre trouv pour Bba pour laquelle ceci tait attendu galement peut tre parce qu une certaine quantit de tiques infect es par cette borr lie fait partie du stock Bbundet Quant Bbg trop rarement d tect e d autres tudes seront requises afin de d terminer si comme attendu elle est plus souvent retrouv e chez les tiques m les La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 187 Certaines tiques sont plus sensibles ou plus expos es l infection par les borr lies en g n ral comme l attestent les fortes corr lations positives observ es sur les co occur rences des trois esp ces Bbss Bba et Bbg En se concentrant sur ces tiques sensibles infect es par au moins une borr lie il y a un vitement manifeste Les corr lations deviennent toutes n gatives exception faite de l association Bbssi Bbg pour qui
436. sa source dans la s lection de cellules trypanosomiales 4 diff rents stades de d veloppement exprimant diff rents loci r gulation de l expression Cela confirme si besoin tait que l utili sation de marqueurs non codants comme les microsatellites est toujours souhaitable pour effectuer des analyses de g n tique des populations inf rentielle L analyse de l h t rozygotie relative F7 d montre que la recombinaison sexu e est suffisamment rare pour n avoir laiss aucune signature sur les chantillons examin s G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 283 none 2000 3 E onon 2002 18 Bonon 2000 13 be 2000 5 Bonon 2002 24 Dubreka 1998 76 2561 Tbg1 C te d Ivoire Bonon 2004 38 Bonon 2002 22 Bonon 2002 29 Bonon 2000 2 Bonon 2004 32 Bonon 2004 47 Bonon 2004 39 L__Bonon 2004 42 Bonon 2002 20 Bonon 2004 46 Bonon 2002 21 L Bonon 2002 26 Bonon 2002 19 Bonon 2000 1 He AO T bel Cameroun ua Tbg1 Cameroun ee 2004 40 Bonon 2004 35 Bonon 2004 36 L PeyaTbe1 Congo Bonon 2000 14 Bonon 2000 15 a aa rare a Dal972Tbe1 C te d Ivoire Bonon 2000 1 Bonon 2000 17 Bonon 2004 44 Bonon 2004 45 Dubreka 1998 77 L Dubreka 1998 84 Dubreka 2002 72 Dubreka 2002 75 Dubreka 2002 70 Boffa 2002 50 Botta 2002 49 Dubreka 2002 71 Boffa 2002 59 f Dubreka 1998 85 Dubreka 1998 90 Dubreka 1998 88 Boffa 2002 60 Boffa 2002 61 Boffa 2002 63 Dubrek
437. savons que chez les clones purs homozygotie Qy tend vers 0 ce qui donne It kt aa s S Fe BEC et comme Qs 1 H on a forc ment Fs 258 Initiation la g n tique des populations naturelles H 1 H 0 9089F 0 0797 R 0 9534 w Ss Z e a i 1 0 9 0 8 0 7 0 6 0 5 0 4 0 3 0 2 01 0 Eys Figure 88 R sultat de la r gression entre les valeurs de F s aux diff rents loci et dans les diff rents sous chantillons et la valeur attendue en fonction de H sous l hypoth se d une clonalit absolue La droite d ajustement parfait est en pointill Dans la figure 88 on remarque une relation quasi parfaite entre les deux param tres hormis quatre apostats cherchez dans le dictionnaire dus quelques individus homozygotes un pour msatg9 quatre pour m6c8 rencontr s a et l et tr s vrai semblablement dus des allelic dropouts ou de l homoplasie homozygoties for tuites dues au nombre limit d all les Tous les autres points sont en effet parfaitement align s sur la droite d ajustement parfait La clonalit pure est donc ici certaine DIFFERENCIATION GENETIQUE ET STRUCTURE DES POPULATIONS En g n ral je pr conise les approches globales plut t que par paire de sous chan tillons En effet les mesures et tests par paire ne sont pas les plus efficaces pour appr hender la structure d une population Il vaut mieux alo
438. sera une analyse dite non param trique l aide du coefficient de corr lation de Spearman Dans R les commandes seront en respectant les majuscules et minuscules test unilat ral car on a un pr jug de la direction du signal gt data lt read table BlancFisTsetse txt header TRUE gt attach data gt cor test data Blancs data Fis alternative greater method spearman Le r sultat est un coefficient de corr lation de Spearman p 0 46 tr s significatif P value 0 0073 fig 55 Vous remarquerez que le coefficient de corr lation est l g rement diff rent de celui publi dans l article de Molecular Ecology p 0 499 et P value 0 0048 La dif f rence provient de trois pi ges de l chantillon en zone A le seul o il y avait des m les o le Fy est diff rent Cela provient certainement du recodage des m les ou plus probablement du fait que je mai limin aucun sous chantillon ici m me ceux de taille 1 De toutes mani res cela ne change pratiquement rien Ce genre de petits probl mes est fr quent quand le nombre d analyses diff rentes effectuer est tr s grand comme cela a t le cas ici C est pour cela que j ai choisi d en par ler car cela arrive et il ne faut pas le cacher Ce genre d erreurs assimilables celles Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 197 Tableau 25 Fis et nombre de blancs homozygotes nuls suppos s par pi ge si
439. set 1996 Ces statistiques s av rent peu appropri es si le mod le de mutation d vie un peu du sch ma id al d un SMM et sont de toutes mani res sujettes de trop fortes variances d estimation En r gle g n rale on pr f re utiliser les estimateurs de WEIR et COCKERHAM 1984 BALLOUX et al 2000 BALLOUX et GOUDET 2002 Concepts de base en g n tique des populations 59 Le Fs maximum possible Dans le cas de marqueurs g n tiques hypervariables comme les microsatellites la valeur maximale du Fs ne sera pas 1 car il y a plus d all les que de sous chantillons voir l quation 24 Donc m me si aucun sous chantillon n a d all le en commun diff renciation maximale possible le F 7 pourra tre de valeur modeste HEDRICK 1999 Pour pallier ce probl me HEDRICK 1999 2005 propose une m thode simple pour visualiser de combien le F7 observ est loign de sa valeur maximale que l on observerait sans migration entre sous populations Dans une telle situation et si le nombre de d mes est assez grand nous savons par l quation 21 que Q7 0 probabilit d identit entre individus de d mes diff rents et que le Fs57 est alors gal Q 1 H FsTmav O H est l estimateur non biais de la diversit g n tique de Nei NEI et CHESSER 1983 On peut ensuite diviser la valeur observ e dans les donn es par cette valeur maximale afin d avoir une meilleure appr ciation et non pas une mesure e
440. sid rable et t moigne du peu de migration entre les deux pays Par contre l chelle de la Suisse cette migration est forte et m me si les Alpes apparaissent comme un facteur limitant tout semble se passer comme si g n tiquement au moins on avait faire une seule unit cette chelle Qu en est il si nous tenons compte des clusters trouv s par BAPS Analyse hi rarchique sur donn es clusteris es par BAPS Nous allons donc utiliser le fichier de donn es pr c dent avec une colonne suppl mentaire correspondant aux clusters trouv s avec BAPS En suivant alors une proc dure identique a celle d crite plus haut nous pouvons constater que les facteurs ClusterBAPS FCjust site 0 3 P value 0 001 qui mesurent la partition g n tique entre clusters d un m me site et Continent Foontinent Total 0 11 P value 0 001 qui mesure la diff renciation entre Suisse et Tunisie constituent les deux seuls facteurs qui structurent les sous chantillons de facon significative Si nous ne gardons qu un m le ou une femelle ou un individu par cluster comme pour le tableau 14 le r sultat de analyse par HierFstat ne montre plus aucune dif f renciation moins d ignorer tous les facteurs sauf le continent analyse par Fstat For 0 09 P value 0 001 156 Initiation a la g n tique des populations naturelles Test d isolement par la distance Nous ne travaillerons ici que sur les chantillons suisses de 19
441. sion 5 Molecular Evolutionary Genetics Analysis using Maximum Likelihood Evolutionary Distance and Maximum Parsimony Methods freely downloadable from http www megasoftware net Tamura K PETERSON N STECHER G NEI M Kumar S 2011b MEGAS Molecular Evolutionary Genetics Analysis Using Maximum Likelihood Evolutionary Distance and Maximum Initiation a la g n tique des populations naturelles Parsimony Methods Mol Biol Evol 28 2731 2739 TayLor J W Gerer D M BURT A Kouroranou V 1999 The evolutionary biology and population genetics underlying fungal strain typing Clin Microbiol Rev 12 126 146 TERBLANCHE J S CHowx S L 2007 Factory flies are not equal to wild flies Science 317 1678 TER Braak C J E 1986 Canonical correspond ence analysis a new eigenvector technique for multivariate direct gradient analysis Ecology 67 1167 179 TER Braak C J E 1987 CANOCO a Fortran program for canonical community ordination Microcomputer Power Ithaca New York USA Ter Braak C J F maver P 2002 CANOCO Reference Manual and CanoDraw for Widows Users Guide Software for Canonical Community Ordination version 4 5 Microcomputer Power Ithaca New York TERIOKHIN A T DE Meets T GU GAN J E 2007 On the power of some binomial modifica tions of the Bonferroni multiple test Z Obshch Biol J Gener Biol 68 332 340 THomas E RENAUD
442. sis for estimating spatial and environmental effects on microsatellite gene diversity in brook charr Salvelinus fontinalis Mol Ecol 8 1043 1053 ARNAVIEHLE S DE Meets T BLANCART A MALLI M RENAUD E BASTIDE J M 2000 Multicentric study of Candida albicans isolates from non neutropenic patients Population struc ture and mode of reproduction Mycoses 43 109 117 ASHLEY Jr C T Warren S T 1995 Trinucleotide repeat expansion and human disease Annu Rev Genet 29 703 728 AvisE J C 2000 Phylogegraphy the History and Formation of Species Harvard University Press Cambridge Massachusets AVISE J C ARNOLD J BALL R M BERMINGHAM E Lams T NEIGEL J E REEB C A SAUNDERS N C 1987 Intraspecific phylogeography the mitochondrial DNA bridge between population genetics and systematics Ann Rev Ecol Syst 18 489 522 Bapoc C De MEE S T BERTOUT S Opps E C MALLI M BASTIDE J M 2002 Clonality struc ture in Candida dubliniensis FEMS Microbiol Let 209 249 254 Barroux E 2001 EASYPOP version 1 7 A computer program for population genetics simula tions Hered 92 301 302 Barroux F 2004 Heterozygote excess in small populations and the heterozygote excess effective population size Evolution 58 1891 1900 Barroux E BRUNNER H LUGON MOULIN N HausseEr J GOUDET J 2000 Microsatellites can be misleading an empir
443. sites on obtient une confirmation de ce qui tait observ tabl 11 mais sur une chelle plus r aliste quant aux interpr tations biologiques en fin de ce cha pitre Il semble donc bien y avoir un biais de dispersion femelle ou tout le moins Tableau 11 R sultats du test de biais de dispersion sp cifique chaque sexe sur les cing sites du nord ouest de la Suisse Except la variance d assignement s AJ tous les autres param tres plaident en faveur d un biais de dispersion m le les femelles dispersent moins avec une P value tests bilat raux tr s significative pour AJ et Fy et significative pour H Pour le Fj le test unilat ral a t r alis en supprimant le locus IRO8 AL 0 523 0 786 0 0002 AL 9 970 8 611 0 3425 For 0 001 0 000 0 7964 H 0 776 0 813 0 0224 Fe 0 422 0 506 0 0081 La tique Ixodes ricinus et les pathog nes Borrelia sp qu elle transmet 149 un biais de structuration g n tique en faveur de ces femelles En retirant chaque locus un un et en recommen ant I analyse donc cing traitements vous pourrez v rifier qu aucun locus n est responsable lui seul du signal On constate m me pour les donn es sans IRO8 que le Fys est significativement sup rieur chez les m les tabl 11 On pourra ici se contenter de refaire ces analyse sur les chantillons du Nord Ouest et en unilat ral pour compenser la perte de puissance La question qui se pose ensuite est de savo
444. solution matricielle avec un logiciel de math ma tiques Ceci avait d j t fait dans BALLoux et al 2003 et donne pour Frys et Fsr apr s correction des erreurs dans les formules Korr1 et al 2009 Appendice Ilas Ilas gall A E S L 2M1 lila gal U tlas tlas qall 1 1 lids aa FT NT NT Te 2M1 y llt fgs gallt lagala 1 2al al Si on remplace g par 1 g dans le cas o 2 sous populations Fret lgs 1124 1 D RON a o yS T 2 N1 Hy 2q 1 1 lgs I 24 1 a plt y 2gs 1 anit y lla plg ali ae 4 102 1 2q 1 Sachant que les termes en u sont n gligeables par rapport 1 on peut consid rer que y 1 2u et donc 1 2ullg 1 2ul 2 1 B Na 1 zalla 2all29 1 1 ae 24e 2allag 1 QM A 1 24e 1 24 29 allt la g ll2 2u a 2g l1 2u 1 G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 275 1 2uj q 2g 1 4uq 2ul Ps m e e A E 4Nd 2q 1 4ug t 2u 1l 1 2ullg 2q 1t Aug 2ul 2u 4u 2q 1 4Nul 2q 1 4ug 2u 1 gJ 1 24 Aug D 1 24 9 4 1 4ug 2u Peame ee ee a CR 8Nuq l 2uq t TA 1 24 g lt 4uq 24 Aug 2u Su a Au 8Nul u g 1 2ul t 1 2u g 2ug 4uq D g 1t 4uq 2u 2uq 2u 8u q Au a E a a a E 8 Nu IE ul q 1 2u j 2u 1 2u q 1 Au Fer 2u 2q 1 2u 1 24 8Nul u g 1 2ul 1 2ul g 1 24 Nous allons maintena
445. spondra une population diff rente et en liminant pour le moment les souches de r f rence Une fois que cela est fait on traduit ce fichier au format Fstat en suivant la m me proc dure que pr c demment Analyse des d s quilibres de liaison et des Fs Jai appel mon fichier T BruceiFoyAnCI amp Guin dat Dans l analyse Fstat apr s avoir charg ce fichier et choisi un fichier Label for pops dans Options j ai coch les cases correspondant aux fr quences all liques mesures de diversit g n tiques sur l ensemble et par locus et population le test sur le F global et pour chaque locus dans chaque sous population ainsi que celui pour le d s quilibre de liaison dans chaque population et entre chaque paire de loci Je m arrange pour qu il y ait 10 000 permutations au moins Une fois que tout est pr t il faut cliquer sur Run et attendre que toutes les permutations soient finies 1 mn chez moi Les r sultats apparaissent dans le fichier T BruceiFoyAnCI amp Guin out D s quilibres de liaison Nous ne regardons que les tests sur l ensemble des sous chantillons et par paire de loci Sur les 21 tests possibles 18 paires de loci sont significativement en d s quilibre de liaison au seuil 5 Cela est largement au dessus des 5 attendus m me pas besoin de faire un test binomial mais bon cela donne une P value lt 0 0001 Treize tests restent significatifs au seuil Bonferroni s quentie
446. supprimant le locus IROS AL 0 160 0 216 0 0067 AL 1222 0 691 0 0706 For 0 219 0 338 0 0012 H 0 584 0 524 0 0142 Fis 0 189 0 297 0 0544 Ce r sultat tr s d concertant au premier abord est sous tr s forte influence du locus IR08 bien que les autres loci r pondent dans le m me sens sauf peut tre IR32 Comme il s agit peut tre d un ph nom ne local nous allons refaire les m mes analyses mais dans chaque site de 1996 y compris la Tunisie Le r sultat 150 Initiation la g n tique des populations naturelles des tests sur le Fr figure dans le tableau 13 Le signal reste le m me mais semble dispara tre sans le locus RO8 Il se pourrait que ce locus soit diagnostique de certains groupes de tiques Pour v rifier cela il faut reprendre le fichier initial de donn es et grouper les individus dans chaque site selon leur g notype au locus IRO8 Ce fai sant on recalcule sur cette nouvelle partition le Frys et le Fs7 avec Genetix ce qui donne 0 47 et 0 02 respectivement alors qu on attend un faible Fys et un fort Foz IRO8 n est manifestement diagnostique de rien du tout et le fait qu il donne les meilleurs r sultats provient vraisemblablement de sa qualit peu ou pas d all les nuls et tr s faible variance des diff rents estimateurs Tableau 13 R sultat des tests de biais de dispersion sp cifique de chaque sexe sur F57 effectu s dans chaque site entre les clusters d finis par BAPS et contenant
447. syst mes clonaux reproduction v g tative conduisent un d s quilibre global certains auteurs ont d velopp des mesures multilocus du d s quilibre de liaison par exemple Acarow et Burt 2001 Il est cependant important de noter ici que le comportement de ces diff rentes mesures dans diff rentes conditions de popula tions n a t que peu tudi jusqu pr sent malgr l importance soulign e de telles tudes DE Meets et BALLOUX 2004 L absence de d s quilibre de liaison est une hypoth se souvent mise en avant car certaines analyses statistiques consid rent l information apport e par les diff rents loci comme ind pendante Un d s quilibre de liaison fort risquant d apporter une redondance conduisant un risque d erreur de d cision trait dans le chapitre suivant il est souvent plus confortable de pouvoir carter ce probl me tout en sachant qu il ne peut exister de population exempte de d s quilibre de liaison 66 Initiation la g n tique des populations naturelles BT acts Statistiques BASES Intuitivement on sait qu un chantillon ne sera jamais une repr sentation absolu ment fid le de ce qui existe dans la population enti re Il en d coule que l chan tillonnage provoque une d viation des estimateurs que l on peut calculer variance d chantillonnage On aura donc rarement m me dans une population chan tillonn e strictement conforme Hardy Weinberg un Fr
448. t Year semblent importer et que le logiciel n est apparemment pas tr s satisfait de la qualit des donn es Pour simplifier ce mod le une commande pratique est la commande step qui permet d analyser la qualit de diff rents mod les plus simples en retirant et ajoutant des termes l un apr s l autre en commen ant par les interactions d ordre sup rieur celles faisant appel au plus grand nombre de facteurs Ceci est valu l aide d un crit re appel AIC Akaike Information Criterion AKAIKE 1974 dont la valeur qui doit tre minimis e est une mesure de la qualit d ajustement du mod le statistique estim par rapport aux donn es Il ne s agit pas d un test mais d un outil d aide la s lec tion du mod le le plus simple permettant d expliquer au mieux les donn es le mod le dot du plus petit AIC tant le meilleur cf r ponse 12 pour plus de pr cisions En tapant donc la commande gt step Bba La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 171 nous obtenons les r sultats pour une s rie de diff rents mod les de plus en plus simples o les diff rents termes sont retir s un un en commen ant par l interaction la plus complexe Sex Site Year qui est limin e PAIC obtenu 338 69 s av rant inf rieur celui du mod le complet 343 81 puis les interactions plus simples Sex Site et Sex Year jusqu ce que le retrait des facteurs conduisent
449. t jamais h siter demander conseil un sp cialiste On ne risque en effet que le d sa gr ment de se faire envoyer promener ce qui nest pas mortel Aider ses coll gues et en particulier les tudiants est un devoir sacr des chercheurs Ceux qui refusent de le comprendre ne m ritent mon sens pas leur salaire Alors mon adage en la mati re est aucune h sitation La plupart des exemples et des propos de ce manuel sont centr s sur des probl matiques h te parasite vecteur Cela vient naturellement de mon exp rience en la mati re Il n en reste pas moins que les m thodes d crites ici sont applicables tous les tres vivants m me si d autres outils sont utilis s ailleurs en particulier en bact riologie Il me faut galement remercier un certain nombre de personnes qui par leurs conseils les changes que j ai pu avoir avec elles ou les coups de pouce qu elles m ont donn s m ont permis d acqu rir les comp tences qui sont les miennes aujourd hui Je ne remercie pas ici ceux qui m ont aid dans d autres domaines de la biologie des populations non directement reli s aux th matiques d velopp es dans le pr sent manuel Je tiens d abord remercier J r me Goudet de m avoir mis le pied l trier des F statistiques de Wright de leurs estimateurs et des tests associ s ainsi que de sa patience lors de mon post doc Bangor alors que je le harcelais de questions parfois sans doute un peu d biles Il m
450. t que les m thodes impl ment es par Estim et celles bas es sur les exc s d h t ro zygotes n avaient pas t utilis es pour les tiques p 160 164 de la seconde partie Chez les tiques la forte pr sence d all les nuls en plus de la dominance des all les courts au locus IR27 rendaient caduque toute approche bas e sur les corr lations d all les intra individuelles Ici il ny a pas de dominance d all les courts et les all les nuls sont peu influents m me si on ne peut totalement exclure leur impact voir plus haut Tableau 27 Strat gie de regroupements par pi ge de Gpg le long du Mouhoun en se basant sur la figure 52 et estimation des effectifs efficaces Les r sultats sont donn s pour les trois m thodes utilis es pour des r sultats autres que infini 0 ou NA not available cases vides Le nombre d individus g notyp s par pi ge est donn Nr Pi ges Niraps Estim D s quilibres Exc s de liaison d h t rozygotes A L2 1292 A 4 5 6 2 1 4 5 A 7 4 5 119 A 8 4 3 4 A 9 10 11 22 116 4 7 A 12 3 0 3 A 13 14 4 0 7 H I ed H 3 4 12 25 204 Initiation la g n tique des populations naturelles Tableau 27 suite Le logiciel Estim http www ecoanthropologie cnrs fr spip php article296 utilise un fichier au format Genepop Dans la mesure o Estim utilise les identit s intra indivi duelles interindividuelles inter chantillons et leur corr lation entre loci et que par
451. t on ne peut pas dire grand chose de plus que les surfaces d chantillonnage s tendaient grossi rement sur S 0 2 km Ceci signifie mais vous vous en doutiez probablement que les estimations venir seront tout fait approximatives A partir de l les densit s sont faciles calculer N S La densit moyenne devient 1 340 tiques reproductrices km 95 CI 594 2 706 avec un minimum et un maximum de 367 et 3 502 tiques km respectivement tabl 16 En r utilisant les r sultats de la r gression de l isolement par la distance D o 13 78 voir p 160 on aboutit une surface de dispersion moyenne entre adultes et leurs parents d environ 0 01 km 0 005 0 023 avec un minimum et un maximum de 0 004 et 0 038 km respectivement Autrement dit la distance moyenne s parant un adulte reproducteur de ses g niteurs est d un ordre de grandeur de 100 m par g n ration donc tous les trois ans environ un intervalle de confiance 95 de bootstrap 71 152 et un maximum et un minimum de 63 195 m ce qui est relativement modeste Les donn es clusteris es par BAPS conduisent une densit de 3 000 tiques par km et une dispersion de moins de 60 m par g n ration Donc sachant que l estimateur sans doute le moins biais est le produit D 0 la dispersion par g n ration est quoi qu il en soit extr mement modeste moins d voquer des densit s effectifs efficaces extr mement faibles Il en va donc de
452. t p 147 153 de la seconde partie Les tests doivent tre bilat raux et on proc dera 10 000 permutations Les r sultats des analyses par levage sont pr sent s dans le tableau 30 On y voit bien qu aucun signal n existe Il ny a que deux tests significatifs sur les 24 effectu s ce qui nest pas significativement diff rent des 5 attendus sous l hypoth se nulle test binomial P value 0 34 De plus il y a de nettes contra dictions entre param tres pour un m me site ou entre sites pour un m me para m tre Les analyses sur l ensemble des infra populations ou sur l ensemble des fermes en ignorant les infra populations confirment l absence de tout signal P value gt 0 27 Il ny a donc aucune trace d un biais de dispersion sp cifique au sexe chez cette tique 226 Initiation la g n tique des populations naturelles Tableau 30 R sultats des analyses de biais de dispersion sp cifique au sexe entre infra populations de B microplus au sein des levages de Nouvelle Cal donie Les valeurs de param tres donnant le sexe F ou M le moins dispersant sont en gras et les P values lt 0 05 sont en italique Tests de pangamie Ces donn es ne sont disponibles que pour quatre sites et cest pourquoi elles sont disponibles dans un fichier 4 part BooCattleCouples txt dans lequel figure le nom du couple auquel appartiennent chaque femelle et chaque m le Il s agit de tester si les couples s associent de
453. t pour ne pas avoir supprimer les clusters d un individu pour lequel le calcul ne se fera pas et tant donn que Fstat ne prend pas plus que 200 sous chantillons avec mes partitions je me retrouve avec 368 sous chantillons nous allons importer notre nouveau fichier sous Genetix Lancez Genetix et allez dans le menu Fichier s lectionnez Importer et s lection nez Texte avec s parateur et s lectionnez le fichier Un menu appara t et si vous avez fait comme moi vous devez cocher les cases comme dans la figure 30 Quand cela est fait cliquez OK Si le fichier est correctement charg cliquez dans le menu Fstats et s lectionnez Weir amp Cockerham Cliquez OK dans la nouvelle fen tre si vous ne changez pas le nom du fichier de sortie propos IRTotBAPSClustMalManqlRO8MEFSep res Apr s il faut prendre les r sultats dans ce fichier en prenant garde que ce qui est annonc comme cart type des jackknives 142 Initiation a la g n tique des populations naturelles 0 7 0 74 0 64 E 0 5 T m 7 0 44 7 as T _ mi 0 3 E _ E 0 24 sxe F E 0 14 E m o Sg e O t sl 4 l T W T K T T T 1 IR08 IRO8 IR25 IR25 IR27 IR27 IR32 IR32 IR39 IR39 Tous Tous Brut BAPS Brut BAPS Brut BAPS Brut BAPS Brut BAPS Brut BAPS Figure 31 Comparaison de Frs avant donn es initiales Brut P e IS et apr s clusterisation par BAPS sur l ensemble des donn es par l
454. t prometteuses perspectives de recherche que je vous laisse le soin de discuter INTERACTIONS AVEC LES MICROPATHOGENES __ TRANSMIS Introduction La tique Z ricinus transmet un tr s grand nombre de pathog nes ses multiples h tes dont la borr liose de Lyme qui dans les r gions bor ales repr sente un poids cono mique et en sant publique important GUBLER 1998 Les agents de la borr liose de Lyme appartiennent au complexe d esp ces Borrelia burgdorferi sl Il existe actuelle ment 12 13 esp ces ou g noesp ces reconnues dans le complexe dont 4 B burgdor feri B garinii B afzelii et B spielmanii sont pathog nes pour l homme borr liose de Lyme et deux autres B valaisiana et B lusitaniae sont de pathog nicit incertaine RICHTER et al 2006 Posric et al 2007 Ces diff rentes esp ces ne sont d ailleurs pas responsables de sympt mes identiques et pr sentent des sp cificit s d h tes r ser voirs diff rentes DE Meets er al 2004b En Europe de l Ouest B burgdorferi est pr f rentiellement retrouv e chez l cureuil roux B afzelii chez des campagnoles des mulots et aussi l cureuil roux B garinii plut t chez des oiseaux et B spielmanii uni quement chez le loir RICHTER et al 2006 Quant B valaisiana elle se montre sp cifique des oiseaux alors que B lusitanaiae n a t trouv e en dehors de la tique I ricinus que chez un l zard Postic et al 2007 L pid mi
455. t sacs A E AEA A E EA E stad bute sinebaldae sic 32 CO a O V AA 33 S lection directionnelle 2c ncriackcwennkecaasalnnedianhteasateisidesontditennisandedsenssendaroaieanilarnsseeusdncabsenedaseannoneiaiaaneamenes 33 SUG ONIN 0162 RS E aa cine ovata e E nantes pune a E E 34 SSN NAC aM MC eaii a ee nec da ee on 34 La s lection fr quence d pendante iii 35 329 R nee RIC ne ee RTO ESE See nee A 35 La s lection gamM tique accrcanceimcesine dbncenindnetneitbeceahadatoresabaietnaddabsdeadiabamideabiababsdeteiabahetaubiaannccadmensaneesanenes 36 Le r gime de reproduction n est pas PANMICTIQUE e ssssissessiiissesiiisssiiireserirrrerrrrrerrrrrrrrrrn 36 AU D OS d NRE NT a 36 Les croisements syst matiques entre apparent s 38 LTA 0 0 10 RE E a E EE E E Eai eE EE EEE e 38 Ll h t rogamie tig 2g dada me eee ade aaron eam i nada eade 38 La CION GING EP RER EEE 40 Les g n rations se chevauchent iii 40 La notion de d ficit en h t rozygotes d finitions 40 Populations structur es effet Wahlund et statistiques F F statistics 43 L exemple du mod le NN S nn oetrmmeernmenreresmenememetiunetiomenensieoniis 43 Le d ficit en h t rozygotes d la structuration effet Wahlund ccccccccccccstececceteeeeeeetteeeeees 44 les slams oques FOS WAGNER der rian sens mme este nee ie 46 D finitions ClaSSIQUES icic25icerncoaseddvanancunertiaveescia viswbtdumshdaeeidans vdepeidaeth
456. t unilat ral le moins max puissant des deux Alors la P value bilat rale est simplement gale Pin 1 Prax Comme mentionn plus haut il se peut que P nax soit inutilisable ou bien qu elle ne soit pas calculable Dans ce cas on peut aussi multiplier Phin par deux Pour le second probl me celui ci est relatif aux probl mes li s aux tests multiples Nous traiterons cela plus loin Autres m thodes pour tester l cart la panmixie Tests exacts Tester la conformit la panmixie est synonyme de tester une conformit une rencontre al atoire des gametes et donc aux proportions g notypiques attendues sous les hypoth ses de Hardy Weinberg de la forme p7 2p 1 p pour un all le 7 quelconque Ceci peut tre galement test avec le test exact de HALDANE 1954 souvent improprement appel test exact de Fisher qui correspond en fait autre chose ou par la g n ralisation de ce test pour plus de deux all les Guo et THOMPSON 1992 comme cela est propos dans Genepop RayMonp et RousseT 1995b Je n encourage cependant pas l utilisation de ce test pour plusieurs raisons D abord ce test analyse la distribution de tous les g notypes possibles et pas forc ment ce qui est affect par un syst me de reproduction particulier telle que l autof condation Pour un locus plus de deux all les l hypoth se nulle peut tre rejet e parce que certaines classes g notypiques manquent au profit de certaines
457. tait pas auparavant dans la population et qui sera d finitivement perdu s il dispara t Ne permet aucune homoplasie les mod le en Mod le th orique de population structur e en n d mes de tailles identiques VV com pos s chaque g n ration non chevauchante de 1 m N individus autochtones et de mN individus migrants provenant al atoirement de n importe quel des n d mes Inbreeding Voir Consanguinit Inf inite island model Ou mod le en les infini Mod le en les avec un nombre infini de sous populations Infra population Utilis en parasitologie pour d signer l ensemble des individus de la m me esp ce de parasite contenus dans un individu h te Intron Partie d un g ne qui ne sera pas traduite en prot ine car limin e lors du passage de PARN de transfert vers l ARN messager ph nom ne d pissage antonymique d exon 318 Initiation a la g n tique des populations naturelles Island model Mod le en les Un mod le th orique de population subdivis e g n rations non chevauchantes o les individus sont distribu s dans 7 sous populations les cha cune de taille NV et construite chaque g n ration de mN migrants en provenance de n importe laquelle de n sous populations et 1 1 N r sidents ou individus philo patriques KAM K Allele Model Mod le de mutation en nombre fini K d all les Mod le de mutation o chaque mutation change un all le dans un autre all
458. tal soit inchang Il en existe trois types la moyenne e pie l N arithm tique la plus courante x Fi Xi 3 la moyenne g om trique x MI x ou racine Mi me des N produits xl xi x la moyenne h armonique xy N 1 i i x Neighbourhood model Mod le en voisinage Un mod le th orique de population structur e o la migration de chaque individu est limit e par la distance de telle sorte que l apparentement entre individus devient une fonction d croissante de la distance qui les s pare m me en l absence de toute barri re ou d limitation visible Neutre D finit un locus ou un caract re dont le polymorphisme n est soumis aucune pression s lective d aucune sorte antonymique de s lectionn Ordinales Qualifie des donn es que l on peut ordonner comptages ou mesures Overdominance Superdominance Processus s lectif au cours duquel la survie et ou le succ s repro ducteur d un individu se trouve augment s si cet individu est h t rozygote un locus donn Ovule Gam te femelle Pangamie D crit un mode d accouplement al atoire ind pendant du g notype des individus d une population reproduction sexu e Panmixie D crit un mode de reproduction sexu e o les zygotes sont form s par rencontre al atoire de tous les gam tes de la population Parth nogen se Du grec NAPBEVOG partenos vierge and YEVEOLG gen se quand une m re pro duit de
459. te C est le cas des mod les de g ne pour g ne avec co ts s lectifs o seuls les parasites virulents peuvent infecter les h tes r sistants alors que les h tes susceptibles peuvent aussi tre envahis par les parasites avirulents c est le cas aussi des mod les appel s matching alleles o chaque allele de r sistance de l h te ne permet l invasion que d un type de parasite porteur d un all le de virulence pr cis se r f rer AGRAWAL et LIVELY 2002 pour une description plus d taill e de ces deux mod les On con oit que si on a par exemple deux types de parasites P1 et P2 et deux types d h tes H1 et H2 si seul H1 est com patible pour P1 et H2 pour P2 mais que ce parasite est l tal pour l h te dans lequel il parvient s installer on comprend bien que ce syst me fonctionnera de fa on fr quence d pendante Ici la signature de ce syst me au niveau du locus en tant que marqueur g n tique ne sera pas vidente mettre en vidence autrement que par des exp riences ou des suivis dans le temps de tous les acteurs du syst me La fr quence d pendance aura souvent tendance homog n iser les fr quences all liques des loci concern s sur une grande part de laire de r partition de l esp ce Cependant linte raction avec les sch mas de migration peut potentiellement complexifier ce sch ma GANDON et al 1996 GANDON 2002 MoRGaN et al 2005 H t rosis Uh t rosis ou
460. te de l enti ret du Frs des populations de cette tique Comme pour les tiques ricinus il existe peut tre une structure cach e un effet Wahlund Nous allons donc dans la section qui va suivre rechercher cet effet Recherche d un effet Wahlund Nous allons ici de nouveau r utiliser le logiciel BAPS que nous ferons fonctionner dans chaque ferme tant donn que nous avons montr que les tiques se r partissent au hasard dans ces levages mais pas entre levages Le format et la proc dure ayant d j t d crits en d tail nous allons tout de suite regarder les r sultats en termes de nombre de clusters trouv s et de leur Frs Nous allons aussi en profiter pour regarder les r sultats obtenus avec un nouveau logiciel Flock DUCHESNE et al 2010 DUCHESNE et TURGEON 2009 qui n existait pas encore quand j ai commenc r diger ce manuel et oui j ai mis un temps fou BAPS Les partitions obtenues par BAPS dans les diff rents sites donnent des r sultats plus ou moins bons avec parfois beaucoup de clusters tabl 32 Le Frs de cette nouvelle partition chute de fa on spectaculaire Frs 0 14 avec un intervalle de confiance a 95 de 0 17 0 11 contre 0 04 compris entre 0 02 et 0 07 pour les donn es initiales Une telle chute vers des valeurs aussi n gatives est difficile 4 expliquer par un simple effet Wahlund Cela signifierait en effet que chaque levage renferme de nombreuses et minuscules sous pop
461. te et par locus Rho_Spearman 0 46 P value 0 0073 x 0 2 4 6 8 10 T2 14 Nombre de blancs Figure 55 Corr lation entre nombre de blancs observ s et valeur du F s par locus et pi ge site ventuelles associ es au g notypage sexage etc in vitables la longue n est cependant pas en mesure de g n rer un signal quelconque et va plut t contribuer masquer les signaux de faibles amplitudes Ici les all les nuls expliquent donc bien en partie les F7s En mettant au carr le coefficient de corr lation trouv on r alise qu environ 21 seulement de la variance de ces derniers est expliqu e par ce ph nom ne 16 si on utilise le coefficient de d termination normal Il est donc raisonnable de rechercher d autres facteurs responsables de ces d ficits en h t rozygotes Clusters BAPS Ici en ce qui concerne mon analyse les clusters trouv s par BAPS semblent expli quer une tr s grande partie du d ficit en h t rozygotes voire la totalit puisque nous passons d un F s 0 175 un Fys 0 031 non significativement diff rent de 0 cette fois panmixie locale Il semble donc bien que l effet Wahlund soit respon sable de la plus grande part du d ficit en h t rozygotes Il semble aussi que les pi ges eux m mes capturent des mouches issues de voisinages diff rents puisque le Frs intra pi ge m me s il baisse reste fortement positif La correspondance entre les clusters BAPS et pi ges est c
462. terferon y response J Infect Dis 196 1620 1628 MacLeop A TWEEDIE A WELBURN S C Maupin I TURNER C M R Tarr A 2000 Minisatellite marker analysis of Trypanosoma bru cei Reconciliation of clonal panmictic and epidemic population genetic structures Proc Natl Acad Sci USA 97 13442 13447 MacLeop A TWEEDIE A MCLELLAN S HOPE M TAYLOR S COOPER A SWEENEY L TURNER C M R Tarr A 2005a Allelic segregation and independent assortment in 7 brucei crosses Proof that the genetic system is Mendelian and involves meiosis vol 143 pg 12 2005 Mol Biochem Parasitol 144 131 131 MacLeop A TWEEDIE A MCLELLAN S TAYLOR S COOPER A SWEENEY L TURNER C M R Tarr A 2005b Allelic segregation and independ ent assortment in T brucei crosses Proof that the genetic system is Mendelian and involves meiosis Mol Biochem Parasitol 143 12 19 MacLeop A IWEEDIE A MCLELLAN Ss Tayzor S HALL N BERRIMAN M EL SAYED N M Hore M Turner C M R Tarr A 2005c The genetic map and comparative analysis with the physical map of Trypanosoma brucei Nucleic Acids Res 33 6688 6693 MacLeop A IWEEDIE A MCLELLAN S Taytor S HALL N BERRIMAN M EL SAYED N M Hore M Turner C M R Tarr A 2006 The genetic map and comparative analysis with the physical map of Trypanosoma brucei vol 33 pg 6688 2005 Nucleic Acids Res 34 764 764 Ini
463. tervalle de confiance 95 de cette projection peut galement tre dessin e Tests statistiques 97 Lutilisation de PACC est rare mais peut se montrer efficace ou au moins illustrative SKALAMERA et al 1999 ANGERS et al 1999 Le logiciel ADE 4 permet aussi ce genre d approches CHESSEL ef al 2004 Construction d arbres Construire des dendrogrammes cens s relier les diff rents individus ou sous chan tillons en fonction de leur proximit g n tique procure un moyen assez l gant et relativement simple de repr senter les donn es g n tiques suivant un sch ma hi rar chique Ce mode de repr sentation est d ailleurs si populaire quinnombrables sont les tudes qui l utilisent Un des champs d application privil gi de la construction d arbres peut tre trouv dans les tudes d pid miologie mol culaire d organismes clonaux voir TAYLOR et al 1999 pour revue Plusieurs m thodes existent Pour des donn es type microsatellites ou allozymes cause de l homoplasie il n est pas raisonnable d esp rer obtenir quelque chose ayant valeur phylog n tique Selon TAKEZAKI et NEr 1996 la m thode par NJTREE neighbor joining tree bas e sur une matrice de distances harmoniques type CAVALLI SFORZA et EDWARDS 1967 para t l option la plus pertinente Le logiciel MEGA 5 Tamura et al 2011a Kumar et al 2004 Tamura et al 201 1b libre ment t l chargeable de http www megasoftware net offre
464. tiation la g n tique des populations naturelles Manet S GAGGIOTTI O E Warres R S 2005 Assignment methods matching biological ques tions techniques with appropriate techniques Trends Ecol Evol 20 136 142 Manr y B J E 1997 Randomization and Monte Carlo methods in biology 2 d Edition London Chapman amp Hall MANTEL N 1967 The detection of disease clus tering and a generalized regression approach Cancer Res 27 209 220 MAYNARD SMITH J SMITH N H O ROURKE M Spratt B G 1993 How clonal are bac teria Proc Natl Acad Sci USA 90 4384 4388 McCoy K D Bourmer T Tirard C MICHALAKIS Y 2003 Host dependent genetic structure of parasite populations differential dis persal of seabird tick host races Evolution 57 288 296 McCoy K D CHapuis E Tirarp C Bou tinier T Micuarakis Y LEBOHEC C LEMAHO Y GAUTHIER CLERC M 2005 Recurrent evolution of host specialized races in a globally distributed ectoparasite Proc Roy Soc London B 272 2389 2395 McCuttacu P NELDER J A 1989 Generalized Linear Models London Chapman and Hall MEIRMANS P G 2006 Using the amova frame work to estimate a standardized genetic differentia tion measure Evolution 60 2399 2402 Metropouis N 1987 The beginning of the Monte Carlo method Los Alamos Science 15 125 130 MEUNIER C HURTREZ BOUSS S S JABBOUR ZAHABR DURAND P
465. tilli Biased dispersal Mantelise it Help F slaistics Testing and Disequiibeum Comp among grout of samples Lens diversities and F Statistics Genotpoic descente 7 Parlor and sample daite Gibal dattes FF Abee lreguencies F Neds Fataistics Eine vata std Genotype bequencies F Wer and Cockerham Fetalishes I Tests between al pait of loci I Number ot alleles I Rha 7 Tests belween al pairs of loctin each sempla T Aleti richness I Fat per pai of samples Homin bevel Bo I W Gerediversty shay re Pi FA fF 1100 ft Fee j Testing Save Tables Global Tests j fe Hardy Wieden mithin samples 10000 z 5 Hardy Weinberg overal samples p ai Poputshon chfesendialion F NO bee I Test MOT assuming HW within samplet jo Test assuming HW within samples fo x M Hw lees pet locus and ample Norranal tevel fot multiple best P Pav inate of iffenantistion Eee ee Figure 67 Cadre de Fstat avec les analyses 4 effectuer pour les donn es des marqueurs microsatellites de Boophilus microplus Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 225 confirme que r unir les infra populations d une m me ferme est valide pas d effet Wahlund Enfin la diff renciation entre fermes est significativement sup rieure 0 P value 0 0001 avec un Fs7 0 016 ce qui compte tenu de la diversit g n tique pr sente H 0 704 repr sente une diff rentiation standardis e relati
466. timation of fixation indices and gene diversities Ann Hum Genet 47 253 259 NIKLASSON M TOMIUK J PARKER Jr E D 2004 Maintenance of clonal diversity in Dipsa bifurcata Fall n 1810 Diptera Lonchopteridae I Fluctuating seasonal selection moulds long term coexistence Heredity 93 62 71 Nyroxou E Nkxinin S W GR BAUT P PENCHENIER L BARNABE C TIBAYRENC M HERDER S 2004 An isoenzyme survey of Trypanosoma brucei s l from the Central African subregion population structure taxonomic and epidemiological considerations Parasitology 128 645 653 Nunnery L Baker A E M 1993 The Role of Deme Size Reproductive Patterns and Dispersal in the Dynamics of T Lethal Haplotypes Evolution 47 1342 1359 Bibliographie 295 Onura T 1982 Linkage disequilibrium due to random genetic drift in finite subdivided popula tions Proc Natl Acad Sci USA 79 1940 1944 OsTERKAMP J WAHL U SCHMALFUSS G Haas W 1999 Host odour recognition in two tick species is coded in a blend of vertebrate volatiles Comp Physiol A Sens Neural Behav Physiol 185 59 67 Parrxau D Srrogeck C 1995 The molecu lar basis and evolutionary history of a microsatel lite null allele in bears Mol Ecol 4 519 520 PAETKAU D Catvert W STIRLING l STROBECK C 1995 Microsatellite analysis of population structure in Canadian polar bears Mol Ecol 4 347 354
467. tion ou d un coefficient de corr lation entre les deux matrices est calcul e partir des donn es r elles puis compar e la s rie de pseudo valeurs obtenues par permutation al atoire de l ordre des populations dans l une des deux matrices de distances partir de l la suite devient similaire tout autre test par permu tation On pourra consulter la r ponse 8 pour plus de d tails sur le test de Mantel Distances g n tiques et g ographiques Ce cas de figure a t tudi en profondeur par RousserT 1997 Ici les sous chan tillons peuvent tre distribu s de deux fa ons diff rentes qui requi rent chacune une analyse qui lui est particuli re Cependant dans les deux cas la matrice des distances g n tiques doit contenir une mesure corrig e de la diff renciation entre paire de sous populations savoir 6 1 0 voir Rousset 1997 8 tant l estimateur du For voir p 53 On sait en effet par l quation 21 que er a Sachant que dans le cas d un isolement par la distance c est dire quand la diff renciation augmente avec l loignement g ographique des individus et si chaque d me connait un fonctionnement raisonnablement similaire 4 peu pr s m me taille et m me syst me de reproduction on voit bien que Qs la probabilit didentit de g nes entre deux individus de la m me sous population sera peu pr s la m me d une sous population l autre alors que Qz probabilit
468. tions chacune environ s par es de 70 km soit 1 400 sous populations environ Nous avons donc besoin de simuler 1 520 populations de taille 30 et changeant 0 5 proportion de migrants dans un stepping stone en une dimension Glossina palpalis gambiensis le long de la rivi re Mouhoun au Burkina Faso 213 Il faut maintenant lancer la simulation Copiez Easypop dans le r pertoire o vous souhaitez travailler et double cliquez dessus sur le fichier programme pas sur le r pertoire Il faut ensuite r pondre toutes les questions Vous souhaitez simuler des diplo des sexes s par s dio ques qui se croisent au hasard on ne va pas se compliquer la vie Nous voulons 1 520 populations de 30 individus avec un sexe ratio quilibr je dis bien UN sexe ratio car sexe est masculin en fran ais et ratio de m me en latin quoiqu en disent de nombreux cologues mal instruits soit 15 femelles et 15 m les Vous souhaitez simuler un stepping stone en une dimension tout au long de la simulation avec un taux de migra tion de 0 5 pour les deux sexes Vous allez simuler 10 plus rond que 7 loci ind pendants avec un mod le de mutation KAM 99 all les possibles et un taux de mutation le m me pour tous de 0 0001 qui correspond un taux raison nable mais vous pourrez essayer avec 10 consultez ELLEGREN 2000 BALLOUX et LuGon MouLin 2002 ELLEGREN 2004 Nous allons commencer avec une variabilit maximale 99 all l
469. tions ou plus justement comme sous chantillons Lhypoth se de base sous tendue est que la distribution de la variabilit g n tique refl te les param tres cologiques cit s plus haut Or cette hypoth se en soi est assez raisonnable Nous verrons cependant que d autres hypoth ses plus sp cifiques sont souvent requises pour pr ciser les inf rences d sir es Lutilisation de marqueurs g n tiques permet d avoir acc s indirectement des informations cl s sur la biologie des populations naturelles des tres vivants Comme nous le verrons ces m thodes s appliquent ga lement aux organismes non parasites Les outils de la g n tique des populations offrent cet gard un avantage que des m thodes bas es sur l observation ou la capture des organismes ne donnent pas L utilisation de mat riel h r ditaire trans missible ouvre l acc s des v nements rares et pass s par d finition peu ou pas accessibles l observateur m me au cours de campagnes intensives d observations de terrain PRUGNOLLE et DE MEE S 2002 Ceci ne retire rien aux m rites des m thodes dites directes et quand cela est possible l empiriste aura tout gagner utiliser les deux m thodes conjointement sur le m me mat riel Cela est 13 malheureusement encore trop peu souvent mis en ceuvre Les quelques tudes exis tantes r alis es soit sur les m mes individus WILSON et al 2004 soit en chan tillonnages diff r s HAU
470. tique des populations naturelles processus un tr s grand nombre de fois 10 000 nous permet d obtenir une distri bution des Fs possibles sous Hp Lhypoth se alternative H correspond n cessaire ment a Il y a structuration ou autrement dit le F 7 de l chantillon est plus grand que 0 La P value est donc donn e par la proportion de cas o le F 57 simul a t aussi grand ou plus grand que le F7 observ Ce test est disponible dans Genetix qui propose galement la m me proc dure avec le Or de ROBERTSON et Hix 1984 et le Ogy de RAUFASTE et BONHOMME 2000 La m thode bas e sur le G de Gouper et al 1996 En fait certains travaux ont montr que le calcul d une autre statistique G permet tait d avoir une plus grande puissance du test dans la plupart des situations voir GoupeT et al 1996 La proc dure est rigoureusement identique sauf que l on mesure un G logarithme n p rien de la vraisemblance du tableau de contingence observ au lieu d un F7 Cette statistique est calcul e partir d effectifs all liques mais ce sont bien les individus diplo des qui sont permut s au cours des randomisa tions d o le qualificatif de test g notypique Une description de la formule du G peut tre trouv e dans n importe quel ouvrage de statistiques SOKAL et ROHLE 1981 voir aussi la r ponse 7 Un avantage suppl mentaire de cette statistique concerne ses propri t s additives ce qui autorise
471. tranglement est plus ou moins grave ce qui d pend videmment du contexte La d tection et les tests de significativit de cet exc s d h t rozygotie signature d un goulot d trangle ment sont mis en uvre dans le logiciel Bottleneck Piry et al 1997 voir CoRNUET et LUIKART 1996 Dans une population l quilibre mutation d rive dont la taille ma pas vari depuis un temps raisonnable il y a autant de chance d observer un exc s qu un d ficit de diversit g n tique par rapport l attendu aux diff rents loci Afin de d tecter si le nombre d exc s observ d passe significativement ce qui est attendu sous cette hypo th se nulle on peut utiliser trois tests d crits par les auteurs dans l aide du logiciel mais le plus commode et le plus puissant est le test de Wilcoxon Dans leur article CORNUET et LUIKART 1996 montrent voir leur figure 3 que la d tection d une telle signature ne semble possible que dans certaines conditions qui d pendent du degr de polymorphisme observ du nombre de g n rations coul es depuis le dernier goulot d tranglement qu on cherche d tecter et de l effectif efficace de la population celui qu elle acquiert apr s l v nement de goulot d tran glement Par exemple avec des loci raisonnablement polymorphes microsatellites des chantillons inf rieurs 40 individus et moins de 10 loci la d tection d un goulot d tranglement n est poss
472. tu il faut ensuite lancer Fstat et cliquer sur le menu Biased dispersal La fiche correspondante apparait alors Il faut ensuite charger le Biased d P La fich dant tal Il faut te charger fichier analyser en cliquant le menu File et Open et cocher les cases comme en figure 50 puis sur le bouton Go Pour une raison que j ignore il faut cocher tous g q g les param tres si on souhaite obtenir le r sultat du test sur H en particulier Fre et IS H qui ne sont gu res utiles ici car nous avons cod les m les homozygotes pour oq 2 yg IRO8 Le r sultat est contenu dans un fichier de type nomdufichier res un fichier par esp ce de borr lie Le r sultat principal concerne le test du Fs et aussi la rela tedness ce qui est normal si on regarde sa d finition dans la documentation de Fstat et est pr sent dans le tableau 22 La tique xodes ricinus et les pathog nes Borrelia sp qu elle transmet 183 3 5 99 IROS IR25 IR27 IR32 IR39f Pop I Dorenaz I Dorenaz U Dorenaz I Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz U Dorenaz 7070 6868 7575 7474 6868 7878 7272 77171 7575 8383 6969 7575 7676 7373 0000 7373 0000 4247 3434 49353 4345 4848 3441 4244 3446 4348 4147 4242 4247 0000 0000 4545 3030 23
473. typic Overall of for each samp C NO teste l Gerobypic frequencies Weir and Cockerham F statistics Tests between af pairs of foci Number of alleles T Rho st M Aele ichness Fat pes pair of samples F Gene diversity Fe Fa Per bocu and sample statistics Global slatbor FM Allele frequencies M Ners Fetatistics Mominal vel for mullipa tests Le E 100 m 110 C 1 1000 Save Tables Hardy Weinberg within samples M Hardy Weinberg overall samples Population dileresan F HO best C Tet MOT assuming Hw within samples fo D Test assuming Hw within samples 0 Hi bests per locus and sample 7 Hominal beval for multiple tests Pairwise teats of differentiation CSA FOO 1100 Figure 18 Capture d cran de Fstat lors de la deuxi me analyse Quand vous lancerez Run Fstat ouvrira une bo te de dialogue avec laquelle vous pouvez d cider d crire les r sultats de cette analyse dans un nouveau fichier Dans le cas contraire et c est le choix que j ai fait le programme crira les r sultats dans IRTotTestPanmix out la suite des analyses pr c dentes fin du fichier Quy d couvrons nous Tout d abord que Fstat tronque les labels plus longs que six 122 Initiation a la g n tique des populations naturelles caract res Ce n est pas grave car nous avons toujours le m me ordre Femelles Males pour chaque chantillon Et pu
474. u s ouvre o vous n avez que deux choses faire Augmentez le nombre de bootstraps en ce qui me concerne 10 000 j aime bien et cliquez ensuite sur OK Le r sultat est disponible dans un fichier fis Il faut ensuite appliquer la formule de P quation 12 de Barroux 2004 N L fa QF lt Fe et de taper Infinity pour les valeurs n gatives quand le Frs gt 0 Etant donn la tendance aux d ficits en h t rozygotes peu de valeurs exploitables ressortent de cette analyse un seul V 6 pour Bouloupari mais on peut estimer que la limite inf rieure 95 des N est en moyenne de 208 individus Pour la m thode de Warres et Do 2008 lancez LDNe Cliquez sur le bouton Search et allez chercher votre fichier S lectionnez votre fichier et cliquez sur le bou ton OK puis sur Run LDNe Attention prenez garde que le fichier ne soit pas rest ouvert dans une autre application auquel cas LDNe ne produit qu un fichier de r sultat PL3 out vide Sinon apr s un travail rapide dans une fen tre DOS les calculs sont disponibles dans ce fichier Nous allons prendre les valeurs calcul es avec tous les all les de fr quences au moins gales 0 01 valeurs les plus droite et prendre 15 Je me suis aper u sur le tard que les bootstraps de Genetix se font ici sur individus et non sur loci ce qui peut poser des probl mes surtout dans les petits chantillons risque de r chantillonner trop de
475. ue des populations naturelles 0 5 R 0 7506 T Le 0 93 x 0 4 P value 0 0007 IL x 0 3 E 02 IRP 0 0 1 __ 0 20 40 60 80 Nombre de blancs Figure 41 Relation entre le nombre de g notypes blancs trouv s par locus et le Fj mesur ce locus sur l ensemble des clusters de BAPS de l ensemble des donn es microsatellites d Ixodes ricinus 1995 1996 Tunisie et Suisse ce qui renvoie au r sultat Spearman s rank correlation rho data data NBlancs and data FlS S 8 p value 0 0007496 alternative hypothesis true rho is not equal to 0 Sample estimates rho 029333333 La figure 41 illustre la relation positive forte entre les deux variables Nous pouvons galement tester de nouveau la dominance d all les courts au locus IR27 en prenant les F7s par all le donn s par la sortie Fstat sur les m les et les femelles s par ment Nous ne distinguerons en effet pas les clusters car il y en a trop Sous R la proc dure est comparable celle utilis e en p 129 134 sauf que nous nutiliserons que le polyn me d ordre deux de la taille des all les et le sexe comme variables explicatives du F5 Le r sultat est de nouveau tr s significatif et on explique donc toujours une forte proportion du Frs par ce ph nom ne de domi nance des all les courts comme illustr par la figure 42 Suivent les instructions R gt data lt read table FISAlleleSizel R27ClustersBAPS txt header T
476. uence d pendante On l appelle aussi s lection apostatique avantage du rare ou apostat plus un all le est rare et plus l individu qui le porte a de chances de survivre et ou de se reproduire Les exemples sont multiples Les plus connus concernent ce qui a trait aux syst mes immunitaires et la s lection sexuelle ScHIERUP et al 2001 Chez le tr fle par exemple on conna t un locus d auto incompatibilit poss dant une multitude d al l les diff rents LAWRENCE 2000 Une fleur de tr fle ne peut tre f cond e que par un pollen ne poss dant aucun des deux all les pr sents chez la fleur ce locus Il en r sulte que les plantes sont n cessairement toutes h t rozygotes ce locus et que tout mutant ou migrant poss dant un all le nouveau sera fortement favoris il peut f con der et tre f cond par tout le monde Le syst me MHC Complexe majeur d his tocompatibilit des mammif res ou HLA Antig ne lymphocytaire humain chez l homme fonctionne selon un principe quivalent puisqu un couple dont le HLA est trop similaire est st rile et qu il y a manifestement des attirances d pendantes de la diff rence entre le MHC des deux partenaires WEDEKIND et PENN 2000 Ici la signature du ph nom ne est facile rep rer puisque les loci impliqu s doivent avoir une h t rozygotie fix e ou au moins tr s lev e D autres exemples peuvent concerner des syst mes de r sistance h te virulence parasi
477. ues de premi re et de seconde esp ce iii 69 Le principe des TANGOMISATIONS ts seennononnnaiuas 70 Intervalles de confiance de bootstrap et jackknife cccccccccccccccccssecccsececesseeeecseeeectsaeseeteeeeeteeens 70 A a en a ee ee ee E ee ee ee 70 RSA deseo wane aetna ceaee concern EA E e 72 ASS AR a e te ecee 73 Les permutations isssiitrenrsiccreneeruiuiornienni ui orshedensiaannanieiadsanasenlnd ssahaweiansdsnnetiasaddenstianndreeadanslidecenten manent 74 Tester la panmi IOCA e ne ee nT E E E E E EE ee ere 76 SU NOT OREN EE E E E A dd de E EET E E 76 Tester s il existe un d ficit en h t rozygotes sssceenenemecnennenemeneennenmentenseneneenensentee 76 330 Initiation la g n tique des populations naturelles Tester s il existe UN exc s d h t rozygotes iii 76 Tester un cart dans n importe quelle direction exc s ou d ficit 76 Autres m thodes pour tester l cart la panmixie 77 Tests EXS nie en en oe CO E ee 77 M thode de ROUSSET et RAYMOND 1995 ooo cic icccceecccaeccceeececuecceeeececseeeueeeuasecaeseesaeeeeaeeesauseseevecaueeesnereeaesenaas 77 E OG 00 0 EE E A AEE OE A AEA E TAE TE E 77 RSS OT aetna rer aT 78 EE vale aia epee EEE EE earls E A E N ns dm A E 78 La m thode bas e sur le G de GOUDET et al 1996 2 ccccccceccccccccccceceeececceceeeeeesscececeeeeteneneneneess 79 Test exact all lique de ROUSSET et RAYMOND 1995 79 Tester la Danmixke globale esseere ee Ee TE 80 Tester le
478. uin CleanLoci dat En regardant G n tique des populations de Trypanosoma brucei gambiense en Afrique de l Ouest 257 N l f O9 iy IS D eN ee ee See ee ee ee de ee ee T _ E E E l A 1 gt 5 micbg1 micbg5 micbe6 msate4 msatg9 m6c8 mt3033 All Figure 87 Valeurs de Fs par locus et sur l ensemble All sans le locus trbpa intervalles de confiance 4 95 de jackknife sur les sous chantillons pour les loci ou de bootstrap sur les loci pour la moyenne globale All ce qui se passe dans le fichier de sortie T BruceiFoyAnCI amp Guin CleanLoci out on obtient la figure 87 On voit que le F7 0 66 avec un intervalle de bootstrap 95 de 0 8 0 55 C est plus bas que Koffi et al mais parce que nous avons gard micbg6 La variance reste apparemment importante entre loci Cette forte variance entre loci et d un sous chantillon l autre pourrait tre le signe d v ne ments rares de sexe dans un syst me tr s majoritairement clonal comme le montrent les simulations de BALLoux et al 2003 Cela pourrait provenir galement d all les nuls rares il y a quelques rares homo zygotes Ce pourrait tre aussi la cons quence d un taux de mutation variable entre loci En effet chez les clones purs il existe une relation directe entre diversit g n tique et Frs Reprenons la formule g n rale du Fy Qr I Is Q l Q Or nous
479. ulations de tiques de taille NV 4 selon BALLOUX 2004 quation 12 Une autre piste est celle de la pr sence de plusieurs individus de la m me ponte fr res et s urs r partis sur l ensemble des bovins d une ferme Cela peut arriver si la variance de survie entre pontes est tr s forte de telle sorte qu chaque g n ration ne restent dans un levage donn que les repr sentants de quelques pontes avec beaucoup de survivants par ponte Cette hypoth se mest pas incompatible avec le fait que les levages subissent des traitements r currents et est en accord avec le Fis effectivement attendu tr s n gatif dans ce cas voir r ponse 15 En appliquant le mod le de la r ponse 15 aux donn es par locus et par levage et en faisant la moyenne pond r e par locus on obtient en effet pour des fratries un Fy compatible avec les r sultats donn s par BAPS fig 75 mais significativement diff rent des donn es non manipul es 234 Initiation la g n tique des populations naturelles Tableau 32 Nombre de clusters BAPS effectifs par site et P value donn e par BAPS probabilit pour que la partition soit bonne pour les diff rents sites Les nombres de clusters obtenus par Flock et par le crit re d optimisation d crit dans la documentation Flock optimis K estimates based on plateau analysis non discut ici sont aussi indiqu s 5 27 4 2 Bouloupari 0 43 Bourail l 7 0 46 12 l Canala 13 106 0 49 11 1
480. une interface conviviale pour construire simplement un tel arbre partir d une demi matrice de distances par paire La m thode UPGMA qui fait l hypoth se d une horloge mol culaire les branches ont n cessairement la m me longueur est galement tr s souvent utilis e Je nai pas d opinion bien tranch e sur la question et je doute que PUPGMA donne souvent des r sultats forts diff rents du NJTREE Mais comme certains auteurs ont fait des analyses comparatives th oriques ayant conduit mettre en avant NJ TREE et les distances harmoniques je pr f re d instinct suivre leur recommandation L avantage d utiliser MEGA est que les arbres g n r s peuvent tre sauv s dans le presse papier clipboard et coll s dans un logiciel de graphique o apr s dissociation on peut travailler tranquillement la figure obtenue TROUVER UNE SOUS STRUCTURE CACH E Dans certaines situations il n existe aucun indice visible qui permettrait de subdivi ser un chantillon en plusieurs sous unit s objectives Dans de telles situations les strat gies d chantillonnage peuvent se montrer inefficaces repr senter une r alit biologique ou cologique existante En effet si un facteur biologique et ou colo gique contribue fortement l laboration de l architecture g notypique des individus 98 Initiation la g n tique des populations naturelles tudi s on s attend ce qu un tel ph nom ne laisse une signature g n ti
481. ur toutes les analyses J ai appel ce fichier 5Ofois30 txt quelle imagination Analyse des fichiers par BAPS Vous avez bien entendu install BAPS sur votre machine et cr tous les fichiers n cessaires il y en 24 normalement Il faut maintenant lancer BAPS en cliquant sur BAPS4 RUNME EXE Le logiciel ouvre deux fen tres une fen tre Dos dont il n est pas vraiment n cessaire de se pr occuper maintenant et une fen tre d interface type Windows avec des menus que nous allons utiliser Il est important de commencer par cr er un fichier r sultat Pour ce faire cliquez sur File Output File et Set 136 Initiation la g n tique des populations naturelles Bragsng IROS IR2Z 597 IR274 IR3524 IR39T Pop Staa95SM 000000 gt 000000 119119 000000 1271349 Staa9SM 174174 gt 136147 119119 246246 gt 1321324 StaaSsua 170170 137144 119119 241250 0000004 Staag9sn gt 174174 O00000 119121 233233 1351357 StaaS5n4 178178 ooo000 119119 233233 gt 1301409 StaagsSM 169169 gt 148151 119119 29332933 1291424 Staa9SM 1768176 gt 134134 119123 000000 125142 Staa9SM 186186 gt 134141 119119 000000 1421424 Staa9SM 175175 145145 119119 233233 1301309 StaaSSM 183183 gt 144146 gt 117117 gt 250250 12861409 StaagsSM 176176 142145
482. ures de diff renciation syst matiquement n gatives ou nulles Tableau 36 R sultats des mesures et tests de significativit par paire de m thodes d isolement des souches de T brucei gambiense 1 Bonon en 2002 et en 2004 Donn es MLG Ann e 2002 KIVI Rodent inoculation 0 0399 0 9061 Blood sample KIVI 0 0256 2004 Blood sample Rodent inoculation 0 0345 KIVI Rodent inoculation 0 0000 ii Analyse NJTree Nous allons pour cela cr er un fichier MSA avec Create N oubliez pas de retirer le locus MLG ainsi que les souches de r f rence qui ront pas lieu d tre ici Quand votre fichier est pr t copiez le dans le r pertoire de MSA ou copiez MSA dans votre r per toire de travail Lancez MSA tapez i pour choisir le nom de votre fichier de donn es et tapez le nom complet de ce fichier celui que vous venez de cr er avec Create Tapez ensuite d pour le menu des distances puis p pour choisir le type de distance Ensuite tapez c pour s lectionner le calcul par paire de sous chantillons puis les chiffres correspondant aux distances s lectionner ou d s lectionner En principe on garde la distance harmonique de Cavalli Sforza et Edwards chord distance qui est r put e produire les meilleurs NJ Tree eux m mes r put s donner les arbres dot s de la meilleure topologie TAKEZAKI et Nri 1996 Donc on va garder l option correspon dant cette distance on option 7 ind
483. urs la diff rence est telle qu on consid re en g n ral qu un site variable ou SNP ne poss de que deux all les possibles A G ou C T R ponse 3 Sis 1 alors nous obtenons pour les homozygotes 1 1 les h t rozygotes 1 2 et les homozygotes 2 2 en se souvenant que p p 1 des fr quences g noty piques respectivement gales 1 Depi ET Pit PaPa PilP t P2 Pi Ji aE a E De 0 1 RE pit Pia Pit PiP2 PalPit Pr Py R ponse 4 eo aR i 5 l 2 2 ra i P gl Dal Pt P 2p p Et donc Ge ps pt Zp 2 p p CQED R ponse 5 C est la d finition de la variance R ponse 6 Dans un mod le en les infini s il n existe que des sous populations fix es pour l un des deux all les pr sents un locus cela signifie que pour une pro portion p de populations nous avons p 1 et pour 1 p nous avons p 0 La variance de p dans ce cas sera gale ra EE lar pi AE lali pla me plo pl pi PUB 303 d o l on tire facilement I x P p l p l pt p pL p CQFD R ponse 7 D tails du calcul dun G Supposons que nous avons chantillonn N individus dans deux localit s diff rentes chantillons 1 et 2 de tailles respectives N et W2 Ces individus ont t g notyp s pour un locus qui pr sente deux all les de fr quences p et q dans l chantillon 1 et p2 et gq dans l chantillon 2 respectivement Ces informations nous donnent les effectifs d all les suivants Nom
484. us population que nous avons d j utilis e en p 197 199 de cette partie peut tre ais ment r alis e Ici nul test mest n cessaire tant donn que la corr lation est tr s faible et de toutes mani res n gative entre les deux variables Les all les nuls ne semblent pas pouvoir expliquer nos r sultats Nous allons laisser cela de c t et v ri fier tout d abord que le niveau infra population est pertinent Analyse hi rarchique Nous allons donc avoir besoin de HierFstat et de coder un fichier en ce sens avec comme facteurs du moins inclusif au plus inclusif la Nouvelle Cal donie T P levage E l infra population S et Pindividu tique I Reprenons donc le fichier BoophilusAdultsDataCattle txt et recodons le afin d obtenir quelque chose de la forme fig 66 Remarquez que j ai recod les g notypes avec deux chiffres au lieu de trois car sinon HierFstat me retournait un message d erreur mais je ne sais pas pourquoi car nor malement a doit marcher avec trois chiffres par all le N oubliez surtout pas de recoder les donn es manquantes 0000 en NA Il faut ensuite ouvrir R on charge Invasion de la Nouvelle Cal donie par la tique du b tail Rhipicephalus microplus 223 1 Farm Host Bi COT Diz 2 is le 0102 0108 0209 3 1 2 0505r D b 009 4 ip Ze 0102 D g 0209 5 in om 0104 0108 0209 amp Is Ai 0102s O60 fa 0204 7 Is 3 04055 0106 912 B ix 3
485. us le verrons plus loin simul sous Hg a t aussi grand ou plus grand que l observ procure la P value du test La cha ne de Markhov correspond la proc dure utilis e dans Genepop RayMOND et Rousset 1995b Le principe en est le suivant Il s agit de d finir une trajectoire al atoire entre diff rents tableaux de contingences possibles et dont les sommes marginales sont identiques au tableau des donn es r elles La probabilit d appari tion sous Hp de chacun des tableaux ainsi obtenus est compar e a celle correspon dant au tableau de contingence observ La probabilit du test est obtenue en comptant le nombre de fois qu une probabilit s est montr e inf rieure ou gale celle du tableau observ et en divisant cette valeur par le nombre total de tableaux g n r s durant le processus Une description mieux d taill e est pr sent e dans Rousset et RayMOND 1997 Les P values obtenues par ces m thodes constituent d excellentes approximations des probabilit s exactes pour peu que l on ait pris garde de mettre en uvre un nombre suffisant de ces randomisations un minimum de 1 000 10 000 pour les permutations et 10 107 pour les cha nes de Markhov ce qui ne devrait pas repr senter un probl me avec les micro ordinateurs d aujourd hui 7 I suggested an obvious name for the statistical method a suggestion not unrelated to the fact that Stan had an uncle who would borrow money from relatives be
486. us mes collaborateurs chercheurs tudiants ou post docs dont la liste exhaustive serait fastidieuse mais dont les principaux non encore cit s ci dessus sont Francisco Ayala Francois Balloux Anne Laure Bafuls Nicolas Barr Adrien Marie Gaston Belem J r my Bouyer Bruno Bucheton Mamadou Camara Michel de Garine Wichatitsky Sylvie Hurtrez Bouss s Florent Kempf Mathurin Koffi Naf rima Kon Laurent Lehmann Annette MacLeod Karen D McCoy Francois N bavi Flobert Njiokou Denis Roze Issa Sidib Gustave Simo Andr Th ron Sophie Ravel Virginie Rougeron et j en oublie surement Cependant cette liste de personnes remercier souffrirait d une carence grave sans la pr sence des chercheurs de l UMR IRD Cirad 177 Intertryp qui ont la bont de tol rer ma pr sence dans leur quipe Merci G rard Cuny de m avoir accueilli sans poser de question Un ts ts grand merci Philippe Solano maintenant vieux com plice et l origine de mon int gration dans mon quipe actuelle et merci Vincent Jamonneau de m avoir permis de toucher au monde fascinant des trypanosomes africains Merci vous de me permettre de vivre cette exp rience enthousiasmante au Burkina Faso Merci aussi tout le personnel du Cirdes et mes tudiants bur kinab Jacques Kabor et Modou S r et merci tous les tudiants ayant suivi ou subi mes cours et qui par leurs questions m ont permis d am liorer la vision que j ai de mon tra
487. us population qu une tique infect e par Bbss seule On met ensuite le fichier au format Fstat et on lance la proc dure de Fs par paire Ce faisant vous constaterez que la plupart des tests sont infaisables c est normal Les r sultats sont compil s dans le tableau 21 En toute rigueur les tests qui ne sont pas tous ind pendants devraient subir la correction de Bonferroni Cependant tant donn la faiblesse des chantillons manque total de puissance nous nous abstiendrons de le faire Le seul Fs7 positif est obtenu entre Bba et Bbundet mais il n est pas significativement plus grand que 0 Eu gard la faiblesse des tailles de sous populations ici nous d cidons que rien ne permet d affirmer l existence d une diff rence g n tique entre tiques infect es par diff rentes bact ries et rien ne permet de l exclure formellement au moins pour ce qui concerne le couple Bba Bbundet S il existe des races d h tes chez 7 ricinus ce n est pas avec ces donn es qu on peut le montrer Biais de structuration sp cifique associ au pathog ne Ici il faut reprendre les donn es pour chaque esp ce de bact rie et cr er un fichier de type Genepop comme ce qui a t fait en p 147 150 sauf qu ici les tiques sont distin gu es en fonction de leur statut infectieux et non par leur sexe tel que dans la figure 49 Notons que nous ne traitons que les sites pr lev s en Suisse et o au moins une tique infect e est trouv e Parce qu i
488. usieurs notions et de mettre en pratique de nouvelles m thodes d analyse telles que l isolement par la distance entre individus Comme pour les tiques ce jeu de donn es est t l chargeable mais dans un format diff rent Ce fichier s appelle TsetseJerCoordGeo amp Trap amp SexTotData xls Dans ce chapitre nous ne d taille rons que les analyses nouvelles et irons la plupart du temps tr s vite sur les notions d j illustr es dans le pr c dent chapitre TAT DES LIEUX Les trypanosomoses africaines figurent parmi les plus s rieuses des maladies tropicales n glig es SCHOFIELD et KABAYO 2008 COMS estime que le nombre total de cas de maladie du sommeil avoisine les 300 000 personnes WHO 2006a Par ailleurs d apr s la FAO le co t conomique des trypanosomoses animales nagana atteint 4 74 milliards de dollards US par ann e FAO 2000 En 2001 plusieurs pays afri cains ont lanc le Pan African Tsetse and Trypanosomosis Eradication Campaign PATTEC afin d tablir une lutte concert e contre cette plaie l origine de nombreux probl mes de faim d appauvrissement et de frein au d veloppement d une agriculture durable dans les zones rurales d Afrique subsaharienne http www africa union org Structure_of_the_Commission depPattec htm Glossina palpalis s l une des esp ces de mouches ts ts est un des plus importants vecteurs de trypanosomoses humaine et animales en Afrique de l Ouest En Guin
489. usset Genepop htm Il faut recoder les donn es pour chaque zone un fichier par zone H C et D de telle sorte que chaque individu est consid r comme une sous population comme dans la figure 56 Il faut ensuite copier le logiciel Genepop exe dans le r pertoire o se trouvent les quatre fichiers que nous venons de cr er En ce qui me concerne et n cou tant que mon imagination d bordante jai nomm les quatre fichiers A txt H txt C txt et D txt Ici si vous tes cardiaque je vous conseille de couper le son de votre ordinateur car quand Genepop est content il le manifeste par un bruit effroyable a r veiller un mort On clique deux fois sur Genepop exe et une fen tre appara t o le nom du fichier vous est demand A l invite tapez A txt puis Entr e Lisez les informations et si vous tes d accord retapez Entr e Un menu appara t C est option 6 qui nous int resse Tapez donc 6 Un sous menu appara t dont l option 5 est celle qu il faut impl menter Tapez 5 On vous demande si vous souhaitez effectuer le test avec la statistique 4 un quivalent du Fs57 1 Fs7 pour la diff renciation entre individus ou D apr s Watts et al 2007 pour une structure en une dimension comme c est le cas le long de la rivi re Mouhoun la statistique est meilleure quand la taille de voi sinage Vb pour neighbourhood Nb 4Do gt 10 000 individus et 4 est plus performant quand Mb lt 10 00
490. vail Merci Tatiana Giraud TG d avoir accept le travail ingrat et combien fastidieux de relire ce travail et d avoir ainsi contribu une bien meilleure lisibilit de ce manuel Merci toute l quipe des Editions de PIRD pour leur travail et leur infinie patience en particulier Yolande Cavallazzi sans qui un nombre incalculable de coquilles 10 Initiation la g n tique des populations naturelles continueraient infester ma prose Catherine Plasse Michelle Saint L ger et Thomas Mourier Avant de terminer cet avant propos et parce que le monde de la recherche peut s av rer parfois tr s trop comp titif j aimerais exprimer quelques opinions person nelles destination des plus jeunes La seule comp tition qui m rite un int r t est celle que l on engage contre soi m me et les autres en particulier les coll gues sont la pour nous aider mener bien ce combat Pour vaincre il faut renoncer gagner Je remercie donc tous mes checs de m avoir rendu meilleur Et enfin pour paraphraser un proverbe africain d origine incertaine Mais entouka ce qui est s r c est que a va aller Avant propos 11 Lntrod uction Les organismes parasites repr sentent une part significative de la biodiversit r per tori e esp ces d crites DE MEEUs et RENAUD 2002 et malgr la r cente explosion des tudes mol culaires des populations naturelles celles concernant les syst mes h te paras
491. variation g n tique Par exemple FHabitation Village donne la diff renciation g n tique entre habitations dans chaque village en corrigeant pour l effet individu h te Ceci est plus important qu il n y para t Sil y a un effet significatif de l individu h te et que les parasites de ces derniers sont confondus le calcul d un Fs entre habita tions sera n cessairement biais car l effet individu h te y sera n cessairement inclus les habitants de diff rentes habitations sont diff rents Probabilit s ou indices d assignement Le g notype multilocus d un individu peut permettre de calculer la probabilit avec laquelle cet individu appartient une sous population donn e RANNALA et MOUNTAIN 1997 WASER et STROBECK 1998 CoRNUET ef al 1999 Cette proba bilit correspond alors simplement la probabilit multinomiale attendue d observer un g notype particulier compte tenu des fr quences des all les dans la sous popula tion La pr cision de cette probabilit d pend n cessairement de celle avec laquelle les fr quences all liques sont estim es et donc de la taille de l chantillon Id alement la mesure devrait tre effectu e partir dau moins 30 individus g notyp s sur au moins 10 loci variables dans chaque sous population Cette probabilit est conventionnelle ment appel e indice d assignement Un individu pr sentant une faible valeur corres pondra probablement un immigrant r cent En com
492. ve le r sultat suivant Df Deviance Resid Df Resid Dev F Pr gt F NULL 191 38 762 pol y Allele 2 2 0 340 189 38 422 1 1742 0 3114224 Sample 8 10 155 181 28 267 8 7720 4 318e 10 Year 1 0 089 180 28 178 0 6156 024331012 Sex 1 2 2715 179 25 903 15 7179 0 0001062 132 Initiation a la g n tique des populations naturelles 0 8 0 6 0 4 ns 0 2 ce a a ee E E 109 113 117 121 125 129 133 Taille des all les Figure 24 Relation entre taille des all les et Frs pour le locus IR27 et sur l ensemble des chantillons mi Variance F Les intervalles de confiance 95 ont t obtenus avec Fig 10 05 1 x 15 Pour ce faire les singletons tailles d all les pr sents une seule fois comme 112 et 131 ont t r unis la classe la plus proche On voit qu en plus du site le sexe des tiques a un effet significatif ce qui signifie que nous avons eu raison d en tenir compte et nous verrons ensuite pourquoi Pour le locus IR39 le tableau obtenu est le suivant Df Deviance Resid Df Resid Dev F Pr gt F NULL 368 59 156 poly Allele 2 2 0 932 366 58 223 3 2441 0 04013 Sample 8 6 139 358 52 084 5 3426 2 3126 00 Year 1 419 351 51 665 2 9159 0 08858 Sex 1 0 529 356 51 136 3 6804 0 05585 Le site joue une fois encore de fa on significative mais aussi la taille des alleles m me si cette derni re n explique m me pas 2 de la d viance et est peu signi ficative Par ailleurs
493. vels loci header TRUE V V NNV Cette derni re commande produit le r sultat suivant l oc 1 2 3 4 5 6 R08 0 01223796 0 0001573914 2 260871e 03 0 0022890321 0 4342422 0 4906015 R25 0 01069015 0 0029660662 1 666085e 03 0 0021349532 0 4523394 0 4658385 R27 0 29270494 0 0015575541 3 185784e 05 0 0003405896 0 2581954 0 2624521 R32 0 17740753 0 0165926500 1 063656e 02 0 0070371095 0 4268548 0 3006536 R39 0 01488133 0 0438594202 1 195459e 04 0 0001627161 0 2574235 0 6343434 Soveral Cont NrdWessin Nr dWNS Site nd Error 0 478159253 0 022900541 0 009954088 0 011283221 1 829055277 2 153889149 F Cont NrdWTessin Nr d WNS Site nd Total 0 1061340 0 111217077 0 113426523 0 115930989 0 5219148 Cont 0 0000000 0 005686634 0 008158420 0 010960256 0 4651490 NrdWessin 0 0000000 0 000000000 0 002485923 0 005303783 0 4620901 Nr dWNS 0 0000000 0 000000000 0 000000000 0 002824882 0 4607495 Site 0 0000000 0 000000000 0 000000000 0 000000000 0 4592219 Dont l interpr tation est la suivante Fs 0 459 nous retrouvons ici un r sultat ancien et sans valeur car les m les sont arti ficiellement homozygotes ici au locus IR08 FrireNrawNs 0 0028 FYrawns NrdW Tessin 154 Initiation a la g n tique des populations naturelles 0 0025 Frrawrtessin Cont 030057 et Foont Toral 0 106 Toutes ces valeurs de diff ren ciation sont tr s faibles sauf pour la Suisse contre la Tunisie Il faut tester ensuite la s
494. vement Ils sont issus d un mod le d analyse de variance hi rarchique nested analysis of variance des fr quences all liques dans les individus des sous populations entre individus des sous populations et entre sous populations En reprenant les notations originales les estimateurs de Weir et Cockerham d pendent donc de 2 1 jet qui sont les composantes inter d mes among sub populations a a entre individus de chaque sous population between individuals b et intra Concepts de base en g n tique des populations 53 individuelle within individuals w de la variance des fr quences all liques A partir de l on peut exprimer les diff rents estimateurs sous la forme Mti ra U 29 Q toto A 1 9 F a b Le calcul de ces composantes s effectue partir de la table d analyse de variance hi rarchique similaire celle pr sent e dans le tableau 2 Tableau 2 Analyse de variance des fr quences all liques dans un chantillon subdivis en 7 sous chantillons tous de taille N chacun Source de variation Ddi MS observ s MS attendus Entre sous chantillons a we MS DN Di Entre individus dans chaque sous chantillon 6 NS abs 20 0 Entre all les dans chaque individu w nN 2 1 Nr MS 1 Ddl Degr de libert MS Carr s moyens attendus Mean Squares Il s agit ensuite de calculer les carr s moyens des fr quences d all les de l chantillon pour obtenir av
495. vidus existent 8 En parasitologie une infra population est le contenu en parasites d un individu h te 90 Initiation a la g n tique des populations naturelles telles que l estimateur de QUELLER et GOODNIGHT 1989 ou de WanG 2002 dont nous avons d j parl propos des tests de pangamie p 77 78 ou plus r cemment de KaLinowski ef al 2006 qui pourrait tre encore plus puissant TESTER LES BIAIS DE DISPERSION DE CERTAINES CATEGORIES D INDIVIDUS Dans les populations naturelles il se peut qu un sexe disperse davantage que l autre sexe ou que les individus parasit s dispersent plus ou moins bien que les individus sains Dans ce cas il existe plusieurs statistiques mesures qui peuvent tre compa r es GOUDET ef al 2002 Je ne parlerai ici que de trois d entre elles et dans le cas d un biais de dispersion sexe sp cifique L indice d assignement dont nous avons d j parl en p 64 consiste calculer la probabilit qu un individu a d appartenir la sous population o il a t chan tillonn compte tenu de son g notype tous les loci g notyp s et de celui de len semble des individus de son sous chantillon Afin de tenir compte du degr de polymorphisme qui peut beaucoup varier d un site l autre il faut corriger cette probabilit Ceci est fait en soustrayant cette valeur la valeur moyenne obtenue sur l ensemble des individus du sous chantillon concern apr s un
496. vigueur hybride est un ph nom ne global qui affecte la totalit du g nome Il peut provenir d une superdominance globale r partie sur de tr s nombreux loci du g nome ou bien il r sulte de la pr sence de nombreux all les Concepts de base en g n tique des populations 35 d l t res r cessifs dans la population qui fait que plus un individu est h t rozygote au plus grand nombre de loci et plus sa valeur s lective cro t voir PRUGNOLLE et al 2004a Ici la signature g n tique de ce ph nom ne correspond un exc s d h t rozygotes sur l ensemble des loci test s Il convient cependant de pouvoir carter les hypotheses alternatives que nous aborderons plus loin pouvant expliquer un exc s d h t rozygotie multilocus tels que la clonalit BALLOUX et al 2003 l existence de petites populations dio ques ou autoincompatibles BALLoux 2004 avec ou sans biais de dispersion sexe sp cifique PROUT 1981 PRUGNOLLE et DE MEEts 2002 ou les membres d une m me fratrie individus issus de la m me ponte CHEVILLON et al 2007a Ce ph nom ne aura tendance homog n iser les fr quences all liques entre diff rents sites sous populations a tous les loci impliqu s et donc potentiellement sur l ensemble des loci du g nome auto stop La s lection gam tique La s lection gam tique donne un avantage certains gametes spermatozo des plus performants C est une forme de s lection souvent n
497. ww bio ulaval ca no_cache en department profes sors professors professeur 11 13 Ducornez S BARRE N MILLER R J DE GARINE WICHATITSKY M 2005 Diagnosis of amitraz resistance in Boophilus microplus in New Caledonia with the modified Larval Packet Test Vet Parasitol 130 285 292 Execren H 2000 Microsatellite mutations in the germline implications for evolutionary inference Trends Genet 16 551 558 ELLEGREN H 2004 Microsatellites simple sequences with complex evolution Nat Rev Genet 5 435 445 ENGLAND P R CoRNUET J M BERTHIER P TALLMON D A Luixarr G 2006 Estimating effective population size from linkage disequilib rium severe bias in small samples Conserv Genet 7 303 308 Fack Varrant J GUERIN P M DE Bruyne M ROHRER M 1994 Some observation on mating and fertilization in the cattle tick Boophilus micro plus Med Vet Entomol 8 101 103 FALUSH D STEPHENS M PRITCHARD J K 2003 Inference of population structure using multilo cus genotype data linked loci and correlated allele frequencies Genetics 164 1567 1587 FAO 2000 Impacts of Trypanosomiasis on African Agriculture PAAT technical and Scientific series 2 Favre L BALLOUX E GOUDET J PERRIN N 1997 Female biased dispersal in the monoga mous mammal Crocidura russula evidence from field data and microsatellite patterns Proc Roy Soc London B 264 1
498. x of their vector Ixodes ricinus Micr Infect 6 299 304 DE Meets T McCoy K D PRUGNOLLE FE CHEVILLON C DURAND P Hurrrez Boussks S Renaup F 2007a Population genetics and molecular epidemiology or how to d busquer la b te Infect Genet Evol 7 308 332 DE Meets T Micuaraxis Y RENAUD E Ouvieri I 1993 Polymorphism in heteroge neous environments habitat selection and sympat ric speciation Soft and hard selection models Evol Ecol 7 175 198 DE Meets T RENAUD F 2002 Parasites within the new phylogeny of eukaryotes Trends Parasitol 18 247 251 DE MEEGS T RENAUD E Mouverovux E REYNES J GALEAZZI G MALLI M Bastipe J M 2002b The genetic structure of Candida glabrata popu lations in AIDS and non AIDS patients J Clin Microbiol 40 2199 2206 DIERINGER D SCHLOTTERER C 2003 Microsatellite analyser MSA a platform inde pendent analysis tool for large microsatellite data sets Mol Ecol Notes 3 167 169 Initiation a la g n tique des populations naturelles Dosson A J 1983 An Introduction to Statistical Modelling London Chapman and Hall DUCHESNE P TURGEON J 2009 FLOCK a method for quick mapping of admixture without source samples Molecular Ecology Resources 9 1333 1344 DucHEsNE P M THOT J TURGEON J 2010 FLOCK 2 0 D partement de biologie universit Laval freely downloadable from http w
499. xacte du flux de g nes chang entre les sous populations chan tillonn es Fr Fsm FsTmax Une alternative pour calculer ce Fo7imax consiste en un recodage des alleles de telle sorte que les diversit s locales restent les m mes dans chaque sous chantillon mais aucun all le en commun n est partag et chaque sous chantillon montre des all les uniquement pr sents chez lui MErRMANS 2006 De mon exp rience les deux m thodes donnent des r sultats tr s proches Diff renciation g n tique par paire d chantillons ou d individus Il existe fr quemment des situations o la diff renciation g n tique doit tre appr ci e entre paires de populations ou m me d individus Plusieurs possibilit s s offrent nous Le F 7 peut bien entendu tre utilis mais il a t montr que dans cette configuration il est loin d tre le plus performant Rousset 1997 BaLLoux et GOUDET 2002 L empiriste avis pr f rera l utilisation d autres outils a choisir en fonction de la question pos e Si un isolement par la distance est recherch l utilisation de Fs57 1 Fs7 ou son estimateur 6 1 0 est recomman d e par Rousset 1997 Nous verrons plus loin que ce nouvel estimateur est surtout utile pour inf rer les param tres d mographiques de la population inves tigu e Dans les autres situations la distance harmonique chord distance de Cavalli Sforza et Edwards CAVALLI SFORZA et EDwARDS 1967 donne de meil l
500. xarr G 1996 Description and power analysis of two tests for detecting recent population bottlenecks from allele frequency data Genetics 144 2001 2014 CorNuET J M Piry S LUIKART G Estoup A SOLIGNAC M 1999 New methods employing multilocus genotypes to select or exclude popula tions as origins of individuals Genetics 153 1989 2000 Coustau C RENAUD E MAiLLARD C PASTEUR N DELAY B 1991 Differential susceptibility to a trematode parasite among genotypes of the Mytilus edulis galloprovincialis complex Genet Res Camb 57 207 212 Cox D R SNELL E J 1981 Applied Statistics Principles and Examples London Chapman and Hall Criscione C D BLouIN M S 2005 Effective sizes of macroparasite populations a conceptual model Trends Parasitol 21 212 217 CRISCIONE C D PouLIN R Bourn M S 2005 Molecular ecology of parasites elucidating eco logical and microevolutionary processes Mol Ecol 14 2247 2257 CUTULLE C Jonsson N N SEDDON J M 2010 Multiple paternity in Rhipicephalus Boophilus microplus confirmed by microsatellite analysis Exp Appl Acarol 50 51 58 Day P Pujoz B Viarp E CASTELLA V GoupeT J 2007 Reliable selfing rate estimates from imperfect population genetic data Mol Ecol 16 2474 2487 DE Garine Wicuatitsky M De Meets T CHEVILLON C BERTHIER D Barre N Bibliographie 289 THEVENON S MAIL
501. z autant de fichiers qu il y a d infra populations comme dans l exemple qui suit fig 69 Ensuite il faut lancer le logiciel ML Relate aller au menu d roulant File et charger votre fichier ce qui fait appara tre les fr quences all liques Puis vous cliquez sur le Foup les de Cosnsls 14 Bi COTa tiz Dia 112 coag POP a b10C09Fs 5 92940 4550 9210 D s 5697s 46529 b1C09H ee 29e TESS x L2 iis 52 53a OTS Ts 658 biciiFs iH 98985 7978 15195 CELL SES 6407 B1C11Ms 15 gigs 45550 913 52540 oTooe 52549 biclir im 43 Ce CEEE Sifin 52540 3697 s2549 bi i PE Eil m SATa 11132 S27 58s Tots 46509 b1l ci4Fs E 92980 5500 9202 R2 52m SOS adag bici4is 18 Jopas 4550 14145 52520 399 95547 bICLBFs FE 498 7985 1217 525s ELERE 54549 b1C1ABs ae 2994y 4579 S252 SOS 5898s 46524 bicioFs 1B 94 95 45555 92020 52520 369 52547 BbICIShs i 92 58s 1579 9213 SOS 9799 5258 Figure 69 Exemple de donn es pour ML RELATE pour mesurer l apparentement entre tiques adultes du premier bovin a Canala 228 Initiation a la g n tique des populations naturelles ML Relate File Edit Summary Muls MR Relationship Matrix output Input Data Summary Hubs Related List Output L RELATE Input un time 20 04 2010 17 01 52 Data Couples de Canala EL POPULATION ALLELE FREQUENCIES 0417 1667 0 2500 D 5417 Figure 70 Menu ML Relate choisir menu d roulant Relatedness et choisissez List

Download Pdf Manuals

image

Related Search

Related Contents

端末安心サポート利用規約  Uniflame NPC2204-C User's Manual  Télécharger - Ville du Havre  An experiment platform for evaluation and  Panasonic Lumix DMC-FX78 User`s Manual    Optoma EX565UT data projector    Livre Hebdo (supplément tourisme)    

Copyright © All rights reserved.
Failed to retrieve file