Home
fichier de tests non paramétriques au format pdf
Contents
1. Fisher s exact test table 20 0 5 6 one tailed p 0 00062748 two tailed p 0 00062748 other 1 theor value of chi2 lt 3 2 13 for 0 Le test est significatif Nous avons pris toutefois un cas particulier qui n est pas le plus simple ou la valeur minimale de la matrice est d ja 0 En ce cas bien entendu la situation bilat rale est quivalente la situation unilat rale et le reste de la probabilit est gale 1 Nous allons prendre un second exemple qui permettra d illustrer le cas g n ral Possible matrices and their Ps p for 0 23 0 2 9 1 0486E 06 p for 1 22 1 3 8 7 2353E 05 p for 2 21 2 4 7 0 00159176 p for 3 20 3 5 6 0 01559928 p for 4 19 4 6 5 0 07799642 p for 5 18 5 7 4 0 21170456 p for 6 17 6 8 3 0 31755684 p for 7 16 7 9 2 0 25706982 p for 8 15 8 10 1 0 10282793 pfor9 14 9 11 0 0 01557999 Interpr tation prob unilat rale il s agit de la somme des probabilit s situ es entre la valeur minimale 3 et 0 C est donc Puni 0 01726445 S p for 0 gt p for 3 prob bilat rale il s agit de Puni p for 9 0 01557999 qui est la valeur de p imm diatement inf rieure au max de Puni Qui est p for 3 0 01559928 On a donc Ppi 0 03284444 la probabilit droite Il s agit de la somme pour les valeurs variables de l effectif minimal de la matrice 2x2 des probabilit s qui leur sont associ e
2. 8 runs La macro renvoie le r sultat en valeur Z et la valeur exacte tabul e Voyons un second exemple tir du m me ouvrage remploy de Sprent 1992 les auteurs se demandent si la distribution du nombre de pages est identique dans deux populations de livres livres de statistiques et livres divers divers 29 39 60 78 82 112 125 170 192 224 263 275 276 286 369 756 stat 126 142 156 228 245 246 370 419 433 454 478 503 Wald Wolfowitz test N 28 ni 12 n2 16 runs 7 u 14 714 s 2 541 Z 2 839 p 0 00453 exact value not available La valeur Z 2 839 autorise conclure que les livres de statistiques sont pagin s de mani re diff rente que les livres divers Notez que ce test est quivalent au run test ou test des signes nous avons 7 runs dans le dernier exemple La diff rence entre le test de Wald Wolfowitz et le run test a trait simplement au fait que dans le run test les donn es binaires 1 et 0 sont d j mises en place le traitement des donn es requiert une seule colonne alors que dans le test de Wald Wolfowitz les donn es sont d abord brutes en deux colonnes s par es qu il faut ordonner en 1 et 0 Le probl me vient alors des ex aequo s ils sont situ s dans une m me colonne ils sont consid r s comme d habitude s ils sont situ s dans deux colonnes diff rentes il faut les ordonner en sorte de privil gier l hypoth se nulle Ho Cela requiert davantage de temps no
3. Armitage P amp G Berry 1994 Statistical Methods in Medical Research Third Edition Blackwell Scientific Publications Oxford Dans cet exemple on mesure le gain en poids de rats recevant des r gimes diff rents pour le 1 groupe un r gime avec des prot ines de haut poids mol culaire et l autre un r gime avec des prot ines de bas poids mol culaire L hypoth se nulle est il n y a pas de diff rence dans les poids moyens Soest Seer an Mann Whimey test Tex iN i 19 mhavesvenceserarscecnsenrbarsarenrserearsaresrsettarsserreserenresreurentiarsaresrsarssrssetrarsriarsaresrescssresrssrencbarescssrsarsersarsancertaresresrrarsarssranerceto mrsnransansannanenmnmifarannannaniannannamete DORE EE OT D te O SAONE PORN A RE T O a E anses nes E sas and oser s ns rmnsentens sis Sere tretrenretietiann a SE ES ttes CORNE sefnnnnenmneneenenmennnenetanemnenteneemnnenenenm ef Sent ententerter tatters bet tettertertertertents ee nue asaaseassasssssssecsosa ONE E Scene Geer maT cS NE 7 1 RS RS DESDE i EE 2 eRe ene LR RS E EIER EON ESENES E ONEONE BOOSIE A PE E E EA N TABLEAU III test U de Mann et Whitney L hypoth se nulle est donc conserv e puisque p gt 0 05 Le calcul consiste ranger les observations de fa on croissante et comptabiliser les rangs ici Uxy 22 5 En fait nous avons assembl ici les r sultats de deux tests qui sont strictement
4. PRE gt e ont 59 qui d finit le test DW On peut montrer que DW 2 2 r ou r vaut L ind pendance des r sidus est une hypoth se fondamentale a consid rer car c est une condition indispensable dans de nombreux tests Or si plusieurs mesures sont r alis es sur un m me individu les r sidus du mod le d terministe forment une s rie chronologique et il est int ressant de tester si c est un bruit blanc ou non La statistique de Durbin Watson ou le test de portemanteau Seber et Wild 1989 p 322 permettent de tester l hypoth se que les coefficients de corr lation entre observations successives sont nuls si les observations sont r alis es intervalles de temps r guliers F Husson exemple tir de Henri Theil Principles of Econometrics 1971 Wiley p 102 cit in SHAZAM User s Reference Manual A listing of the data set filename THEIL txt This example uses the Theil textile data set The SHAZAM commands filename DW SHA below first estimate an equation with PRICE as the explanatory variable But economic theory suggests that INCOME is an important variable in a demand equation A statistical result is that if important variables are omitted from the regression then the OLS estimator is biased The second OLS regression is the preferred model specification that includes both PRICE and INCOME as explanatory variables http shazam econ ube ca intro index html The data is tim
5. encore on d partage les ex aequo selon un proc d analogue celui des autres tests non compris le test T de Wilcoxon pour s ries appari es Voici un exemple emprunt Cohen L and Holliday M Statistics for the Social Scientists Harper amp Row London 1982 p 155 ranky LS for ranked data 2 2 5 2 26 2 2 5 2 26 2 25 2 26 mo 25 414 SUN LS Su LE SON RE I 66 6 5 556 SRE TE DEAR LS DORE I 75 7 7 44 TO tn FF NN 10 eS 9 8 10 105 98 12 12 11 68 TABLEAU XIV coefficient de corr lation des rangs ou de Spearman A gauche en mode de s lection les donn es apparaissent Elles doivent figurer dans deux colonnes contigu s A droite les r sultats On dispose de N nombre d observations Np nombre de paires Mx moyenne des x My moyenne des y Sd somme des diff rences de chaque rang sd somme des carr s de chaque rang df nombre de degr s de libert s r coefficient de corr lation de Spearman t statistique de Student p probabilit associ e Z statistique de la loi normale ties nombre d ex aequo et corrections pour les ex aequo r tet p Ensuite les colonnes des rangs puis la droite de r gression selon y ax b On dispose aussi d un graphique Spearman Rank Order Correlation N Variable Y ranks Lee N L Laz g 0 2 4 6 8 10 12 Variable X ranks FIGURE I droite de r gression D autres tests
6. R B 1992 Testing Symmetry about an Unknown Median via Linear Rank Procedures Journal of Nonparametric Statistics 1 301 311 9 Triples test of symmetry Randles R H Fligner M A Policello G E and Wolfe D A 1980 An Asymptotically Distribution Free Test for Symmetry Versus Asymmetry Journal of the American Statistical Association 75 168 172 Location Tests for One Sample or Paired Samples 1 The t test classical Student or Gosset W S 1908 On the probable error of the mean Biometrika 6 1 25 2 The sign test 3 Dixon W J and Mood A M 1946 The statistical sign test Journal of the American Statistical Association 41 557 566 Fisher R A 1925 Statistical Methods for Research Workers Edinburgh Oliver amp Boyd This is credited with one of the first uses of the sign test Thompson W R 1936 On confidence ranges for the median and other expectation distributions for populations of unknown distribution form Annals of Mathematical Statistics 7 122 128 This paper derived the sign based confidence interval for the median Hettmansperger T P and Sheather S J 1986 Confidence intervals based on interpolated order statistics Statistics amp Probability Letters 4 75 79 This gives the nonlinear interpolation formula for CP s used by Minitab The Wilcoxon signed ranks test Wilcoxon F 1945 Individual comparisons by ranking methods
7. exact Scheffe and Tukey approaches Dunn O J 1964 Multiple comparisons using rank sums Technometrics 6 241 252 Bonferroni approach Miller R G Jr 1966 Simultaneous Statistical Inference New York McGraw Hill This book covers many classical and nonparametric multiple comparison procedures Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 328 334 for Tables A 9 A 12 6 Jonckheere Terpstra test for ordered alternatives 1 Jonckheere A R 1954 A distribution free k sample test against ordered alternatives Biometrika 41 133 145 Terpstra T J 1952 The asymptotic normality and consistency of Kendall s test against trend when ties are present in one ranking Indagationes Math 14 327 333 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 120 123 textbook treatment Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 311 327 for Table A 8 null distribution Tests for the Two Way Layout Friedman test Friedman M 1937 The use of ranks to avoid the assumption of normality implicit in the analysis of variance Journal of the American Statistical Association 32 675 701 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wil
8. ma connaissance M me si l on ne parle pas l italien une oreille latine ne peut manquer de comprendre par intuition imm diate le texte g n reusement propos par l auteur De nombreux exemples viennent agr menter les chapitres o l tudiant trouvera toutes les formules math matiques et toutes les tables voulues Nos macros sont en principe compatibles au travers des diff rentes versions d Excel 4 0 Excel XP Les tests non param triques sont utilis s d s que l effectif N d un chantillon est inf rieur 30 On admet en effet en biologie humaine tout au moins que la normalit d un chantillon est atteinte partir de N 30 En dessous de N 30 les tests n cessitent certaines hypoth ses normalit des distributions galit des variances etc Ceci est particuli rement vrai quand les effectif sont tr s faibles Une mention sp ciale cet gard est d cerner au tr s utile test de Kolmogorov Smirnov pour un chantillon Un test non param trique est donc un test d hypoth se pour lequel il n est pas n cessaire de sp cifier la forme de la distribution de la population tudi e Il faut cependant en g n ral que les observations soient ind pendantes c est dire que la s lection d un quelconque individu dans la population en vue de former l chantillon ne doit pas influencer le choix des autres individus Les m thodes non param triques requi rent peu d hypoth ses concernant la popula
9. that this generality comes at some cost other tests for example Student s t test may be more sensitive if the data meet the requirements of the test L int r t de ce test est de mettre en vidence une diff rence significative l ou le test t de Student Fisher ne permet pas de conclure Voici par exemple la conclusion du test t de l Analysis Tool Pack t Test Two Sample Assuming Equal Variances Traitement Placebo Mean 3 607 8 3565 Variance 124 649148 164 336582 Observations 20 20 Pooled Variance 144 492865 Hypothesized Mean Difference 0 df 38 t 1 24946671 P T lt t one tail 0 10956794 t Critical one tail 1 68595307 P T lt t two tail 0 21913589 t Critical two tail 2 02439423 Quelle est la proc dure suivre pour calculer la statistique de Kolmogorov Smirnov Ici nous avons deux chantillons Nous devons ranger les deux s ries d observations en fr quences cumul es ce qui peut se faire de deux fa ons selon que l on distingue des classes ou pas en ce cas nous calculons ce que l on appelle la fonction de r partition empirique propos de la fonction de r partition empirique voici un extrait du site http conte montesquieu u bordeaux frindex html o des pr cisions fort int ressantes sont mises en exergue La fonction de r partition est la fonction qui associe tout nombre r el le nombre d individus de la population tudi e qui ont une valeur inf rieure au dit
10. 6 ss 10 ae 13 44 S O mms mnsmnsmonnenehinnsnnsnnsmnsnnsnmmtali nn mms nus manne ms mamans mms nmsmmsnnsmnsnmnl OSEE D TABLEAU XX tableau de contingence du Mood Test Mais comme plusieurs effectifs th oriques sont inf rieurs 3 on ne peut traiter ce tableau par un 2 d homog n it On doit soit regrouper des donn es soit pratiquer un test de Kolmogorov Smirnov essayons cette option rank Fn1 x lt 2 5 Gn2 x gt 2 5 Dn1 n2 0 1 5 0 33333333 0 16666667 0 16666666 1 5 2 1 0 5 0 33333333 0 16666667 21 27 0 5 0 33333333 0 16666667 27 34 0 5 0 5 0 3 4 4 05 0 66666667 0 16666667 4 46 05 0 83333333 0 33333333 4 6 5 3 0 66666667 1 0 33333333 5 3 5 9 0 66666667 1 0 33333333 5 9 6 5 0 83333333 1 0 16666667 6 5 7 2 1 1 0 Kolmogorov Smirnov for two samples N 12 ni 6 n2 6 Si 22 S2 22 mi 3 67 m2 3 67 Dk 0 333 Kd 1 pD NS D critical 0 05 0 833 D critical 0 01 pKd NS 1 Kd critical 0 05 5 Kd critical 0 01 6 KS Test Comparison Cumulative Fraction Plot gt 1 1 e _ o_o D max 6 0 333 LL Fni s lt 25 5 G z 25 F 4 oO x FIGURE VII Le test n est pas significatif notez qu un regroupement des cat gories comme le pratique l auteur donne une valeur du 2 qui est NS 13 Test de McNemar Il s agit d un test qui traite une variable dichotomique r ussite chec favorable d favorable etc mesur e sur les
11. 67 1 17 nji 1 1 34 2 34 Contingency table ddl 1 chi2 2 33 p 0 123 Le test exact de Fisher permet de trouver une valeur semblable Possible matrices and their Ps p for 0 14 0 2 12 2 9913E 06 p for 1 13 1 3 11 0 00016751 p for 2 12 2 4 10 0 00299427 p for 3 11 3 5 9 0 02395417 p for 4 10 4 6 8 0 09881097 p for 5 9 5 7 7 0 22585364 p for 6 8 6 8 6 0 2964329 p for 7 7 7 9 5 0 22585364 p for 8 6 8 10 4 0 09881097 p for 9 5 9 11 3 0 02395417 p for 10 4 10 12 2 0 00299427 p for 11 3 11 13 1 0 00016751 p for 12 2 12 14 0 2 9913E 06 Fisher s exact test table 10 4 6 8 one tailed p 0 12592991 two tailed p 0 15304886 other 0 97288 theor value of chi2 lt 3 6for 4 Le test de la m diane peut tre tendu a plusieurs groupes extension of the median test On peut trouver un exemple fort instructif au site suivant http cons dev univ lyon1 fr Enseignement Stat St html Je laisserai le lecteur aller consulter la page Voici enfin les formules qui permettent d op rer la computation du test qui se r sume en fait un classement des diff rentes valeurs selon la m diane inclue ou exclue selon le cas suivi d un test du chi2 classique ou d un tableau de contingence Ces formules sont extraites de NPARTESTS x nfl t vba p if Vis even a 2 f2 1 Pf Pee otherwise N l 2 Miwa
12. Chakraborti S 1992 Nonparametric Statistical Inference New York Marcel Dekker pp 495 502 for Table J null distribution Mood s median test Mood A M 1950 Introduction to the Theory of Statistics New York McGraw Hill The most frequently cited source for this test Westenberg J 1948 Significance Test for Median and Interquartile Range in Samples from Continuous Populations of Any Form Akad Wetensch Afdeeling Voor de Wis 51 252 261 The earliest known source although the title is misleading with respect to the assumptions The modified Mathisen test Hettmansperger T P and McKean J W 1998 Robust Nonparametric Statistical Methods London Arnold pp 105 131 133 Mathisen H C 1943 A method of testing the hypothesis that two samples are from the same population Annals of Mathematical Statistics 14 188 194 This paper proposed the original Mathisen test known as the control median test The two sample normal scores test van der Waerden B L 1952 1953 Order tests for the two sample problem and their power I Indagationes Mathematicae 14 453 458 II Indagationes Mathematicae 15 303 310 II Indagationes Mathematicae 15 311 316 Proceedings of Koninklijke Nederlandse Akademie van Wetenschappen 55 and 56 Two Sample Preliminary Tests The Two Sample Kolmogorov Smirnov Test Smirnov N V 1939 On the estimation of the discrepancy between empirical cur
13. Chi squared test The most commonly used test for frequency data and goodness of fit In theory it is nonparametric but because it has no parametric equivalent it is not classified as such It is not an exact test and with the current level of computing facilities there is not much excuse not to use Fisher s exact test for 2x2 contingency table analysis instead of Chi squared test Also for larger contingency tables the G test log likelihood ratio test may be a better choice L attention comme on l a vu est port e sur le nombre de modalit s du Voici d autres consid rations extraites et adapt es de Statistical Analysis in HLA and Disease Association Studies M Tevfik Dorak B A Hons M D Ph D G Statistics An application of the log likelihood ratio statistics for the hypothesis of independence in an rx c contingency table It can also be used to test goodness of fit The G test should be preferred over Chi squared test when for any cell in the table O E gt E The Chi squared distribution is usually poor for the test statistics G when N rc is smaller than five preferable to the Chi squared test in Hardy Weinberg Equilibrium test as long as this condition is met StatView HyperStat and StatXact perform G statistics The likelihood ratio Chi squared test or maximum likelihood statistics are usually known as the G test or G statistics Sokal RR Rohlf FJ New York W H Freeman amp Company 1994 Whenever a
14. DOS amp Windows 15 MVSP multivariate statistical package Windows 3 1 Win95 98 NT 2000 16 Oriana circular statistics for Windows Windows 17 Resampling Stats randomization and bootstrap statistics Win amp Mac 18 SAAP spatial autocorrelation analysis DOS 19 Statistical Calculator a programmable and extensible system for data analysis DOS 20 BIOMlab learn basic statistical concepts through sampling experiments DOS Une mention particuli re pour Stat 200 quoique brid en version demo il permet de se faire une id e tr s pr cise de l emploi des tests sur un mode assez intuitif et semblable a une pr sentation de type Excel Une grande richesse de tests et d options On peut montrer par une astuce tr s simple qu il est possible sans employer de crack de passer outre la limitation du logiciel par le remploi judicieux de certains fichiers au format txt A bon entendeur salut TABLES 23 tables sp cifiques a chaque test sont incluses dans la feuille macro elles peuvent tre copi es en les s lectionnant dans une liste d roulante pour d sactiver l option il faut choisir la ligne no table qui permet de choisir le test que l on veut tudier Mann and Whitney 5 d apr s Jacobson J E Journ of the Amer Stat Ass 1963 1086 Mann and Whitney a 1 Fisher Yates Terry test C1 d apr s Fisher et Yates Statistical tables for biological agri
15. I 1 3 3 3 IL 1 4 2 3 I 2 3 1 4 IV 15 15 65 35 transformation en rangs et XR I i IT IV total Ri A 1 1 2 15 55 B 3 4 3 15 115 C 3 2 1 35 95 D 3 3 4 35 13 5 Notez que la transposition est faite automatiquement par le logiciel partir du moment o l on a saisi la colonne des tiquettes du tableau comme traitements i e observations et la ligne des tiquettes dudit tableau comme blocs Voici du reste la bo te de dialogue qui correspond la saisie de ce tableau R sultat Kendall s coefficient of concordance k 4 N 4 df 3 s 35 W 0 438 F 0 515 T forties 3 W 0 515 p 0 103 critical value of W 5 1 10 le test de Kolmogorov Smirnov ne figure pas dans l Analysis Tool Pack d Excel C est une alternative des plus int ressantes au test du 2 quand celui ci n est pas possible au cas ou les effectifs th oriques ne sont pas suffisants Mais les propri t s de ce test sont beaucoup plus tendues que celles du X Ce test en fait est un v ritable couteau suisse qui permet aussi bien de d cider entre 4 auditeurs quel est le meilleur violon entendu lors d un blindfold test OU encore de d cider si une courbe pr sente telle ou telle tendance normale Aussi peut on para tre un peu tonn en n ophyte des qualit s prot iformes de ce test Mise en oeuvre elle s tablit en appelant la macro correspondante qui donne acc s cette bo te de dialogue
16. Voici les formules permettant la computation de ce test Il est incompr hensible que des revues de CD classiques distingu es comme la revue R pertoire que j voque dans la section sur Sergiu Celibidache n aient pas employ es cette statistique dans leur blindfold test lors des coutes comparatives de versions diff rentes d une oeuvre Ce test permet de d cider si les diff rences observ es entre t chantillons r partis en p blocs sont dues au hasard ou au fait que les traitements sont diff rents Ce test s applique donc surtout pour les exp riences en blocs compl tement randomis s On commence par remplacer les observations par leur rang L op ration s effectue ind pendamment pour chaque bloc Ce test distribue les donn es en un tableau double entr e ayant N rang es et k colonnes Les rang es repr sentent les diff rents sujets traitements treatment et les colonnes les diff rentes conditions blocs block Les donn es sont rang es La d termination des rangs se fait pour chaque rang e s par ment cette m thode de classement par rang e s par e explique que nous ayons regroup s les statistiques de Friedman de Page et le coefficient W de Kendali Donc pour k conditions les rangs de chaque rang e se r partissent entre 1 et k Le test d termine si les diff rentes colonnes de rangs proviennent de la m me population Le traitement des ex aequo l int rieur d un bloc reste le m me que pour l
17. Whitney U statistic Applied Statistics 22 269 273 15 Lehmann E L 1985 Nonparametrics Statistical Methods Based on Ranks San Francisco McGraw Hill 16 Smirnov N V 1948 Table for estimating the goodness of fit of empirical distributions Annals of Mathematical Statistics 19 279 281 bibliographie compl mentaire adapt e et tir e de Clint W Coakley November 1998 One Sample Preliminary Tests 1 Rank von Neumann Ratio test of independence Bartels R 1982 The Rank Version of von Neumann s Ratio Test for Randomness Journal of the American Statistical Association 77 40 46 Gibbons J D and Chakraborti S 1992 Nonparametric Statistical Inference New York Marcel Dekker pp 88 90 textbook treatment 2 Kolmogorov Smirnov Goodness of Fit test Kolmogorov A N 1933 Sulla determinazione empirica di una legge di distribuzione Giorn Dell Inst Ital Degli Attuari 4 83 91 Conover W J 1980 Practical Nonparametric Statistics second edition New York John Wiley amp Sons Inc pp 344 356 textbook treatment applied Gibbons J D and Chakraborti S 1992 Nonparametric Statistical Inference New York Marcel Dekker pp 104 120 textbook treatment theory p 487 for Table F null distribution 3 Pearson Chi squared Goodness of Fit test Pearson K 1900 On the criterion that a given system of deviations from the probable in the case of a correlated syste
18. chiefly from anthropological data Proceedings of the Royal Society of London 45 135 145 Spearman correlation coefficient Spearman C 1904 The proof and measurement of association between two things American Journal of Psychology 15 72 101 Siegel S and Castellan N J Jr 1988 Nonparametric Statistics for the Behavioral Sciences second edition New York McGraw Hill pp 235 244 textbook treatment applied Kendall s tau Kendall M G 1938 A new measure of rank correlation Biometrika 30 81 93 Siegel S and Castellan N J Jr 1988 Nonparametric Statistics for the Behavioral Sciences second edition New York McGraw Hill pp 245 254 textbook treatment applied Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 384 393 for Table A 21 null distribution Theil Sen simple linear regression procedures 5 6 Theil H 1950 A rank invariant measure of linear and polynomial regression analysis I Proceedings of Koninklijke Nederlandse Akademie van Wetenschappen A53 386 392 II Proceedings of Koninklijke Nederlandse Akademie van Wetenschappen A53 521 525 MI Proceedings of Koninklijke Nederlandse Akademie vanWetenschappen A53 1397 1412 Sen P K 1968 Estimates of the regression coefficient based on Kendall s tau Journal of the American Statistical Association 63 1379 1389 Sen
19. de haut en bas saisie d une ou de deux colonnes de donn es selon que l on traite un ou deux chantillons cf exemples infra Saisie ventuelle des tiquettes des donn es qui doivent figurer dans la premi re ligne saisie de la cellule o l analyse prendra forme Puis saisie du facteur classe pour l tablissement des classes de la fonction de r partition empirique conduisant sur option la construction d un graphe Chois de la modalit un ou deux chantillons Dans le cas o l on dispose de deux chantillons de taille diff rente il est obligatoire de classer les distributions cumul es range of Enfin formulation uni ou bilat rale Voyons tout cela sur un premier exemple a cas de deux chantillons TRT 0 38 1 26 0 34 0 7 1 75 50 57 1 55 0 08 0 42 0 5 3 2 0 15 049 0 95 0 24 1 37 0 17 698 0 1 0 94 placebo 1 19 2 37 2 16 14 82 1 73 41 04 0 23 1 32 2 91 39 41 0 11 27 44 451 051 45 0 18 14 68 4 66 1 3 2 06 Le cas de figure est le suivant comparaison de deux modalit s th rapeutiques avec des tailles lt 30 Cet exemple est extrait du site http www physics csbsju edu stats KS test n plot_form html Laissons parler l auteur The Kolmogorov Smirnov test KS test tries to determine if two datasets differ significantly The KS test has the advantage of making no assumption about the distribution of data Technically speaking it is non parametric and distribution free Note however
20. for 4 1 4 5 0 0 02380952 Fisher s exact test table 5 0 1 4 one tailed p 0 02380952 two tailed p 0 04761905 other 1 theor value of chi2 lt 3 2for 0 De nombreux liens existent sur le test exact de Fisher nous avons s lectionn ceux ci qui se distinguent par leur clart ou la pr sence d applets java http www matforsk no ola fisher htm remarquable applet donne les 3 probabilit s mais pas le d tail du calcul des diff rentes probabilit s http quantrm2 psy ohio state edu kris nonpar htm Kristopher J Preacher and Nancy E Briggs May 2001 The Ohio State University idem pour l apple http faculty vassar edu lowry webtext html Richard Lowry 1998 2000 http mathworld wolfram com topics StatisticalTests html Author Eric W Weisstein 1999 CRC Press LLC 1999 2003 Wolfram Research Inc http oms b3e jussieu fr biostaTGV index html notez que l applet ne marche que si vous tes connect s alors qu elle fonctionne avec les deux autres cit es supra A noter on ne peut calculer la correction de Yates ou un test exact de Fisher que pour un tableau 2 x 2 d s qu un effectif th orique est inf rieur a 5 pour un tableau de plus de 2 x 2 cases il faut proc der a des recoupements ou utiliser un autre test comme celui de Kolmogorov Smirnov dans le tableau de contingence on ne doit pas avoir plus de 20 de cases o l effectif th orique est inf rieu
21. force de liaison de diff rentes fa ons Seul le coefficient Kendall a une interpr tation simple adapt de Why Kendall Tau de G E NOETHER University of Connecticut 12 Test de la m diane Mood test Il s agit du test du signe adapt deux ou plusieurs chantillons This is a crude version of the Kruskal Wallis ANOVA in that it assesses the difference in samples in terms of a contingency table The number of cases in each sample that fall above or below the common median is counted and the Chisquare value for the resulting 2 x k samples contingency table is calculated Under the null hypothesis all samples come from populations with identical medians approximately 50 of all cases in each sample are expected to fall above or below the common median The Median test is particularly useful when the scale contains artificial limits and many cases fall at either extreme of the scale off the scale In this case the Median test is the most appropriate method for comparing samples Exemples soit deux groupes de livres de statistique et de livres divers on cherche a savoir s ils sont pagin s de la m me fa on Voici les donn es divers 29 39 60 78 82 112 125 170 192 224 263 275 276 286 756 stat 126 142 156 228 245 246 370 419 433 454 478 503 369 La m diane vaut 236 5 divers stat x lt 236 5 10 4 14 x gt 236 5 6 8 14 16 12 28 divers stat ni x lt 236 5 0 5 0 67 1 17 x gt 236 5 05 0
22. length Y of 15 aphid stem mothers and the mean thorax length Y2 of their parthenogenetic offspring Voici le r sultat obtenu sur Excel au moyen de la macro sp cifique au coefficient de rang de Spearman auquel est ajout par une case cocher le Tau de Kendall Spearman rank order correlation N 30 Np 15 Mx 9 My 5 74 Sd 0 Sd2 196 5 df 13 r 0 649 t 3 076 p 0 00885 Z 0 00758 ties 2 r corr 0 649 tcorr 3 074 pcorr 0 00888 Kendall s Tau n 15 S 52 tau 0 4952 Tk forties X 0 Y 1 tau corr for ties 0 4976 p 0 0101 pcorr 0 0097 critical value tau n lt 13 not available Un graphique le m me que celui du coefficient de Spearman est en outre disponible Spearman Rank Order Correlation 16 14 12 10 Variable Y ranks on s m 0 2 4 6 8 10 12 14 16 Variable X ranks FIGURE VI Les auteurs du site expriment ce r sultat sous la forme suivante Y1 column 1 Y1 Y2 column n Kendalltau P Spearmanr P 2 Y2 15 0 49761335153 n lt 40 0 64910714286 0088 P is the probability that the variates are not correlated The low P value lt 0 05 for this data set indicates that the two variates probably are correlated ll y a 2 ex aequo la formule employer devient S yanin 1 Ty n n 1 46 o T et T2 sont calcul s ainsi t TEE on Tk ie iti ti Ju o ti est le nombre d ex aequo au rang pour la variable Xx k 1 2 Dans le cas
23. m mes sujets deux moments avant apr s apprentissage condition 1 condition 2 not s t et te Ce test se rapproche donc de celui de Wald Wolfowitz et du Sign Test il en est cong n re Voici un extrait du site http www2 chass ncsu edu garson pa765 index shtml qui permettra de s e faire une exacte id e de l importance de ce test The McNemar test assesses the significance of the difference between two dependent samples when the variable of interest is a dichotomy It is used primarily in before after studies to test for an experimental effect Also for two dependent samples the marginal homogeneity test is an extension of the McNemar test for multinomial variables more than two categorical values The sign test and the more powerful Wilcoxon signed ranks test are for two dependent samples when the variable of interest is continuous McNemar s test is sometimes called McNemar s test of symmetry or McNemar symmetry chi square because it and the marginal homogeneity test which extends it beyond dichotomous data apply to square tables in which the diagonal reflects subjects who did not change between the beforeandafter samples or matched pair samples The test of symmetry tests whether the counts in cells above the diagonal differ from counts below the diagonal If the two counts differ significantly this reflects change between the samples such as change due to an experimental effect between the before and after
24. or 1 whichever is greater If h is user specified the integer value is used unless itis less than one The significance level is determined as above NPAR TEST in SPSS Les anglo saxons emploient le terme de truncated span selon la valeur attribu e au facteur h Il s agit en fait de l quivalent des outliers ou donn es r put es aberrantes exemple 1 soit deux s ries C et E on veut observer si les variances de C et de E diff rent C 1216613133101011 E 25514190171588 R sultat Value 0 3 5 6 88 10 10 11 12 13 13 14 15 16 17 19 25 Category E C E C E E C C C C CCEE C E E E Rank 1 2 3 4 55 55 75 75 9 10 11 5 11 5 13 14 15 16 17 18 Sequence 0 1 0 1 0 0 1 14 1 1 1 1 00 1 0 0 0 Runs 1 1 1 1 0 10000010 1 10 0 Wald Wolfowitz test N 18 nl 9 n2 9 runs 9 u 10 s 2 058 Z 0 243 p 0 80801 exact value 0 39 Moses Test Extreme Reaction sh 9 nc 9 2h 2 g 2 p 0 0767174 exemple 2 soit deux s ries T et P ou T figure un groupe recevant un traitement r el et P un autre groupe recevant un placebo on veut savoir si les variances different Mise en oeuvre on appelle la boite de dialogue suivante Cette bo te est videmment la m me que pour le test de Wald Wolfowitz On y distingue une case cocher pour prendre en compte le Moses Test puis le facteur h saisir comme vu plus haut avec une possibilit permettant de faire varier volont la probabilit pour un h d
25. samples The marginal homogeneity test is similar to the McNemar test extending it to the case where the variable of interest assumes more than two nominal values While it may be used with ordinal data the sign test is preferred Pour l utilisation du test d homog n it nous renvoyons donc le lecteur au Sign Test Sous Excel la computation de ce test ne pose aucun probleme il faut disposer en deux colonnes contigues les s ries d observations de taille gale en deux cat gories par exemple 1 et 0 et ce avant et apr s Voila un exemple g n r avec des nombres al atoires A 1 3 1 3 3 3 9 1 3 1 94 41 1 3 8 B 1311313333113133 6 3 4 8 Mc Nemar test ni n2 A 4 B 3 exactp 0 5 chi2 0 p 1 L approximation par la loi normale est permise a partir de ni n2 gt 25 Deux formules permettent d obtenir soit la probabilit exacte soit l approximation par le chi carr a 1 dal ae M n p X lt r gt l 2 josy i 0 50 o r MIN n n2 donc ici r 3 La p obtenue doit tre multipli e par 2 dans le cas d un test bilat ral 2 _ Um m 17 M tm 61 Pour appeler le test il suffit de lancer la boite de dialogie suivante a partir du menu g n ral Deux possibilit s sont offertes selon que l utilisateur poss de d j les donn es traiter ici par exemple 5 et 20 o que les donn es soient brutes notez que la macro donne par d faut les vale
26. the span s is defined as the smallest number of consecutive leads in an ordered series needed to include all the C leads Since the sampling distribution of s is known Moses 1952 it may be used for tests of significance Because s is essentially the range of the C leads and the range is known to be unstable the modification suggested by Moses is to pick an arbitrary small number h in advance of the analysis A value such as 1 or 2 is typical Then the span sh of the C leads is determined after dropping the h most extreme C ranks THE LEAD PROFILE AND OTHER NON PARAMETRIC TOOLS TO EVALUATE SURVEY SERIES AS LEADING INDICATORS Anirvan Banerji Economic Cycle Research Institute New York 24 th CIRET Conference Wellington New Zealand March 17 20 1999 On a donc g Sn Ne 2h o Sn repr sente la distance span ne l effectif du groupe contr le et h ce que j appellerai faute de mieux le facteur de Moses La valeur de h peut tre attribu e par d faut a 0 05 x ne en prenant la partie enti re elle peut aussi tre comprise entre 1 et 3 On calcule ensuite les probabilit s conditionnelles cumul es grace a la formule suivante r 2h 2 ne 2h 1 i i NE i 0 P ss lt nc 2h g is Nic Ne ne 25 On calcule p pour h 0 puis The test is repeated dropping the h lowest and h highest ranks from the control group If not specified by the user h is taken to be the integer part of 0 05 x ne
27. utile en remployant des cas tir s de sites qui nous ont paru int ressants ce sujet il est regrettable d observer que de nombreux sites donnent les formules employer mais point ou tr s peu d exemples ce qui nuit d une certaine fa on la port e didactique de leur d marche Nous citons pr sent un extrait superposable celui de tout l heure concernant le test de Mann Whitney Wilcoxon Summary about the rank signed Wilcoxon test Ordinal Data Evaluating Two Interventions on the Same Group of Individuals Wilcoxon Signed Rank Test Based on ranking of absolute differences between two observations for each individual Test statistic W is sum of all ranks of differences nA W y R BT aa where n is the number of individuals D is the difference between observations for the i th individual and R is the rank of the absolute difference for the i th individual note the fraction in front of the ranks will always have magnitude 1 and will have the sign of the difference If no real difference exists between individuals observations then the signs of the observed differences should occur by random chance W would then compute to a number close to zero Extreme values of W in either positive or negative sense thus lead to rejection of the null hypothesis that no difference exists between observations Individual Observation One Observation Two Difference Rank of Difference Signed Ran
28. value Pmin 5 8 critical value Pmin 1 3 Sign Test S 1 S 9 Smin 1 Smax 9 Hibil 0 011 H 1 uni 0 011 H 1 0 999 6 le test de Kruskal et Wallis ne figure pas dans I Analysis Tool Pack d Excel Ce test tr s utile permet d analyser la liaison entre un caract re quantitatif et un caract re qualitatif k classes k gt 2 The original paper is Kruskal and Wallis 1952 with errata appearing in Kruskal and Wallis 1953 No attempt is made to calculate exact values rather an incomplete beta approximation is used following Wallace 1959 Bob Wheeler The SuppDists Package February 19 2002 Ce test permet notamment d effectuer des comparaisons multiples en testant ce que l on appelle les rangs moyens C est ici le lieu n anmoins de mettre en garde les utilisateurs contre le danger de la p che la ligne des comparaisons multiples il y a en effet un grand danger comparer sans discernement plusieurs chantillons Nous dirons que ces comparaisons multiples font appel ce que l on appelle la notion de contraste L exemple suivant est tir de Zar J H 1984 Biostatistical Analysis Second Edition Prentice Hall Un chercheur veut savoir si l hypoth se nulle l abondance des mouches est semblable dans les trois couches de v g tation partir des 3 variables suivantes herbes arbrisseaux et arbres Si l hypoth se nulle est rejet e le chercheur veut savoir aussi quelle est
29. www inra fr bia ftp T FPstat module1 version2 Fiches ps gz Laissons parles un peu les auteurs On range ensemble les deux chantillons par ordre croissant et on remplace chaque valeur par le num ro de son chantillon d origine On obtient ainsi une suite de m n symboles 1 ou 2 On d finit un run comme une s quence d observations de l un des deux chantillons une s quence de symboles 1 ou de 2 imm diatement suivie soit d une s quence d observations de l autre chantillon soit de rien fin de la suite des m n symboles La statistique utilis e est le nombre total R de runs dans la suite construite partir des deux chantillons Sous Ho les Xi et les Yj sont tous issus d une m me population et on ne doit pas s attendre observer un nombre de runs trop faible contrairement certaines alternatives cas limites seulement 2 runs si la diff rence des positions est tr s forte par rapport aux dispersions par exemple 111111 222222 ou 3 runs si la position est commune mais si les dispersions sont tr s diff rentes par exemple 111 222222 111 Par exemple si nous prenons les deux suites X14589 Y 2346710 nous obtenons le r sultat suivant Value Category Rank Sequence Rune 1 1 1x 1 1 Wald Wolfowitz test j j TABLEAU XIII test de Wald Wolfowitz sur deux s ries Le r sultat montre qu il n y a pas de diff rence significative p 0 251 Mise en oeuvre il faut appeler la bo te
30. 0 six lt x l z RAES xb F x DY vex ifn Six SxX lt Xj n ial L sixex 44 On en voit le r sultat dans les colonnes de gauche du tableau Fn x et Gr x La fonction de r partition empirique est une fonction en escalier qui fait des sauts de hauteur 1 n en chaque point de chantillon Elle est donc dite ouverte a gauche et ferm e a droite KS Test Comparison Cumulative Fraction Plot D D max 19 0 455 Foi Gn2 pla o oo CUMULATIVE FRACTION o o _ nm w A on FIGURE II fonction de r partition empirique La s rie color e en rouge est le traitement celle en bleu est le placebo de fa on g n rale la s rie de gauche est donc en rouge et la s rie en bleu est dispos e droite Le tableau suivant montre l analyse du test de Kolmogorov Smirnov pour deux chantillons _Kalmogarov Smimav for two samples TABLEAU XVII Nous avons acces aux informations suivantes taille N d l chantillon tailles n1 et n2 des colonnes sommes et moyennes puis deux indices qui forment le r sultat du test exprim s par Dk et Kd Ici la valeur Dk 0 404 est significative avec p lt 0 05 puisqu elle est sup rieure la valeur critique 0 4 de justesse C est ce qui est exprim sur le graphique la barre verte verticale indique le point o l on a trouv la valeur SUPdeD ici le point 7 avec la valeur correspondante Les vale
31. 33 3 1 21 3 18 6 26 8 19 4 21 1 21 2 20 5 19 8 26 3 39 3 21 4 22 6 1 35 3 7 0 19 3 21 3 10 1 20 2 1 36 2 16 7 21 1 39 1 19 9 32 1 23 1 21 8 30 4 19 62 15 5 whitney 16 5 1 22 6 25 3 23 7 1 23 3 23 9 16 2 23 0 21 6 10 8 12 2 23 6 10 1 24 4 16 4 11 7 17 7 34 3 24 3 18 7 27 5 25 8 22 5 14 2 21 7 1 31 2 13 8 29 7 23 1 26 1 25 1 23 4 21 7 24 4 13 2 22 1 26 7 22 7 1 18 2 28 7 29 1 27 4 22 3 13 2 22 5 25 0 1 6 6 23 7 23 5 17 3 24 6 27 8 29 7 25 3 19 9 18 2 26 2 20 4 23 3 26 7 26 0 1 25 1 33 1 35 0 25 3 23 6 23 2 20 2 24 7 22 6 39 1 26 5 22 7 Fn vin F vin En quelques tapes nous allons traiter ces donn es 1 transformation des donn es brutes en donn es tabul es cf infra la macro SPACE 2 construction de la fonction de r parition empirique a classement des donn es nm mo nm mn Ey s TG a a H 7 0132 Ancwasreverserenreseretthnrerecmsnrsanenrneres 0 i TABLEAU XIX En formulation unilat rale on observe que la valeur Dk est sup rieure la valeur critique 0 132 c graphique associ KS Test Comparison Cumulative Fraction Plot 1 gy eoo _s ev y 09 _ 2 08 e 07 5 06 aa 05 lt 04 D max 11 0 214 FIGURE V fonction de r partition empirique L auteur conclue en ces termes This example is based on data distr
32. 4 0 00087451 p for 19 19 1 33 35 8 9423E 05 p for 20 20 0 32 36 4 0986E 06 Fisher s exact test table 6 14 46 22 one tailed p 0 00305579 two tailed p 0 00402382 other 0 99945833 theor value of chi2 lt 3 27 82 for 6 Il est clair que pratiquer un test de Fisher dans le cas pr sent est caricatural puisque la valeur th orique inf rieure pour la plus petite valeur est de 27 82 Il n emp che A des fins didactiques nous estimons indispensable de montrer cet exemple d taill Mise en oeuvre il suffit de s lectionner dans le menu g n ral la case d option correspondant Contingency Table La macro reconna t automatiquement si l chantillon a 1 ou plusieurs colonnes de m me pour le G Test toute valeur nulle LN 0 NOMBRE est saut e 3 le test U de Mann et Whitney ne figure pas dans I Analysis Tool Pack d Excel Deux statisticiens Mann et Whitney sont partis d une simple constatation de bon sens si 2 populations sont tr s diff rentes le cas extr me se produit quand les valeurs de l une sont inf rieures aux valeurs de l autre Par contre si elles sont confondues il doit y avoir intrication des valeurs de ces 2 populations Pour comparer deux moyennes il faut habituellement employer le test t qui suppose la normalit des distributions et l galit des variances hypoth ses inv rifiables avec des effectifs faibles comme on va le voir sur l exemple suivant tir de
33. Biometrics 1 80 83 Hodges J L Jr and Lehmann E L 1963 Estimates of location based on rank tests Annals of Mathematical Statistics 33 482 497 This paper proposed the median of Walsh averages as an estimator of the median Daniel W W 1990 Applied Nonparametric Statistics second edition Boston PWS Kent pp 496 502 for Table A 3 null distribution 4 The one sample normal scores test 1 Fraser D A S 1957 Nonparametric Methods in Statistics New York John Wiley amp Sons Inc Two Sample Location Tests The two sample Welch t test also known as the Smith Welch Satterthwaite t test Welch B L 1937 The Significance of the Difference Between Two Means When the Population Variances are Unequal Biometrika 29 350 362 Smith H F 1936 The Problem of Comparing the Results of Two Experiments With Unequal Errors 3 4 5 Journal of the Council for Scientific and Industrial Research 9 211 212 Satterthwaite F E 1946 An Approximate Distribution of Estimates of Variance Components Biometric Bulletin 2 110 114 The Mann Whitney Wilcoxon test or Wilcoxon rank sum test Wilcoxon F 1945 Individual comparisons by ranking methods Biometrics 1 80 83 Mann H B and Whitney D R 1947 On a test of whether one of two random variables is stochastically larger than the other Annals of Mathematical Statistics 18 50 60 Gibbons J D and
34. CA UNIVARIATA E BIVARIATA PARAMETRICA E NON PARAMETRICA PER LE DISCIPLINE AMBIENTALI E BIOLOGICHE edizione febbraio 2003 Lamberto Soliani con la collaborazione di Franco Sartore e Enzo Siri avec pas moins de 32 chapitres organis s selon des fichiers au format pdf Ceux traitant des tests non param triques sont les chapitres caput 6 7 8 14 18 d logiciels 1 Logiciels sp cifiques l conomie 2 BIOMstat for Windows basic statistical analysis programs for use with the 3rd edition of the text Biometry by Sokal and Rohlf Version 3 3 Win95 98 NT 2000 3 Chameleon Statistics cluster analysis and data visualization 4 NTSYSpc numerical taxonomy system for cluster and ordination analysis Version 2 1 Win95 98 NT 2000 5 NTSYSpc numerical taxonomy system for cluster and ordination analysis Version 2 1 Win95 98 NT 2000 6 Genstat a very powerful general statistics package 7 EZ Stat statistical analysis program Win 8 SYN TAX 2000 data analysis in ecology and systematics Windows Mac 9 Fractal D estimate the fractal dimension of outlines from digitized images DOS 10 ProStat advanced statistical analysis Win 3 1 Win95 98 NT 11 SIMSTAT for Windows powerful statistical data analysis program Windows 12 NLREG nonlinear regression and curve fitting Windows 13 GS spatial statistics for the environmental sciences ver 5 3 Windows 14 KWIKSTAT amp WINKS statistical analysis programs
35. Chi squared test can be employed it can be replaced by the G test In fact the Chi squared test is an approximation of the log likelihood ratio which is the basis of the G test Pearson originally worked out this approximation because the computation of the log likelihood was inconvenient but it no longer is The Pearson s statistics ye gt O E E is mathematically an approximation to the log likelihood ratio or G 2 O In O E The value called G approximates to the x distribution The G value can also be expressed as G 2 O InO O InE 4 60517 O log100 O logioE The G test as calculated above is as applicable as a test for goodness of fit using the same number of degrees of freedom as for Chi squared test It should be preferred when for any cell O E gt E For the analysis of a contingency table for independence Wilks wilks SS The likelihood test of independence in contingency tables Annals of Mathematical Statistics 1935 6 190 196 formulated the calculation of the G statistics as follows G 2 L fy Infij Ri InRi CjinCj N Inn where fij represents entries in each cell Ri represents each row total Cj represents each column total and N is the sample size The same formula can be written using logarithm base 10 as follows G 4 60517 fij logo fij Ri logio Ri Cjlogio Cj N 109 N The G value approximates to X with d f r 1 c 1 When necessary Yates correction sh
36. ELLULE ACTIVE B9 1 POSER VALEUR B12 B10 103 8 SELECTIONNER ro amp COLONNE CELLULE ACTIVE x amp FORMULE B12 SELECTIONNER rc amp COLONNE CELLULE ACTIVE x8 amp REMPLACER CELLULE ACTIVE 1 B9 FORMULE B16 CHERCHE CELLULE ACTIVE 1 POSER VALEUR B20 B18 SI ESTNUM B20 ATTEINDRE B26 POSER VALEUR B22 CELLULE ACTIVE 61 3 SELECTIONNER ro amp COLONNE CELLULE ACTIVE x 18 FORMULE B22 SI ESTNUM B20 ATTEINDRE B27 SUIVANT SELECTIONNER r amp y 1 amp c amp COLONNE CELLULE ACTIVE SI B4 0 1 x 1 amp SI NBCAR CELLULE ACTIVE 0 ATTEINDRE B30 ATTEINDRE B31 EDITION SUPPRIMER 2 SUIVANT RETOUR Cette macro ne marche que s il y a un seul En cas de plusieurs ici 3 il est plus simple d employer d abord la commande REMPLACER du menu o vous demandez remplacer a chaque fois 2 par 1 seul La macro marchera correctement a partir du moment ou les valeurs num riques ne seront plus s par es que par un seul b on aboutit au tableau de donn es suivant apr s avoir dispos les tiquettes TABLEAU XXI tableau de donn es tabul es c il faut lancer la proc dure de r gression lin aire Le plus simple consiste utiliser d abord les ressources de l Analysis Tool Pack d Excel et de s lectionner l outil r gression Analysis Tools outil regression L astuce va alors consister a substituer une boi
37. Pn Voici un exemple il est tir du site http cons dev univ lyon1 fr Enseignement Stat St html Supposons qu un chercheur veuille tudier l influence du niveau d instruction des m res sur le degr d int r t qu elles pr sentent pour la scolarit de leurs enfants Le niveau d instruction de chaque m re est appr ci par le dipl me le plus important obtenu par chacune d elle et leur degr d int r t pour la scolarit des enfants est mesur par le nombre de visites volontaires que chacune d elle rend l cole En tirant au hasard un nom sur dix d une liste de 440 enfants inscrit l cole il obtient les noms de 44 m res qui constituent son chantillon Son hypoth se est que le nombre de visites varie en fonction du niveau d ducation des m res Comme les groupes de m res de divers niveau d instruction sont ind pendants les uns des autres et que plusieurs goupes sont form s un test pour k chantillons ind pendants est envisag Comme le nombre d ann es de scolarit des m res et que le nombre de visites constituent au mieux des mesures ordinales du niveau d instruction et du degr d int r t le test des m dianes est consid r comme le mieux adapt tester l hypoth se concernant des diff rences des tendances centrales Voici les donn es Primaire 4 3 0 712 0 3 5 1 Coll ge 2 4 1 6 3 02 5 1 2 1 Terminale 20438 052 1 7 6 5 1 Universit 1 ans 9 4 2 3 Univ 2 2 4 5 2 Univ gt 2 2
38. R m 18 on d termine la statistique H ou Q qui suit approximativement une loi du chi2 m 1 ddl o m est le nombre de groupes i e de colonnes D N N 112 E Age a Cette quation s entend sans ex aequo s il y en a la variance doit tre augment e d une certaine quantit i Bede NW 1 0 ou t repr sente le nombre d ex aequo H corrig e s obtient alors par H H C si H est significatif p lt 0 05 on peut titre indicatif aller voir quelle moyenne est diff rente de l autre ou des autres Pour cela on pratique un test qui s inspire de la m thode des contrastes et qui consiste comparer la diff rence observ e entre les moyennes une certaine quantit 05 1 1 ae tt c DA PR C OI Wy My 12 1 1 1 o est le nombre de colonnes 21 Conditions d application de la statistique de kruskal Wallis nj gt 5 pour m 3 et N gt 10 pour m 4 Des tables sp ciales doivent tre consult es pour des valeurs inf rieures Ces tables sont int gr es la feuille macro Elles peuvent tre consult es l adresse suivante http cons dev univ lyon1 fr Enseignement Stat Tables TabKrusk html ou a l URL suivante http www psychology nottingham ac uk courses modules statsquide s StatisticalTables htm Voici un exemple TRTA 8 9 11 45 1 TRTB 1 2 0 5 1 TRTC 0 2 3 5 Ces trois traitements donnent ils des effets diff rents appliqu s 5 ma
39. Tests non parametriques sous Microsoft Excel t l charger les tests r cup rer le fichier au format pdf revu le 3 juillet 2003 section en cours Plan Principaux tests non param triques 1 chi2 2 tableau de contingence test exact de Fisher G Test ou Log Likelihood ratio 3 Mann Whitney 4 Fisher Yates Terry 5 T de Wilcoxon Sign Test 6 kruskal Wallis 7 Wald Wolfowitz run test Moses Test of Extreme Reaction 8 Coefficient de Spearman 9 test de Friedman 9bis test de Page 9ter coefficient de concordance W de Kendall 10 test de Kolmogorov Smirnov 11 Tau de Kendall 12 test de la m diane Mood test Extension of the median Test 13 test de McNemar 14 test de Jonckheere Terpstra Il autres tests Durbin Watson Ill le logiciel feuille commandes bo te de dialogue du menu Bibliographie r f rences par tests cf infra Tables Liens logiciels Remerciements je dois a M Christian Delaruelle d avoir mis en vidence un bogue majeur dans le calcul des rangs sur le test de Mann Whitney Non seulement ce bogue a t corrig mais cela m a permis de repenser enti rement le mode de d termination du test de kruskal Wallis dont la m thode de Mann Whitney ne constitue qu un cas particulier pour deux colonnes La m thode de calcul des rangs est maintenant bas e sur l limination progressive des minima ou du minimum quand il n y a pas d ex aequo des colo
40. appuie ensuite sur le bouton OK et un r sultat analo gue celui du tableau III appara t Pour l instant seuls 19 tests figurent Compte tenu que la programmation me prend un temps important pendant lequel je ne puis faire progresser mes autres travaux le lecteur comprendra que je n tofferais davantage ces options que si la demande s en fait r ellement sentir Qu il sache simplement que ce logiciel est videmment freeware puisque d velopp sous Microsoft Excel 4 0 pour Windows 3 1 n de licence 00 065 0400 L5433225 Par comparaison de nombreux logiciels int grent ces tests mais co tent plus de 500 Et les logiciels d velopp s librement ne me semblent pas avoir toute la souplesse et le confort d utilisation qui est propre l environnement d Excel Bibliographie a g n rale 1 ARMITAGE P BERRY P et BLACKWELL G 1994 Statistical Methods in Medical Research Ed Scientific Publications Oxford 2 COHEN L HOLLIDAY L et M 1983 Statistics for Social Scientists Ed Harper and Row 3 GARDNER M et ALTMAN D G 1989 Statistics with Confidence Ed British Journal Publications Londres 4 ROSENTHAL R et ROSNOW R L 1991 Essentials of Behavioral Research Ed McGraw Hill Series in Psychology 5 SCHWARTZ D 1970 M thodes statistiques l usage des m decins et des biologistes Ed Flammarion 6 TOMASSONE R DERVIN C et MASSON J P 1992 Biom trie mod lisation de ph nom nes biolog
41. as sasdoc stat chap28 index htm http software biostat washington edu 7Erossini courses intro nonpar text Computing the Jonckheere Terpstra Test_ html Nous donnons ici en italien mais parfaitement compr hensible pour des oreilles latines un extrait de la premi re r f rence cit e Nel caso di k campioni indipendenti come nell analisi della varianza ad un criterio di classificazione quando si suppone che essi siano ordinati secondo il valore delle loro mediane non importa se in modo crescente o decrescente con il test di Jonckheere possibile verificare l ipotesi se i vari campioni o gruppi abbiano tendenze centrali in accordo con la sequenza fissata a priori E chiamato anche test di Jonckheere Terpstra o delle alternative ordinate ordered alternatives in quanto proposto quasi contemporaneamente ed in modo indipendente da T J Terpstra nel 1952 nell articolo The asymptotic normality and consistency of Kendall s test against trend when ties are present in one ranking pubblicato su Indagationes Mathematicae Vol 14 pp 327 333 e da A R Jonckheere nel 1954 con un articolo intitolato A distribution free k sample test against ordered alternatives pubblicato su Biometrika vol 41 pp 133 145 Le test a donc t invent d abord par T J Terpstra L id e de base est que les moyennes de k chantillons ne different pas entre elles consid r es du point de vue de leur rang L hypoth s
42. au nombre total de ces ex aequo dans le groupe j Le degr de signification de W peut tre lu dans une table du pour la valeur T pMa X SKN W 14 pourN 1 ddl df Voyons cela sur un exemple Supposons que l on demande trois m lomanes d une revue X d couter 6 versions diff rentes d une symphonie de Beethoven mettons la 3 me l H ro que et de les ranger s par ment suivant l organisation des plans sonores qui ressortissent de l oganisation spatiale des instruments laquelle varie en g n ral grandement selon le chef d orchestre Les trois s ries ind pendantes de rangs donn es par les trois m lomanes A B C sont expos es dans le tableau suivant wo O1 OUO O1 8 D 2 ANOO w pM a 1 1 6 oup Nous pratiquons d abord le test de Friedman Friedman s Test N 18 t 3 b 6 SRj2 687 T 2 429 p 0 78715 critical value 5 ties no corr forties 1 T 2 429 p 0 78715 avec le d tail des rangs base de la computation du coefficient W de Kendall A B C total R a 1 1 6 8 b 6 5 3 14 c 3 6 2 11 d 2 4 5 11 e 5 2 4 11 f 4 3 1 8 Kendall s coefficient of concordance k 3 N 6 df 5 s 255 W 0 162 F 0 162 T forties 0 W 0 162 p 0 787 critical value of W 5 1 On voit que le test n est pas significatif les m lomanes n ont pu d partager les diff rentes versions de H roique Nous allons voir un autre exemple avec des ex aequo tableau des donn es A B C D
43. cted according to a certain hypothesis say the hypothesis of independence between the two variables Guide to Advanced Data Analysis using IDAMS Software P S NAGPAUL New Delhi India Ainsi le test du chi2 largi au tableau de contingence consiste a tudier plusieurs r partitions observ es quand on ne dispose pas de r partition th orique Voici l exemple de 3 r partitions observ es dont on se demande si elles diff rent A 88 24 27 61 20 25 B 63 17 20 39 27 25 C 41 15 18 22 31 17 Pee eee et tableau de contingence La r ponse est positive puisque p 0 04 pour 10 degr s de libert colonnes 1 x lignes 1 La derni re version du logiciel inclue la correction de Yates la formulation uni ou bilat rale et le test exact de Fisher pour les tableaux a 4 cases avec effectifs th oriques lt 5 Cf Fisher R A The logic of scientific inference Journal of the Royal Statistical Society vol 98 pp 39 54 Sur la correction de Yates cf Contingency tables involving small numbers and the y test Journal of the Royal Statistical Society Suppl 1 217 235 Voici d abord un tableau 2 x 2 trait sans la correction de continuit de Yates 15 9 10 16 Contingency table ddi 1 chi2 2 885 p 0 089 et avec la correction 1 2 5 5 w ral 3 s a 2bis Contingency table ddl 1 chi2 2 003 p cor Yates 0 157 Un autre auteur Haber a propos une autre correction mais qui n est pas sensib
44. cultural and medical research Oliver and Boyd Edinburgh limite sup rieure de Fisher Yates Terry C1 5 et 1 d apr s Klotz J H On the normal scores two sample rank test J Amer Stat Ass 1964 652 664 test T de Wilcoxon pour s ries appari es simplifi e d apr s Gibbons 1971 E L Lehmann in Nonparametrics Statistical Methods Based on Ranks San Francisco Holden Day 1975 coefficient de corr lation r de Spearman simplifi e d apr s Best et Roberts 1975 Friedman avec k 3 k 4etk 5 d apr s Siegel 1956 cf http cons dev univ lyon 1 fr Enseignement Stat Tables Tables html A noter que la table donn e par ce site est incompl te nous avons trouv les valeurs correspondant a k 3 suivant n gt 8 k 4 suivant n gt 4 et enfin k 5 n de 3 6 la page suivante http www class unl edu psycrs handcomp hcfried PDF Durbin Watson de m 1 m 5 r gresseurs ou variables explicatives 5 et 1 J Durbin and G S Watson Testing for serial correlation in least squares regression Biometrika 1951 30 159 178 A noter qu il existe une coquille dans la table a 1 l intersection n 17 et m k 4 ou 1 3 doit tre remplac par 1 63 tables de Kolmogorov Smirnov 6 tables Table of percentage points of Kolmogorov statistics Journal of the American Statistical Association Vol 51 pp 111 121 table de probabilit s binomiale
45. cy of the Sign test compared to the Wilcoxon is 2 3 when the differences are normally distributed and 1 3 when they are uniformly distributed W Daniel Applied Nonparametric Statistics Houghton Mifflin 1978 p 36 This test presumes an interval level of measurement of performance on subsets i e equal differences in performance measure between two systems mean the same whatever the absolute level of performance NIST has used word accuracy for this purpose but log word error rate would better suit this requirement It has for example been suggested that the difficulty of halving the error rate is approximately equal whatever the initial error rate of a system may be c exemple 3 tir d un fichier pdf Instructif car il permet d amplifier les r sultats d un test t conventionnel et d illustrer les possibilit s conjugu es de nos macros et de l Analysis Tool Pack d Excel Researchers wished to determine if two preparations of a virus would produce different effects on tobacco plants Twelve tobacco leaves were used in the experiment Half of each leaf selected at random was treated with preparation 1 of the virus The other half of each leaf was treated with preparation 2 The response variable measured was the number of lesions small dark easily counted rings appearing on the half leaf The numbers in the table below give the number of lesions per half leaf preparation 1 55252171614795441 pre
46. de dialogue suivante Input data Saisie d une ou de deux colonnes selon que les l ments sont d j dispos s sous une forme ordinale Dans le cas pr sent la s lection correspond aux deux colonnes contigu s X et Y category 1 et 2 on peut saisir n importe quel caract re ou une r f rence Ici B 4 correspond X et C 4 Y La macro sait faire la diff rence entre la saisie d un texte d un nombre ou d une r f rence output data zone de r ponse le tableau XIII permet d observer que les r sultats sont dispos s sur 5 colonnes pour l analyse et de deux pour la synth se Dans la premi re colonne la suite des nombres est r ordonn e la colonne suivante montre la cat gorie correspondante la colonne suivante le rang correspondant la m me macro est remploy e pour tous les calculs de rang Les deux colonnes suivantes montrent la transposition des valeurs ordinales en 1 et 0 la derni re colonne enfin d termine le nombre de runs ici 8 Dans le cas d ex aequo ici le rang moyen 4 5 qui correspond la valeur 4 il faut privil gier la suite des symboles en sorte de rendre R le plus grand possible ce qui signifie privil gier l hypoth se nulle Ho continuity correction permet de tenir compte du fait qu une distribution continue est utilis e dans l approximation d une distribution discr te selon que les runs soient r parties de fa on plut t unilat rale ou bilat rale Wald Wolfowitz U
47. distribution of T approximates a normal distribution with mean _ Ms ns n 1 o 5 where npg is the number of samples in the bigger group and standard deviation 9 sla ny n 1 12 Can then construct test statistic zT 6 7 which can be compared with t distribution with infinite degrees of freedom d f This comparison is more accurate with a continuity correction where l T i rl 2 d 8 En cas d ex aequo la variance de 8 doit tre remplac e par la formule var U 2 My MN t 12 2 o t est le nombre de valeurs ex aequo et N ns np A noter que cette correction n est utile que pour de petits chantillons L approximation de 4 est suffisante d s que MIN ng np gt 8 9 4 le test de Fisher Yates Terry E ne figure pas dans Analysis Tool Pack d Excel Ce test selon D Schwartz est justifi par son efficacit La m thode revient a normaliser les observations et a leur appliquer ensuite le test de l cart r duit qui est alors le meilleur Voyons l exemple suivant o 2 groupes de 10 lapins nourris chacun avec un r gime enrichi en cholest rol ont t soumis deux traitements diff rents X et Y On souhaite savoir si les r sultats sont diff rents Le tableau suivant montre dans la 1 re colonne les observations X et dans la 2 les observations Y Le r sultat du test est affich droite en deux tableaux les rangs cr s partir d
48. doivent tre prochainement disponibles ainsi que des liens faisant le point de ce que l on peut trouver sur le sujet Il s agit de la premi re statistique calcul e a partir des rangs qui ait t propos e 1903 Soit n le nombre d items classer Xi est le rang de l item i dans un premier classement et Yi son rang dans un second Dj X Yi est la diff rence de rangs observ s entre les deux classements Le coefficient de corr lation des rangs de Spearman a pour expression R 1 6 D 2 n n2 1 m Plus Rs est proche de 1 plus les deux classements sont proches A la limite ils sont compl tement identiques si Rs 1 Au contraire plus Rs est proche de 0 plus les deux classements sont ind pendants En cas d ex aequo on doit calculer la quantit Sui J es k 1 2 i l i l 27 o tki est le nombre d ex aequo au rang i de la variable Xx 9 le test de Friedman ne figure pas dans l Analysis Tool Pack d Excel Ce test est important a connaitre car il est utilis dans des circonstances sp ciales souvent rencontr es en pratique les tests de d gustation ou si l on pr f re et de mani re plus large les tests d appr ciation Le calcul des rangs n cessaire a ce test par groupes blocs et traitements fait en outre que ce test se rapproche de la statistique de Page ainsi que du coefficient de concordance W de Kendall Voyons un premier exemple a l hypnose dans une exp ri
49. e 7 de Pearson Sa formule g n rale est donn e dans un tableau 2 x 2 pouvant tre tendue au tableau de contingence classique par Rep X Rep Y Sample Y a b n1 Sample y G d n2 n3 n4 N G 2 alna binb clnc dlnd n Inn n Inn n Inn n Inn N In N o l on remarque 3 termes la 1 correspond aux entr es du tableau 2 x 2 la 2 aux sommes des colonnes et des lignes la 3 au total Dans le cas d un seul chantillon quivalent au d ajustement la formule devient G 2 gt In x f 1 ou fi repr sente la valeur observ e et la valeur th orique cf quation 1 Comme pour la correction de continuit de Yates on a crit une correction pour le G Test on l appelle la correction de Williams et elle s crit k l et dans le cas d un chantillon k est le nombre de modalit s On l emploie quand N lt 200 Exemple soit l chantillon suivant 55 28 37 43 G Test Log Likelihood ratio N 163 k 4 df 3 G 9 403 corr Williams 1 005 p 0 02439 Dans le cas de plusieurs chantillons tableau de contingence la correction de continuit de Williams s crit 4 mth ty q EN o m et n repr sentent le nombre de lignes et de colonnes de la matrice N est le nombre total de sujets Exemple A biologist collects leaf litter from a 1 nf quadrant placed randomly at night on the ground in each of two woodlands 1 on clay soil and the ot
50. e alternative ordinate fondate sulla somma dei ranghi di Friedman distribution free test for ordered alternatives based on Friedman rank sums stato proposto da E B Page nel 1963 con l articolo Ordered hypotheses for multiple treatments a significance test for linear ranks pubblicato sulla rivista Journal of the American Statistical Association Vol 58 pp 216 230 Esso serve per verificare l ipotesi che le mediane dei gruppi a confronto siano ordinate secondo una sequenza specificata a priori Il test solo unilaterale e quindi occorre definire a priori l ordine naturale dei valori delle mediane La statistique de Page ressortit de l hypoth se nulle Ho H me me me Meg 33 et de l hypoth se alternative H4 H me lt me lt me S lt me 34 exactement comme le test de Jonckheere dans le cas d chantillons d pendants Elle est d finie par L o k D 58 j 1 35 L repr sente la somme des j rangs Rj de j 1 k o k est le nombre de blocs exactement comme dans le test de Friedman La computation de L est donc identique celle du test de Friedman nous l avons li du reste sur notre macro au test de Page Une table sp ciale doit tre employ e pour observer la valeur critique de L partir de laquelle p lt 0 05 Voyons ceci sur un premier exemple commun d ailleurs Tomassone et Lamberto Soliani ABCDE 1 2 1 4 53 2 2 1 3 5 4 3 1 3 2 4 5 Dan
51. e nulle Ho est donc H me me me me 52 et l hypoth se alternative s nonce comme H me lt me S me lt lt me 53 marche suivre tape 1 partir de k chantillons construire un tableau ou les rangs sont envisag s deux a deux par un test U de Mann Whitney Wilcoxon Compute the k k 1 2 Mann Whitney counts U comparing group i with group j fori lt j The Mann Whitney count for groups 3 and 4 for example are the sum of the number of pairs X Y with X in group 3 Y in group 4 and X lt Y i e if X j is the jth item in the ith group then La formule g n rale a employer est dans le cas pr sent si l on consid re le groupe Usa na m4 Usa D 2 Xai Xag i l j 1 54 tape 2 faire la somme des Uj k 1 k EDIT i l j i 1 55 tape 3 consulter une table appropri e pour voir si J est sup rieur a la valeur critique Cette table peut tre trouv e dans le document pdf en italien pp 1447 1449 elle est int gr e la feuille macro et les valeurs critiques sont indiqu es au risque 5 1 et 0 5 Pour de grands chantillons qui correspondent en fait la taille de ceux pour lesquels les valeurs critiques ne sont pas disponibles on peut utiliser l approximation suivante N _Sk n _ J En lJ _ Narm J N2 2N 3 Dh 23 2nj 3 72 56 Nous indiquons syst matiquement la valeur approch e J a des fins didact
52. e series for the period 1923 to 1939 17 observations for the consumption of textiles in the Netherlands The variables are Year Volume of textile consumption per capita base 1925 100 3 Real Income per capita base 1925 100 4 Relative price of textiles base 1925 100 DE YEAR CONSUME INCOME PRICE 1923 99 2 96 7 101 0 1924 99 0 98 1 100 1 1925 100 0 100 0 100 0 926 11 6 104 9 90 6 927 22 2 104 9 86 5 928 17 6 109 5 89 7 929 21 1 110 8 90 6 930 36 0 112 3 82 8 931 54 2 109 3 70 1 932 53 6 105 3 65 4 933 58 5 LOL 7 61 3 934 40 6 95 4 62 5 935 36 2 96 4 63 6 936 68 0 97 6 52 6 937 54 3 102 4 5957 938 49 0 101 6 59 5 939 65 5 103 8 61 3 Voici la marche suivre pour exploiter ces donn es sous Excel de la version 4 0 la version XP a s lectionnez les quatre colonnes dans votre browser ici Mozilla il faut ensuite les coller o bon vous semble dans une feuille Excel Vous aurez alors des valeurs dans une seule cellule s par es par un certain nombre d espaces il s agit de donn es non tabul es Une macro va permettre de restituer chaque colonne sa propre colonne dans Excel c est dire de la tabuler la macro a t rentr e dans la colonne B et spaceest son nom dans la cellule B1 space POUR y 1 40 POSER VALEUR B4 NBCAR CELLULE ACTIVE 0 POUR x 1 B4 SI B4 0 ATTEINDRE B30 CHERCHE CELLULE ACTIVE 1 POSER VALEUR B9 B7 6 GAUCHE C
53. e test de Kruskal Wallis Etapes d termination de S S LER n k 1 2 Fl 28 Dans l exemple du tableau XV on trouve S 1686 avec Raj 27 20 19 14 k 8etn 4 la statistique de Friedman est alors donn e par une formule qui suit une loi du chi carr a k 1 ddl df Ly R n k 1 2 Xr nk k 1 29 Notons que pour des chantillons de taille r duite une formule diff rente est propos e bas e sur la statistique de Fisher qui doit se lire k 1 k 1 x N 1 ddl y bee L_ EJ 30 o comme pr c demment ZT est la somme des rangs pour chaque colonne attention ne pas confondre les blocs et les traitements N est le nombre de traitements et k le nombre de blocs Eri est la somme des carr s de chaque rang des colonnes On en voit un exemple au tableau XVI noter que la correction pour les ex aequo a t d termin e par le test du X k 1 ddl Mais cette formule ne tient pas compte des ex aequo On peut trouver cette formule l adresse suivante http ff123 net 125 x G 1 P belt 1 1 t Se i l j l 31 L auteur fait r f rence Sensory Evaluation Techniques 3rd Ed Meilgaard Civille and Carr On remarque que les symboles diff rent Voici les correspondances Rr X j n k 1 2 G b t t k gi repr sente le nombre d ex aequo du bloc i et tij le nombre de valeurs des ex aequo j appartenant au g
54. ement 19 tests disponibles y compris les tables pour les effectifs r duits 23 tables Pour acc der au test exact de Fisher il suffit de s lectionner la table de contingence si le tableau est de taille 2 x 2 et que les effectifs th oriques soient inf rieurs a 3 ou a une valeur a fixer le test de Fisher sera activ Mais vous pouvez aussi forcer son utilisation par une case a cocher Pour acc der au test voulu il suffit de s lectionner la case d option Notez que certains tests ont t regroup s ex Friedman Page et W de Kendall cf supra Pour consultez les tables il suffit de s lectionner la liste d roulante et d afficher un autre niveau que no tables Visible ci dessus qui constitue l option par d faut le menu est alors d sactiv n oubliez pas de s lectionner nouveau no tables pour pouvoir acc der l ensemble des tests Quand le test est choisi la bo te de dialogue sp cifique au test appara t comme sur la figure suivante Nonparam test CE LEE GA me ON Da labels Ist row B 5 G 5 tr nput data B 6 6 18 Output data 885 i E i SRE cf Extension of the median test Biom trie p 206 Comme on le voit la bo te de dialogue s inspire totalement de celles existant dans l Analysis Tool Pack Dans le cas pr sent 2 colonnes contigues sont s lectionn es A5 B12 et le r sultat appara tra dans la cellule D5 s lectionn e par l utilisateur On
55. ente donc la diff rence calcul e en rang entre la valeur minimale et la valeur maximale du groupe contr le 1 ce que l on peut crire SPAN Rank Largest Control Value Rank Smallest Control Value 1 Valeur qui doit tre arrondie a l entier le plus proche sur Excel on utilise la fonction INT ou TRUNC Je laisse nouveau la parole l auteur du site sur lequel on peut voir le document suivant Under the null hypothesis therefore the very long leads the very short leads as well as the moderate leads should all contain a mixture of E s and C s Under the alternative hypothesis most of the E s will be low or most of the E s will be high or most of the E s will be low or high with the C s concentrated in the middle Under these three conditions the C s will be concentrated at the high end the low end and the middle region respectively The Moses test determines whether the C s are so closely compacted or congested relative to the nE nC leads as to call for a rejection of the null hypothesis that both E s and C s come from the same population To perform the Moses test the leads from the E and C indicators are combined and arranged in a single ordered series retaining the identity of each lead as having come from the C indicator or the E indicator Then the span of the C leads is determined by noting the lowest and highest C leads and counting the number of leads between them including both extremes Thus
56. es ges 3 6 7 10 11 14 et 15 18 Il pr sente des sujets 20 noms de chaque cat gorie Les sujets doivent donner une valuation selon le label caract re familier une chelle de 1 5 avec 1 tant peu familiers et 5 tant familiers Voici les donn es 3 6 7 10 11 14 15 18 5 5 4 NO 1 EWN en C1 O1 O1 O1 O1 O1 UN oi 1 O1 O1 O1 O1 U1 O1 O1 O1 O1 O1 O1 O1 O1 A amp B D D amp B O1 O1 U1 Les r sultats sont int ressants ils montrent l importance qu il y a prendre en compte les ex aequo Le test est en effet non significatif mais comme il y a 29 ex aequo en fait on trouve que p lt 0 05 A a hoel I OS iaa 25 27 92 2512792 anepi GR Vs ES 513512782 135 12782 i AREA menee TABLEAU XVI statistique de Friedman probl me des ex aequo L interface de cette macro m rite quelques pr cisions Le test de Friedman est assimilable une ANOVA non param trique deux facteurs un facteur dit traitement et un facteur bloc Dans le cas pr sent le facteur bloc consiste en les 4 classes d ge les moyennes sont respectivement de 29 29 26 5 15 5 Bien que NS en formulation bilat rale le test est significatif en formulation unilat rale Le facteur traitement est ici de N 10 Voici la bo te de dialogue permettant de g rer les donn es Ici il convient donc de saisir comme bloc les intervalles d age 4 et comme traitement les 10 mesures
57. es nouvelles valeurs substitu es aux rangs eux m mes Ces rangs sont donn s par une table int gr e la feuille macro Au centre les r sultats avec la valeur C1 et le carr de Z somme indiqu e en fonction du nombre total des observations Une table existe qui donne ces valeurs mais celles ci sont calcul es automatiquement par exemple pour N 20 on trouve Z 17 7144 ER Te RE TONER FS MN 113 01228 i j lee vale CT EX T i ter fontical value Cl 1 OTOT f crore he ik Pees et SERRE TABLEAU IV test C1 de Fisher Yates Terry L encore on conserve l hypoth se nulle puisque p gt 0 05 On range nouveau les observations par ordre croissant et on comptabilise les rangs Des tables sp ciales doivent tre employ es int gr es dans le logiciel Ces tables donnent les valeurs limites partir desquelles une diff rence devient significative Ces valeurs limites sont indiqu es d s que nx et ou ny sont inf rieures 10 A noter que la d nomination de test de Fisher Yates Terry est purement fran aise et que le test n est connu ailleurs que sous l appellation de two sample rank test Voici les formules gr ce auxquelles le test est calcul L indice utilis est donc Z et l on recherche la somme des Z cf tableau IV soit pour les x soit pour les y Une valeur trop petite ou trop grande indique que les x ou les y sont en moyenne trop grands ou trop petits La valeur at
58. ey amp Sons Inc pp 138 146 textbook treatment Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 366 371 for Table A 15 null distribution 2 Multiple comparisons in the two way layout Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 151 158 textbook treatment of exact and Tukey approaches Miller R G Jr 1966 Simultaneous Statistical Inference New York McGraw Hill Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 373 382 for Tables A 17 A 19 3 Page test for ordered alternatives Page E B 1963 Ordered hypotheses for multiple treatments a significance test for linear ranks Journal of the American Statistical Association 58 216 230 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 147 150 textbook treatment Daniel W W 1990 Applied Nonparametric Statistics Boston PWS Kent pp 570 for Table A 17 null distribution Durbin test for incomplete block designs Durbin J 1951 Incomplete blocks in ranking experiments British Journal of Statistical Psychology 4 85 90 Procedures for Correlation and Simple Regression Pearson correlation classical Galton F 1888 Co relations and their measurement
59. generalized Theil s procedure to the case where there are ties among the regressor values Sprent P 1993 Applied Nonparametric Statistical Methods second edition London Chapman and Hall pp 188 202 textbook treatment applied Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 384 393 for Table A 21 null distribution Kernel regression Nadaraya E A 1964 On estimating regression Theory of Probability and Its Applications 9 141 142 Watson G S 1964 Smooth regression analysis Sankhya Series A 26 359 372 Ryan T P 1997 Modern Regression Methods New York John Wiley amp Sons Inc Chapter 10 textbook treatment Local linear regression Stone C J 1977 Consistent nonparametric regression Annals of Statistics 5 595 645 Cleveland W S 1979 Robust locally weighted regression and smoothing scatterplots Journal of the American Statistical Association 74 829 836 Ryan T P 1997 Modern Regression Methods New York John Wiley amp Sons Inc Chapter 10 textbook treatment Rank based Analysis of Linear Models McKean J W and Hettmansperger T P 1976 Tests of hypotheses based on ranks in the general linear model Communications in Statistics Theory and Methods A5 693 709 Hettmansperger T P and McKean J W 1977 A robust alternative based on ranks to least squares in analyzi
60. her on chalk soil She sorts through the leaf litter and collects woodlice belonging to 2 species Oniscus and Armadilidium It is assumed that the woodlice undertake their nocturnal foraging independently extrait de Multinomial GOF Tests Roland Hall Univeristy of Waterloo Lecture 15 CDA Ii Oniscus Armadilidium Total Clay soil 14 6 20 Chalk 22 46 68 soil Total 36 52 88 Traitons ces donn es successivement par un conventionnel puis par le G Test et enfin par un test exact de Fisher nij 2 86 4 14 7 0 84 1 22 2 06 nji 3 7 5 36 Contingency table ddl 1 chi2 9 061 p 0 003 G Test Log Likelihood ratio N 88 k 2 df 1 G 8 871 corr Williams 1 017 p 0 0029 Possible matrices and their Ps p for 0 0 20 52 16 2 3772E 10 p for 1 1 19 51 17 1 4543E 08 p for 2 2 18 50 18 3 9145E 07 p for 3 3 17 49 19 6 1808E 06 p for 4 4 16 48 20 6 4357E 05 p for 5 5 15 47 21 0 00047073 p for 6 6 14 46 22 0 00251412 p for 7 7 13 45 23 0 01005647 p for 8 8 12 44 24 0 03064081 p for 9 9 11 43 25 0 07190377 p for 10 10 10 42 26 0 13080956 p for 11 11 9 41 27 0 18498321 p for 12 12 8 40 28 0 20315121 p for 13 13 7 39 29 0 17243604 p for 14 14 6 38 30 0 11208343 p for 15 15 5 37 31 0 05495703 p for 16 16 4 36 32 0 01985752 p for 17 17 3 35 33 0 00509712 p for 18 18 2 34 3
61. ibuted according to the Cauchy distribution a particularly abnormal case The plots do not look particularly abnormal however the large number of outliers is a tip off of a non normal distribution The web page is silent on if this data is normal or lognormal that means it finds no evidence for either possibility This relatively large sample size can not save the t test it cannot see the difference whereas the KS test can The t test is not robust enough to handle this highly non normal data with N 80 Effectivement le test t ne montre pas de difference significative t Test Two Sample Assuming Equal Variances Variable 1 Variable 2 Mean 21 4354054 21 1126582 Variance 91 3832279 65 8441967 Observations 74 79 Pooled Variance 78 1908807 Hypothesized Mean Difference 0 df 151 t 0 22561506 P T lt t one tail 0 41090295 t Critical one tail 1 65500751 P T lt t two tail 0 8218059 t Critical two tail 1 97579993 11 Tau de Kendall la corr lation de rang Ce test est cong n re du coefficient de Spearman Aussi a t il t int gr dans le logiciel avec le calcul de ce coefficient Comme tous les autres tests relatifs a la corr lation on doit dire avant tout que s il s agit d un test qui met en vidence un certain degr de liaison entre deux variables il ne peut en aucun cas assurer qu il existe un lien de causalit entre ces deux variables Le Tau T de Kendall est employ dans les cas ou les variables s
62. ieure axi 1 ou a xi Insistons sur la mani re de lire le tableau pour en extraire l information disponible Puisque la ligne i Ni lt est le nombre d individus qui ont une valeur prise dans les i 1 premiers intervalles la plus grande valeur possible d un individu pris dans cesNi lt individus est donc au plus gale la plus grande valeur du i 1 me intervalle donc inf rieure sa borne droite Xi Ainsi la plus grande valeur possible des Ni lt premiers individus ligne i d un cumul la fran aise est donc inf rieure x qui est la borne droite de la i 1 me modalit mais aussi la borne gauche de la i me De m me Ni lt est le nombre de ceux dont la valeur est au plus gale la plus grande valeur du me intervalle de valeurs donc inf rieure sa borne droite x qui est aussi la borne gauche du i Teme Au total les effectifs Ni lt sont d cal s comme pr c demment vers le bas ou vers la droite Appliquons cela a notre exemple compl t par le graphique suivant voici cette tape les commentaires de l auteur http www physics csbsju edu stats KS test n plot_form htm You can see that the control and treatment datasets span much the same range of values from about 1 to about 50 But for most any x value the fraction of the treatment group that is strictly less than x is clearly less than the fraction of the control group that is less than x That is by and in large the t
63. iff rent bouton compute h range for censoring of range Le reste rejoint ce que nous avons d ja dit En principe le programme reconna t automatiquement le groupe contr le qui poss de la valeur la plus basse Voici les donn es et les r sultats T 64 7 73 56 82 68 94 68 29 36 81 32 39 88 38 53 P 26 23 53 74 9 23 30 96 6 31 47 63 21 90 26 4 2 49 70 98 92 7 37 Value 9 6 4 2 7 7 21 23 23 26 26 29 30 31 32 36 37 38 39 47 49 53 53 56 63 64 68 68 70 73 74 81 82 88 90 92 94 96 98 Category PPPPTPPPPPPTPPTTPTIT BB TP D eet Pe CP TT PP Tv EP Rank 12 3 4 55 55 7 85 85 105 105 12 13 14 15 16 17 18 19 20 21 225 225 24 25 26 215 27 5 29 30 31 32 33 34 35 36 37 38 39 Sequence o 0 0 0 1 00 0 0 00 1 0 0 1 1 011 OO 1 01 TOT 1 Toe ee Runs o 0 0 1 1 0 0 0 0 0 1 1 0 1 0 1 1 0 1 0 ti hk too PT Or On 1 0 Wald Wolfowitz test N 39 ni 16 n2 23 runs 21 u 19 872 s 2 979 Z 0 546 p 0 58507 exact value not available Moses Test Extreme Reaction sh 21 5 nc 23 2h 2 g 0 p 2 5695E 0 8 le test de corr lation de rang de Spearman ne figure pas dans l Analysis Tool Pack d Excel Ce test est l quivalent du coefficient de corr lation pour des effectifs de taille inf rieur 30 Les donn es de base consistent en une s rie de n couples xi yi Il convient ici de classer s par ment les x et les y chaque x correspond alors un rang allant de 1 n idem pour chaque y L
64. igure IV o l on prend CONSUME comme variable d pendante et INCOME etPRICE comme explicatives r gresseurs on aboutit aux donn es suivantes CONSUME Predicted Y 99 2 93 6923774 99 96 4234578 100 98 5790046 111 6 116 781445 122 2 122 451685 117 6 122 909996 121 1 123 045532 136 135 425383 154 2 149 804169 153 6 152 057362 158 5 153 905448 140 6 145 557095 136 2 145 097521 168 161 584412 154 3 156 861422 149 156 288651 165 5 156 135038 Le vecteur CONSUME reste celui saisi dans la colonne A tel qu indiqu la figure VI il faut par contre modifier la saisie des variables X pour s lectionner en lieu et place le PREDICTED Y fourni par l Analysis Tool Pack d Excel outil r gression Il y a une diff rence entre Excel 4 0 5 0 et les versions ult rieures c est que les valeurs pr dites de Y les r sidus et les r sidus standardis s sont saisis au dessous de l analyse elle m me alors qu ils taient s par s dans les premi res versions Aussi n est il point besoin dans les versions post rieures Excel 6 0 de saisir la cellule de Residual output range autocorrelati 0 TABLEAU XXII test de Durbin Watson Le tableau XII est obtenu apr s avoir s lectionn 1 dans la bo te de dialogue de la figure VI est le nombre d observations m le nombre de variables dites explicatives ici 2 r est le coefficient de corr lation qui suit l approximation Le sens de la valeur de NDW 2 019 peut
65. iques Dans 56 nj correspond au nombre d observations du groupe j Voyons cela sur un premier exemple A 99 114 116 127 146 B 111 125 143 148 157 C 133 139 149 160 184 U1 j U2 j 18 Ui 3 23 18 Ce tableau donne la valeurs des rangs Ui j compar s deux a deux cf formule 33 Sous Excel le r sultat apparait ainsi Jonckheere Terpstra test N 15 levels 3 n 51515 m 120 4 136 8 153 JIx u 59 37 5 9 46 J 2 272 p 0 024 critical exact value for J 51110 51 54 59 62 Pour J nous donnons la valeur 59 la moyenne et l cart type Rappelons que la moyenne Uy 37 5 est m N n V4 i l 57 et que la variance 6 9 46 est N 2N 3 Shn 2n 3 72 58 La valeur de J 59 est gale a la valeur critique au risque 1 Voyons un autre exemple 12 15 18 20 38 47 48 51 90 108 60 66 70 71 31 36 39 44 54 57 63 77 87 123 124 35 40 52 67 78 83 88 101 119 rwo NS wo CO A Co tableau des Uj U1 j U2 j U3 j Ui 2 51 Ui 3 78 55 Ui 4 68 55 58 Jonckheere Terpstra test N 38 levels 4 ni 1018 1119 m 44 7 51 38 66 82 73 67 J x u 365 269 5 38 34 J 2 491 p 0 006 critical exact value for J 5 1 0 5 not available La taille de l chantillon d passe les valeurs de la table Le test est significatif L examen des moyennes montre donc qu il existe un effet dose en situation unilat rale A noter que la statistique de Kruskal Walli
66. iques Ed Masson un must crit dans un style aussi clair qu il est possible et a chelle humaine en plus nous avons droit quelques notes de Don Giovanni en pr face voila une bonne entr e en mati re 7 ZAR J H 1996 Biostatistical Analysis Prentice Hall International Editions 8 KYD Ch W KINATA C Les Macros d Excel DunodTECH Paris 1992 9 FISHER R A 1946 Statistical methods for research workers Olivier amp Boyd London traduction fran aise aux Presses Universitaires 10 Bertrand M amp Charles B 1987 Initiation a la statistique et aux probabilit s Eyrolles 11 Centre d Enseignants et de Recherche de Statistique Appliqu e 1986 Aide m moire pratique des techniques statistiques pour ing nieurs et techniciens sup rieurs Ceresta 12 Falissard B 1996 Comprendre et utiliser les statistiques dans les sciences de la vie Masson 13 Abdi H 1987 Introduction au traitement statistique des donn es exp rimentales Grenoble Presses Universitaires de Grenoble 14 Baron J amp Li Y 2000 31 decembre Notes on the use of R for psychology experiments and questionnaires disponible a http www psych upenn edu baron rpsych htm 15 Bradley James 1968 Distribution free statistical tests Englewood Cliffs NJ Prentice Hall b tests non param triques 1 CAPERAA Philippe amp VAN CUTSEM Bernard 1988 M thodes et mod les en statistique non param trique Exp
67. it p 0 00675 R sultat sous Excel Page s Test NE 15 k b 6 L 1287 5 m 1102 5 s 30 311 Z 6 103 p 0 00675 critical value for L 5 1 0 1 not available Dernier point la formulation du test est par essence unilat rale Z 1 645 avec p lt 0 05 9 ter coefficient de concordance de Kendall W L encore on range les observations d une fa on semblable a ce qui est r alis pour la statistique de Friedman Il s agit d une sorte de g n ralisation a k classes les blocs dans Friedman du coefficient T de Kendall W exprime donc le degr de concordance entre k classes Pour calculer ce test on proc de ainsi tape 1 on classe les observations en rang s par ment pour chaque observation il s agit des tiquettes traitement dans Friedman tape 2 on calcule la somme des rangs j XR de chaque colonne n x k k classe bloc et N nombre d observations traitements il va de soi que le nombre d observations doit tre gal pour chaque classe sinon le test n a aucun sens tape 3 on d termine W 125 R 3k N N 1 W i l k N N 1 k gt T j 40 Il convient de tenir compte des ex aequo qui diminuent un peu la variance de W le terme soustractif du d nominateur de W peut tre d termin par T gt G 1 41 o ti comme dans le test de Friedman est le nombre d ex aequo du groupe i de chaque colonne j gj correspond pr cis ment
68. joy sadness calmness encore appel k Puis ER somme des carr s du total des Rj 27 20 19 14 le T de Friedman est ici inf rieur la valeur critique 7 5 lu dans la table inclue dans la feuille macro noter que la table donn e par ce site est incompl te nous avons trouv les valeurs correspondant k 3 suivant n gt 8 k 4 suivant n gt 4 et enfin k 5 n de 3 6 la page suivante http www class unl edu psycrs handcomp hcfried PDF Poursuivons dans le cas pr sent il n y a pas d ex aequo Sinon il faut appliquer une correction qui appara t sous le label T Pour m moire m me lorsque le test est non significatif nous avons donn a titre indicatif seulement les comparaisons multiples chose interdite en statistique l avec la valeur critique Notez encore que le r sultat T de la statistique de Friedman peut tre rapport par un test F lorsque k est compris entre 3 et 5 ou que N est compris entre 5 et 10 Ce test F est lu pour N 1 k 1 ddl cf infra 30 b extrait de Reading Reference for all SPSS related matters Kinnaer P R and Gray C D 1997 SPSS for Windows made simple second edition Hove Psychology Press Un chercheur int ress par l apprentissage du langage veut savoir si l ge d acquisition affecte les sentiments des sujets qu un mot est familier Il con oit une exp rience avec les mots qui sont g n ralement acquis entre d
69. k of Difference 1 1600 1490 1105 5 2 1850 1300 550 6 6 3 1300 1400 100 4 4 4 1500 1410 90 3 3 5 1400 1350 50 2 2 6 1010 1000 10 1 1 For present example W 13 is not extreme enough to reject null hypothesis As with other parametric methods p values for the Wilcoxon Signed Rank Test are discrete in nature En reprenant les donn es des auteurs nous trouvons le r sultat suivant rank rank Wilcoxon ra 110 5 Np 6 6 Mx 1443 33 4 My 1325 3 P 17 2 P 4 1 PO 0 T the 105 varT 22 75 e 1 363 p NS critical value 0 critical value 0 TABLEAU VI test de Wilcoxon For large number of individuals however distribution of W values approximate a normal distribution with mean my 0 and variance 1 Fa On 2 1 22 1 13 From which test statistic ew can be computed as n x 1 r Ep Ey e n n nt 2n41 24 14 which can be compared with t distribution with infinite degrees of freedom d f Ties among the absolute differences are handled by assigning average ranks A tie a pair creates a difference of zero Because these are neither positive or negative we drop such pairs from our sample As in the case of the Wilcoxon rank sum ties complicate funding a value There is no longer a usable exact distribution for the signed rank statistic and the standard deviation must be adjusted for the ties before we can use the normal approximation a exemple 1 http www s
70. lades dans le groupe 5 autres dans le groupe B et 4 autres dans le groupe C sample size count rank average le Re i Q 5 656 Q corm 585915 gt ps ip 005 test de kruskal Wallis Ce tableau donne a voir le classement en rangs et plus bas les r sultats On voit que la valeur de Q 5 859 corrig e pour les ex aequo et significative a 5 puisque la valeur correspondante dans la table est de 5 643 au risque 5 Elle est par contre inf rieure a celle relative au risque 1 7 791 Toutefois le manque de puissance ne permet pas lorsqu on recherche une diff rence entre rangs moyens de relever une quelconque diff rence Mise en oeuvre du test Eu tes en VAT 100 i d tabels of the data Input Range select Output Range sel ll suffit de remplir les 3 blocs de saisie les tiquettes sont saisir dans la premi re ligne 7 le test de Wald Wolfowitz E ne figure pas dans l Analysis Tool Pack d Excel Ce test sert a contr ler une s quence L exemple suivant est emprunt Cohen L amp M Holliday 1983 Statistics for Social Scientists Harper amp Row Voici un exemple pour deux chantillons tir s de l ouvrage remarquable Introduction la d cision statistique Fiches aide m moire ouvrage collectif 1997 Il s agit en fait de bien plus que des fiches aide m moire L ouvrage peut tre consult sur le suite suivant http
71. lement diff rente de celle de Yates comparison of some continuity corrections for the chi squared test on 2 x 2 tables Journal of the American Statistical Association vol 75 pp 510 515 Voici a present un exemple d emploi d un test exact de Fisher Soit le tableau a 4 cases aN gt oOo wW On consid re une table de contingence 2 x 2 On note A et B les deux variables qualitatives observ es sur n individus Lorsque les effectifs sont trop petits on transforme l inconv nient des chantillons de petite taille en b n fice en num rant l ensemble des arrangements possibles des observations puis en calculant les probabilit s exactes de chaque arrangement D Chessel A B Dufour amp J Thioulouse Biom trie et Biologie Evolutive Universit Lyon1 Dans le cas pr sent imaginons que l on administre un m dicament deux groupes de malades A et B dans le premier groupe on obtient 20 succ s et 0 dans le groupe B On ne peut pas appliquer le test du chi2 m me en employant la correction de Yates car l un des effectifs th oriques est trop petit pour la valeur 0 2 13 L hypoth se Ho s nonce comme A et B sont ind pendantes L hypoth se alternative H A et B sont li es Voici la marche suivre pour les calculs a on d termine la quantit suivante a b c d a c b d nia b ic d 3 ou dans l exemple choisi a 20 b 0 c 5etd 6 n 31 b on calcule ensuite les pr
72. m of variables is such that it can be reasonably supposed to have arisen from random sampling Philosophical Magazine Series 5 50 157 175 Daniel W W 1990 Applied Nonparametric Statistics Boston PWS Kent pp 306 316 textbook treatment applied Gibbons J D and Chakraborti S 1992 Nonparametric Statistical Inference New York Marcel Dekker pp 95 103 textbook treatment theory 4 Shapiro Wilk test of normality Shapiro S S and Wilk M B 1965 An analysis of variance test for normality complete samples Biometrika 52 591 611 Conover W J 1980 Practical Nonparametric Statistics second edition New York John Wiley amp Sons Inc pp 363 367 for text pp 466 470 for Tables A17 A19 coefficients and null and approximate distributions 5 Ryan Joiner version of the Shapiro Wilk test Minitab s normplot macro Ryan T A and Joiner B L 1976 Normal Probability Plots and Tests for Normality Technical Report Minitab Inc State College PA 6 Stephens modification of the K S test Stephens M A 1974 EDF Statistics for Goodness of Fit and Some Comparisons Journal of the American Statistical Association 69 730 737 7 Boos test of symmetry Boos D D 1982 A Test for Asymmetry Associated with the Hodges Lehmann Estimator Journal of the American Statistical Association 77 647 651 8 ELR test of symmetry Eubank R L LaRiccia V N and Rosenstein
73. mberto Soliani laissons s exprimer l auteur ESEMPIO 1 PER GRANDI CAMPIONI Lungo il corso d acqua che attraversa una citt sono state collocate 6 stazioni A B C D E F di rilevazione dell inquinamento In ognuna delle 6 stazioni per 15 giorni stata fatta una misura del carico inquinante I valori campionati classificati per stazione e per giorno di rilevazione sono riportati nella tabella a due entrate sottostante capu18 pdf p 1486 A BCD EF 20 18 24 22 29 38 32 37 34 31 39 38 18 23 19 25 23 26 9 7 14 11 12 11 29 37 32 59 40 45 38 25 27 47 45 45 8 15 7 12 15 13 18 13 22 26 23 22 32 36 37 35 48 40 10 23 25 26 25 32 56 11 6 8 12 9 10 10 12 24 18 20 27 25 27 13 13 18 14 14 19 26 14 18 26 19 19 29 32 15 14 12 25 56 54 75 SAANIA NB WN tape 1 Nous devons d abord ranger s par ment ces observations comme pour le test de Friedman 123 4 5 6 7 8 9 10 11 12 13 14 15 total R A 22 12 1 3 2 2 1 1 1 3 1 1 2 25 B 1 4 35 1 3 1 55 1 3 25 2 1 4 4 1 37 5 C 43 262 2 135 4 4 6 2 2 5 25 3 47 5 D 3 1 5 35 663 6225 3 55 25 2 5 5 56 5 E 5 6 35 5 4 45 55 5 6 5 45 4 5 5 4 72 F 6 5 6 35 5 45 4 35 5 6 45 55 6 6 6 76 5 tape 2 Calculer la moyenne l cart type O et la statistique Z ji N k k 1 moyenne 4 37 icip 1102 5 on rappelle que N 15 et k 5 cart type 38 ici 30 311 m _12 L 3 N k k 1 k 1 i MED AN Et enfin ai 2 x 39 avec Z 6 103 so
74. mentation pratiqu e en 1975 Lehman a enregistr le potentiel cutan en millivolts chez 8 sujets qui par ailleurs taient interrog s sur la coloration psychique crainte joie tristesse et joie sous hypnose site consult http www id unizh ch software unix statmath sas sasdoc stat chap28 sect41 htm Voici le tableau des observations fear joy sadness calmness 23 1 22 7 22 5 22 6 57 6 532 53 7 53 1 10 5 9 7 10 8 8 3 23 6 19 6 21 1 21 6 11 9 13 8 13 7 13 3 54 6 47 1 39 2 37 21 13 6 13 7 14 8 20 3 23 6 16 3 14 8 ONOaARWN Comme on peut le voir sur le tableau XV le r sultat n est pas significatif Friedman s Test N 32 N t 8 k b 4 SRj2 1686 Fr 8 21 2 57 p 0 08129 critical value 5 7 5 ties no corr forties 1 T 6 45 p 0 09166 i ao k eb disadness So OR nf SA Vii calmness 772 S EARR PE NO a Saas EN EEE esis oy ph E critical ve value MEE SEE tes L na at nee RS Dane con fortes E 0 Jsdo araea Eija Po 6777 jcolmness 1312164 1 6 21 64 sae OESE SARS 1017 OR Sere etn Some oUt SOMO Satie TABLEAU XV statistique de Friedman Le tableau XV peut tre lu en trois sous ensembles a gauche les r sultats proprement dits p 0 09 donc NS mais il peut tre utile de donner la valeur au lieu du NS classique On peut lire N nombre total 32 t nombre de traitements ici 8 encore appel N b nombre de blocs ici 4 fear
75. ng linear models Technometrics 19 275 284 Hettmansperger T P 1984 Statistical Inference Based on Ranks New York John Wiley amp Sons Inc Chapter 5 Hettmansperger T P and McKean J W 1998 Robust NonparametricStatistical Methods London Arnold c liens sur internet Ils sont bien s r tr s nombreux mais j ai pu en s lectionner quelques uns qui ont le m rite de proposer soit l int gralit des tests th orie et m thode soit des exemples soit les deux La plupart des articles ou des cours sont au format pdf Acrobat Reader ou au format ps Ghostscript n cessitant l application Ghostscript et surtout le viewer Ghostview Voici mes choix Te http www unesco org webworld idams advguide Chapt4_2_files fileli st xml 2 Statistique et probabilit A Bar Hen d apres J Roussel Universit Aix Marseille Il donne entre autre de nombreuses tables 3 m thodes statistiques pour l ing nieur Olivier Gaudouin ENSIMAG 2ame ann e INP Grenoble 4 maitrises STAPS de l Universit Antilles Guyane Michel Le Her 5 Centre d Enseignants et de Recherche de Statistique Appliqu e 1986 Aide m moire pratique des techniques statistiques pour ing nieurs et techniciens sup rieurs Ceresta 6 Tests statistiques note p dagogique Christophe Benavent Pr a l IAE de Lille 7 DEA Analyse et Mod lisation des Systemes Biologiques Introduction au logiciel S PLUS D Chessel 8 Use of statistical pr
76. nnes de donn es De substantielles am liorations ont t apport es dans la pr sentation des r sultats des tests de Mann Whitney Wilcoxon les deux sont li s intrins quement et de kruskal Wallis Consultez aussi le superbe site Disciplus simplex o l on peut trouver de tr s nombreuses pages sur Excel Et des meilleures Cet algorithme peut servir pour de nombreux exemples o le calcul des rangs est n cessaire Je rappelle que ces pages sur les statistiques n ont de vertu que didactique et qu elles sont propos es titre d illustration et de m me que les programmes macro qui y sont annex es pour faire valoir les vertus du raisonnement par analogie Elles tachent d illustrer ce que l on peut r aliser tout en ne comprenant rien aux math matiques pourvu que l on ait un peu de bonne volont et de l obstination En d finitive le Mail que m a envoy M Delaruelle m a conduit repogrammer enti rement les tests non param triques et faire de multiples addenda et errata Au fil de l expos je commente le contenu de nombreux sites web sur les tests non param triques en donnant bien s r toutes les sources car j en tire des quations et des exemples Je dois faire une mention sp ciale pour un site unique o l on trouve des tables ailleurs parfaitement introuvables http www dsa unipr it soliani soliani html Il s agit de l ensemble de cours en ligne le plus complet qui se puisse trouver sur le web du moins
77. nt de deux populations pouvant tre diff rentes Contrairement au test de Mann Whitney ou au test de Wilcoxon dont l objet est de d tecter des diff rences entre deux moyennes ou m dianes le test de Kolmogorov Smirnov a l avantage de prendre en consid ration les fonctions de r partitions dans leur ensemble Mais le test de Kolmogorov Smirnov peut aussi tre utilis comme test d ad quation Dans ce cas on est en pr sence d un seul chantillon al atoire tir d une population sa fonction de r partition sera compar e une fonction de r partition sp cifique et connue par exemple celle de la loi normale celle de la loi uniforme ou encore celle de la loi de chi carr Michel Le Her On pourra lire une documentation tr s pr cise compl te et pratique sur l emploi des tests non param triques et leur degr de pertinence compar s des tests param triques sur le site Cours de DEUG Probabilit s et Statistiques Avner Ba Hen Aix Marseille III l Principaux tests non param triques 1 le chi2 La 1 m thode est le test du chi2 l inconv nient de ce test consiste en une perte d informations par la transformation d une variable quantitative en variable qualitative Il est donc d conseiller dans les cas o l on peut utiliser une variable quantitative Ce test est disponible en standard dans EXCEL Voici un exemple TABLEAU chi2 Sur cet exemple on voit 2 colonnes la 1 repr
78. o alternative unilat rale m2 gt mo contre H M lt Mo alternative unilat rale Ce test ne peut pas s utiliser avec de petits chantillons lorsque n lt 6 car l on ne peut alors d gager de r gion de rejet dont la probabilit soit inf rieure a 5 Le test consiste a faire la somme des observations sup rieures a Mo not e alors S et des autres observations not es S Sous l hypoth se nulle Ho il est intuitif que S et S soient proches de n 2 D s lors la m thode consiste observer partir de quelle valeur forc ment proche de 0 on met en vidence pour S et ou S une diff rence significative Les valeurs critiques de S et S S sont tabul es sur la table de probabilit s conditionnelles cumul es jusqu aux valeurs Smin 10 et n 20 A partir de n 20 on peut employer la formule suivante donnant Z Voici un exemple qui tire parti la fois du test T de Wilcoxon rang et signe et du test du signe il est extrait de Biostatistics for Fellows 2001 Overview of Nonparametric Statistical Tests 2 0 Residents are rated on their ability to insert CVCs in the ICU prior to and after an intensive one month ICU rotation with a critical team The scale ranges from 1 dangerous to 10 highly proficient ranking before 35612437544 ranking after 67668596677 Wilcoxon rank test Np 10 Mx 4 My 6 64 P 2 P 53 PO 1 Tthe 27 5 varT 96 25 e 2 599 p p lt 0 01 ties 8 critical
79. obabilit s des tables de contingence pr sentant des situations aussi extr mes que celle observ e pj avec j 1 m Voyons cela sur notre exemple Possible matrices and their Ps p for 0 20 0 5 6 0 00062748 p for 1 19 1 6 5 0 01254956 p for 2 18 2 7 4 0 0851577 p for 3 17 3 8 3 0 25547311 p for 4 16 4 9 2 0 36192025 pfor 5 15 5 10 1 0 23162896 p for 6 14 6 11 0 0 05264294 ll est intuitif de consid rer qu il existe 6 possibilit s avec des probabilit s s cartant plus ou moins de notre disposition qui est celle correspondant p for 0 0 00062748 On remarque que l on a fait varier la valeur du plus petit l ment de la matrice de 0 6 Tous les choix possibles sont couverts puisque Ptotar 1 c il reste interpr ter ces probabilit s Trois possibilit s se pr sentent celle qui correspond la probabilit unilat rale dite gauche celle qui correspond la probabilit bilat rale et enfin celle de droite la probabilit unilat rale est celle o l effectif minimal de la matrice 2x2 varie de sa valeur a 0 la probabilit bilat rale regroupe la p pr c dente laquelle s ajoute la ou les valeurs situ es droite qui sont imm diatement inf rieures la valeur maximale de la probabilit unilat rale enfin la probabilit droite regroupe les autres valeurs Dans le cas pr sent le r sultat du test exact de Fisher est le suivant
80. ograms for nonparametric tests of small samples often leads to incorrect P values examples from Animal Behaviour ROGER MUNDRY amp JULIA FISCHER Institut fiir Verhaltensbiologie Freie Universitat Berlin ANIMAL BEHAVIOUR 1998 56 256 259 9 Simplified Procedure for Implementing Nonparametric Tests in Excel Robert J Pavur University of North Texas and Kellie B Keeling Virginia Tech RICK HESSE Feature Editor Graziadio Graduate School of Business and Management Pepperdine University 10 BASIC NON PARAMETRIC STATISTICAL TOOLS prepared for GCMA 200 Peter M Quesada Gregory S Rash Examples presented in these notes were obtained from Primer of Biostatistics by Stanton S Glantz McGraw Hill Text ISBN 0070242682 11 Nonparametric tests from Minitab data 12 Use of Durbin Watson Test Statistic exact P values Gould 13 The Econometric Journal of line Econometric Software Links Econometrics Journal 14 EViews 4 0 User s Guide 15 Linear Regression Analysis Pr Roy Batchelor City University Business School London ESCP Paris 16 Arthur Charpentier cours de s rie temporelle DESS Math matiques de la d cision et DESS Actuariat 17 http wsupsy psy twsu edu charlie nonparametric_tests htm 18 Guide to Advanced Data Analysis using IDAMS Software P S NAGPAUL New Delhi India 19 http Awww dsa unipr it soliani soliani html Cf supra MANUALE DI STATISTICA PER LA RICERCA E LA PROFESSIONE STATISTI
81. ond to the rows of the table The primary interest in constructing contingency tables is usually to determine whether there is any association in terms of statistical dependence between the two categorical variables whose counts are displayed in the table A measure of the global association between the two categorical variables is the Chi square statistic which is computed as follows Consider a contingency table with k rows and h columns Let nijj denote the cross frequency of cell i j Let Hi denote the expected frequency of the cell The deviation between the observed and expected frequencies characterizes the disagreement between the observation and the hypothesis of independence The expected frequency for any cell can be calculated by the following formula Hi RTX CT N where 3 expected frequency in a given cell i j RT row total for the row containing that cell CT column total for the column containing that cell N total number of observations All the deviations can be studied by computing the quantity denoted by Soy ig a y iii n 7 2 This statistic is distributed according to Pearson s Chi square law with k 1 x h 1 degrees of freedom Thus the statistical significance of the relationship between two categorical variables is tested by using the test which essentially finds out whether the observed frequencies in a distribution differ significantly from the frequencies which might be expe
82. ont ordinales et discontinues ou encore dans les cas o les distributions des deux variables sont dites non normales En somme Le tau de Kendall est un autre indicateur du caractere ventuellement significatif de la relation qui existe entre deux classements Mais il poss de un caract re singulier il mesure la corr lation d observations appari es ce qui le rend d une certaine fa on semblable au test T de Wilcoxon La marche suivre pour d terminer le t de Kendall est sensiblement la m me que lorsqu on classe les observations en rang s par ment pour chaque colonne On range ainsi les colonnes X et Y Dans un second temps on arrange le vecteur X par valeurs croissantes sur Excel il faut employer la commande TRIER et indiquer une seule clef de tri en sorte que les valeurs du vecteur Y soient r arrrang ses en fonction de celles du vecteur X Puis pour tout couple d items dont l ordre dans le premier classement est concordant avec celui du second on attribue un score de 1 dans le cas de discordance on attribue un score de 1 S est la somme de ces scores sur l ensemble des n n 1 2 comparaisons possibles Le coefficient de corr lation de rangs de Kendall est d fini par Voyons cela sur un premier exemple tir du site http www cohort com index html Data for the sample run is from Sokal and Rohlf Box 15 6 1981 or Box 15 7 1995 Computation of rank correlation coefficient between the total
83. os fondamental Presses Universit Laval Dunod 357 pp 2 SIEGEL Sidney 1956 Non parametric statistics for the behavioral sciences McGraw Hill 312 pp 3 SPRENT P 1992 Pratique des statistiques non parm triques INRA Editions 4 Kruskal W H and Wallis W A 1952 Use of ranks in one criterion variance analysis Jour Am Stat Assoc 47 583 634 5 Kruskal W H and Wallis W A 1952 Errata to Use of ranks in one criterion variance analysis Jour Am Stat Assoc 48 907 911 6 Wallace D L 1959 Simplified beta approximations to the Kruskal Wallis H test Jour Am Stat Assoc 54 225 230 7 Griffiths D 1980 A Pragmatic Approach to Spearman s Rank Correlation Coefficient Teaching Statistics 2 pp 10713 8 Kruskal W 1958 Ordinal Measures of Association Journal of the American Statistical Association 53 pp 8147861 9 Leach C 1979 Introduction to Statistics A Nonparametric Approach for the Social Sciences Wiley 10 Wilkie D 1980 Pictorial Representation of Kendall s Rank Correlation Coefficient Teaching Statistics 2 pp 76 78 11 S Siegel and N J Castellan Nonparametric Statistics 2nd ed 1988 12 Moses L E 1952 A two sample test Psychometrika 17 234 247 13 Moses L E 1963 Rank tests of dispersion Annals of Mathematical Statistics 34 973 14 Dineen L C and Blakesley B C 1973 Algorithm AS 62 Generator for the sampling distribution of the Mann
84. ould still be used and the formula needs to be modified accordingly With the exception of the above mentioned condition that O E should be smaller than E for the Chi squared test to be valid there is not much difference between the two tests and they should result in the same conclusion When they give different results the G test may be more meaningful The G test has been gaining popularity in HLA and disease association studies kitz W Aldrich CL Fildes N Horning SJ Begovich AB Localization of predisposition to Hodgkin disease in the HLA class Il region American Journal of Human Genetics54 497 505 1994 Taylor GM Gokhale DA Crowther D et al Further investigation of the role of HLA DPB1 in adult Hodgkin s disease HD suggests an influence on susceptibility to different HD subtypes British Journal of Cancer 1999 80 1405 1411 J C est comme d habitude dans les pages de http www dsa unipr it soliani soliani html caput3 pdf que nous trouverons des informations beaucoup plus d taill es sur le G Test L attention des statisticiens sur ce test date de la fin des ann es 70 K Larntz Small sample comparisons of exact levels for chi squared goodness of fit statistics Journal of the American Statistical Association vol 73 pp 253 263 D A Williams Improved likelihood ratio test for complete contigency tables Biometrika vol 63 pp 33 37 Ces auteurs montraient que le test G tait plus robuste que l
85. paration 2 17171411109753210 critical value 5 Ticaical wod 220098627 mn TABLEAU IX effets de pr parations de virus sur des plants de tabad Le test t montre une diff rence significative avec p 0 037 Par contre le test T de Wilcoxon permet de conclure avec plus de certitude a la pr sence d une diff rence significative d exemple 4 http www euronet nl users warnar demostatistiek stat kruistabellen h tm L encore nous laisserons parler l auteur Tekentoets en Wilcoxon Signed Rank toets De tekentoets en de W S R toets zijn te gebruiken indien men beschikt over 2 variabelen of testgroepen met alstestvoorwaarden gemeten op zelfde meetschaal en in dezelfde meeteenheid tenminste ordinaal en waarvan de scores gematcht gepaard of gekoppeld zijn Telkens wordt van 1 respondent onder verschillende omstandigheden een meting verricht en het verschil tussen deze metingen bepaald Het parametrisch alternatief voor deze testen is de Student TD test Paired Two Sample T test Testprincipes Hieronder volgt een eenvoudig rekenvoorbeeld voor beide testen op basis van gegevens uit bestand polsfrequentie zie hieronder twee polsfrequentie A voormeting B nameting Het principe is om uit de 2 getallenreeksen n verschilreeks te bepalenop de score paren A B Verschillen met waarde 0 tellen bij deze toetsen niet mee Bij de Tekentoets gebruikt men bij de berekening alleen de tekens Bij de Wilco
86. pp 103 111 textbook treatment Tests for the One Way Layout k sample problem Bartlett s test of homogeneity of variance Bartlett M S 1937 Properties of sufficiency and statistical tests Proceedings of the Royal Society A160 268 282 Levene s test of homogeneity of variance Levene H 1960 Robust tests for equality of variances in Contributions to Probability and Statistics Palo Alto CA Stanford University Press pp 278 292 Neter J Kutner M H Nachtsheim C J and Wasserman W 1996 Applied Linear Statistical Models Chicago Irwin pp 766 768 textbook treatment Welch ANOVA for unequal variances Welch B L 1951 On the comparison of several mean values an alternative approach Biometrika 38 330 336 Kruskal Wallis test Kruskal W H and Wallis W A 1952 Use of ranks in One criterion variance analysis Journal of the American Statistical Association 47 583 621 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 114 119 textbook treatment Kraft C H and van Eeden C 1968 A Nonparametric Introduction to Statistics New York Macmillan pp 238 262 for Table F null distribution Multiple comparisons in the one way layout Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 124 132 textbook treatment of
87. pr sent Tk 1 pour la variable Y X2 La correction comme on voit est minime sur cet exemple Le r sultat est significatif puisque p 0 01 Ici n 15 et S 52 on peut donc employer l approximation suivante a 2 2n 5 V onn 1 49 qui suit une loi normale Si n lt 13 et S lt 50 il faut disposer d une table sp ciale Elle est int gr e au logiciel et consultable comme les autres A noter que je n ai pu r ussir la trouver sur le Net malgr des recherches approfondies J ai donc pris cette table dans le Tomassone r f renc infra Nous allons pr senter un autre exemple tir du site http cons dev univ lyon1 fr Enseignemenvt Stat stat7 st7 html notez que cette page n est plus disponible qu en cache sur Google z La relation entre l autoritarisme des tudiants et leur conformisme social est recherch L autoritarisme des sujets et leur conformisme social sont appr ci s par le passage de tests Spearman rank order correlation N 24 Np 12 Mx 97 My 62 33 Sd 0 Sd2 52 df 10 r 0 818 t 4 497 p 0 00115 Z 0 00333 ties no r corr t corr p corr Kendall s Tau n 12 S 44 tau 0 6667 Tk forties X 0 Y 0 tau corr forties 0 6667 p 0 0026 pcorr 0 0026 critical value tau n lt 13 0 001 Notez que la valeur critique s entend au seuil unilat ral alors que nous avons calcul la valeur de p en formulation bilat rale On peut aussi d terminer un coefficien
88. quelles sont la les variable s qui est sont diff rente s de s l autre autres On obtient le tableau suivant partir de 5 observations pour chaque variable jranksum TABLEAU XI test de kruskal Wallis On observe que les 3 s ries d observation sont diff rentes dans l ensemble avec p 0 013 Cela autorise a titre indicatif seulement a voir quelles sont les s ries qui diff rent l une de l autre ici on trouve que la s rie 1 diff re de la s rie 2 et que la s rie 1 diff re de la s rie 3 sur le tableau du bas en revanche la s rie 2 ne diff re pas de la s rie 3 sur le tableau du bas Les rangs de chaque colonne sont indiqu s dans le tableau de droite au dessous moyennes somme des rangs etc Prise en compte des ex aequo Dans le tableau du bas valeurs des moyennes compar es et valeur de la limite partir de laquelle la diff rence est significative ici 6 77 Voici la marche suivre pour les calculs on range les observations comme dans le test de Mann Whitney Wilcoxon ne pas confondre avec le signed rang T of Wilcoxon en tenant compte des ex aequo on calcule les scores moyens pour chaque colonne n 16 o Rji est le rang de l observation i du groupe j nj en tant l effectif on compare Rj avec la somme th orique Rr N i wat LL Ie T N 2 17 o N est le nombre total d observations On nomme D la somme de carr s pond r e D n R
89. quivalents le Mann Whitney et le test de Wilcoxon il n a rien voir avec le test T de Wilcoxon pour s ries appari es Dans le tableau de droite sont regroup s les rangs notez qu il est inutile de ranger pr alablement les observations lorsque vous saisissez le tableau des deux colonnes a traiter Des tables sp ciales existent qu il faut employer d s que nx ou ny sont inf rieurs 10 Elles sont int gr es dans la feuille macro Les valeurs limites sont indiqu es pour les risques a 5 et a 1 ici 18 et 12 Summary for the Mann Whitney Wilcoxon rank sum test Based on ranking of all observations without regard to group associated with each observation Can also be used with interval or ratio data that are not normally distributed Test statistic T is sum of all ranks for the smaller group T R i j where R is the rank of the i th observation of the smaller group and ng is the number of observations in the smaller group To determine T must first rank all observations from both groups together Tied ranks receive average of ranks that would have been spanned e g if 3 observations are tied following rank 4 then each of the tied observations would receive the average of ranks 5 6 and 7 or 5 6 7 2 6 the next observation would receive rank 8 Critical values of T are based on the tails of the distribution of all possible T values assuming no ties When the larger sample contains eight or more observations
90. r el Par inf rieure on entend en France strictement inf rieur alors que dans les pays anglo saxons on entend inf rieure ou gale Dans ce qui suit donc si F est la fonction de r partition pour tout x de R I image F x est I effectif de la sous population form e par les individus dont la valeur est strictement inf rieure x La repr sentation graphique diagramme int gral est alors un escalier chaque marche tant ouverte gauche et ferm e droite la premi re tant de longueur infinie de co x et la derni re de longueur infinie dex 00 calculer la diff rence en valeur absolue de la quantit n1 72 D sup F Gn x 43 Fn1 x symbolise le vecteur de fr quences cumul es de la variable x ici le traitement et Gn2 y le vecteur de la variable y ici le placebo On d termine la position de la diff rence maximale en valeur absolue des deux vecteurs on rel ve sur une table appropri e la valeur critique de Dni n2 ici dans une table pour deux chantillons Exemple dans le cas pr sent On voit ici que Dain2 0 403 On remarque videmment que ce tableau est pour le moins r barbatif on peut pallier cette aust rit en mettant en oeuvre un graphique appropri Ce graphique n est autre que celui qui illustre la fonction de r partition empirique associ e a un chantillon x Xn Cette fonction est d finie par F R 0 1
91. r a 5 sinon on proc de des regroupements ou l on utilise le test de Kolmogorov Smirnov et aucune case o l effectif th orique est gal 1 Mode d emploi il suffit de s lectionner l outil contingency table La bo te de dialogue suivante appara t Vous devez saisir obligatoirement une zone d entr e input data ayant une taille minimale de 2 x 2 cases et la cellule de sortie output data Si vous souhaitez forcer le test exact de Fisher il suffit d activer la case cocher correspondante Vous pouvez aussi modifier la valeur th orique minimale en de de laquelle le test exact de Fisher est automatiquement calcul vous ne pouvez aller au dessous de 3 Le test de Fisher sera calcul automatiquement si l une des valeurs th oriques est en de de la valeur minimale choisie 2bis Le test G ou Log Likelihood ratio TestE ne figure pas dans l Analysis Tool Pack d Excel Il s agit d une alternative int ressante au habituel en ceci qu il est plus robuste En effet d s que l on d passe 3 4 modalit s diff rentes pour une variable le X est souvent significatif et l on tire d s lors des conclusions h tives voire fautives Il a t difficile de trouver de la bibliographie en frangais sur ce test On trouve en anglais dans le glossaire du site http www openlink org dorak Common concepts in Statistics M Tevfik Dorak B A Hons M D Ph D ces lignes sur le G Test
92. re au seuil critique 1 0 49 La colonne de gauche Fn vin repr sente la fr quence th orique et F vin la fr quence observ e Dans la colonne de droite d la valeur maximale est 0 5 point 3 ce qu illustre la figure suivante KS Test Comparison Cumulative Fraction Plot D max 3 0 5 CUMULATIVE FRACTION 1 2 3 4 5 x FIGURE IV fonction de r partition empirique c un dernier exemple Il est tir du site http www physics csbsju edu stats KS test n plot form html Two near by apple trees are in bloom in an otherwise empty field One is a Whitney Crab the other is a Redwell Do bees prefer one tree to the other We collect data by using a stop watch to time how long a bee stays near a particular tree We begin to time when the bee touches the tree we stop timing when the bee is more than a meter from the tree As a result all our times are at least 1 second long it takes a touch and go bee that long to get one meter from the tree We wanted to time exactly the same number of bees for each tree but it started to rain Unequal dataset size is not a problem for the KS test Voici comment se pr sentent les donn es brutes redwell 23 4 30 9 18 8 23 0 21 4 1 24 6 23 8 24 1 18 7 16 3 20 3 14 9 35 4 21 6 21 2 21 0 15 0 15 6 24 0 34 6 40 9 30 7 24 5 16 6 1 21 7 1 23 6 1 25 7 19 3 46 9 23 3 21 8 33 3 24 9 24 4 1 19 8 17 2 21 5 25 5 23 3 18 6 22 0 29 8
93. reatment values are larger than the control values for the same cumulative fraction For example the median cumulative fraction 5 for the control is clearly less than one whereas the median for the treatment is more than 1 The KS test uses the maximum vertical deviation between the two curves as the statistic D In this case the maximum deviation occurs near x 1 and has D 45 The fraction of the treatment group that is less then one is 0 2 4 out of the 20 values the fraction of the treatment group that is less than one is 0 65 13 out of the 20 values Thus the maximum difference in cumulative fraction is D 45 KS Test Comparison Cumulative Fraction Plot 1 772 09 ee ee ee eae ee 6 08 G 07 ne Fai RTH gt BP Gn2 placebo E 04 S03 2 gt D max 1 0 45 Oo FIGURE III fonction de r partition empirique b cas d un chantillon exemple 1 nous le tirons de l ouvrage de Tomassone cf ref Il s agit d un test de d gustation de vin dans des verres plus ou moins fonc s Voici les donn es de base et voici les r sultats ee S S Aolmogorov Smirnov for one Samp iDk 0 5 TABLEAU XVIII Et les auteurs d crire nous pouvons conclure que la couleur du verre a une influence sur la sensation gustative Ce qui fait mentir le vieux dicton qu importe le flacon pourvu qu on ait l ivresse En effet on trouve Dk 0 5 valeur sup rieu
94. roupe i Si le test de Friedman conclut un r sultat globalement significatif on peut tester la signification de comparaisons choisies en tudiant les diff rences entre les sommes ou moyennes de rangs des traitements On juge significatives des diff rences de sommes de rangs sup rieures la plus petite diff rence significative donn es par LSD ox baja V0 1 6 OU LSD ank Ri R Notez que Tomassone dans son Biom trie rapporte le calcul de la difference des rangs la loi Normale alors que l auteur la rapporte une loi de Student Fisher On a alors ov I l 1 avec I nombre de colonnes 32 9bis le test de Page Il est cong n re du test de Jonkheere Terpstra ceci pr s qu on l emploie dans le cas d chantillons d pendants au lieu que la statistique de Jonkheere est employer pour des chantillons ind pendants o l on souhaite observer s il existe une structure Exemple on ajoute un additif un produit alimentaire ou bien encore on ajoute un excipient un m dicament en sorte d am liorer le go t d une forme orale saveur particuli rement d sagr able surtout chez l enfant On souhaite appr cier l effet de cette dose sur le jugement C est dans ces cas que la statistique de Page est conseill e L encore nous allons donner quelques extraits d une page r dig e en italien tir e de http www dsa unipr it soliani soliani html Il test detto anche per l
95. s ici p for 1 p for 2 p for 3 1 1 0486E 06 7 2353E 05 0 00159176 0 99833483 Voici le r sultat tel qu il apparait dans la feuille de calcul d Excel Fisher s exact test table 20 3 5 6 one tailed p 0 01726445 two tailed p 0 03284444 other 0 99833483 theor value of chi2 lt 3 2 91 for 3 Voici un dernier exemple que nous empruntons au site http mathworld wolfram com topics StatisticalTests html For an example application of the 2 x 2 test let X be a Journal say either Mathematics Magazine or Science and let Y be the number of articles on the topics of mathematics and biology appearing in a given issue of one of these journals If Mathematics Magazine has five articles on math and one on biology and Science has none on math and four on biology then the relevant matrix would be Math Mag Science math 5 0 R 5 biology l 4 R 5 C1 6 C2 4 N 10 The sum of P values less than or equal to Peutogg 0 0238 is then 0 0476 which because it is less than 0 05 is significant Therefore in this case there would be a Statistically significant association between the journal and type of article appearing Author Eric W Weisstein 1999 CRC Press LLC 1999 2003 Wolfram Research Inc Ce qui donne avec Excel Possible matrices and their Ps p for 0 5 0 1 4 0 02380952 p for 1 4 1 2 3 0 23809524 p for 2 3 2 3 2 0 47619048 p for 3 2 3 4 1 0 23809524 p
96. s cumul es pour le test des signes Sign Test table du test des s ries de Wald Wolfowitz run test d apr s Frieda S Swed C Eisenhart Tables for testing randomness of grouping in a sequence of alternatives Annals of Mathematical Statistics 14 1943 66 87 table des valeurs critiques du test de Jonckheere Terpstra source cit e supra table des valeurs critiques du test de Page in http www dsa unipr it soliani table des valeurs critiques du coefficient de concordance de Kendall W idem Ces tables donnent automatiquement les valeurs critiques dans les tableaux des r sultats mais peuvent aussi tre appel es sous forme de fichiers copi s dans une feuille d Excel A Suivre
97. s liant les r sidus successifs dans le cadre des s ries chronologiques l existence d un changement de structure au choix d une sp cification inadapt e l omission d une variable explicative importante les variables explicatives sont les vecteurs X on les nomme aussi les r gresseurs Notons qu il existe un rapport entre le coefficient de corr lation et la statistique de Durbin et Watson e DW 0sir 1 coefficient de corr lation e DW 2sir 0 e DW 4sir 1 Le test de Durbin Watson fait partie de l ensemble des tests qui figurent dans l analyse d une r gression lin aire Voici un exemple Sample 1951 1994 Included observations 44 Variable Coefficient Std Error t Statistic Prob C 66 02855 7 314568 9 026992 0 0000 PC 1 669736 0 573248 3 261654 0 0022 R squared 0 202103 Mean dependent var 43 37500 Adjusted R squared 0 183106 S D dependent var 16 683854 S E of regression 15 21904 Akaike info criterion 8 327361 Sum squared resid 9728 008 Schwarz criterion 8 408460 Log likelihood 181 2019 F statistic 10 63839 Durbin Watson stat FIGURE VIII un exemple de r sum d analyse de r gression lin air Ce test permet comme d autres de mesurer l importance des r sidus et de v rifier comme tel les hypoth se de la r gression lin arit normalit ind pendance variance constante homosc dasticit Comme esp rance des r sidus est nulle on peut crire n 2 4 f
98. s ne permet pas de mettre en vidence de diff rence significative Kruskal Wallis sample size 38 count 10 8 11 9 average 45 51 67 74 rank sum 138 137 240 226 rank average 13 8 17 13 21 82 25 11 ties 4 Q 5 769 Q corr 5 77 p NS et que l ANOVA param trique ne permet pas de mettre en vidence de diff rence entre les doses ANOVA Source of Variation SS df MS F P value F crit Between Groups 5113 23074 3 1704 41025 2 02313695 0 12911837 2 88260082 Within Groups 28643 6114 34 842 459158 Total 33756 8421 37 L ANOVA a t calcul e en utilisant l Analysis Tool Pack d Excel La mise en oeuvre du test est semblable aux autres partir de la bo te de dialogue g n rale on appelle la bo te suivante Input Range select at least 2 columns Output Rar ll Autres tests statistiques 1 test de Durbin Watson E ne figure pas dans I Analysis Tool Pack d Excel alors qu un utilitaire de r gression est pr sent Si les r sidus ob issent un bruit blanc il ne doit pas exister d autocorr lation dans une s rie On peut alors utiliser entre autre le test de Durbin Watson test de autocorr lation d ordre 1 La statistique de Durbin et Watson est une valeur appartenant a l intervalle 0 4 Elle est dite normale si elle avoisinne la valeur 2 La valeur DW du test de Durbin et Watson peut tre anormalement faible ou forte ce qui peut tre l effet de causes diverses un processu
99. s une exp rience on souhaite v rifier que l apport d une substance x 5 doses r guli rement espac es entra ne un jugement de plus en plus mauvaix sur la qualit du produit L hypoth se tester est donc H A gt B gt C gt D2 gt E o au moins une in galit est stricte Nous donnons les r sultats des tests de Friedman et de Page Friedman s Test N 15 t 3 b 5 SRj2 471 T 88 p 0 0663 critical value 5 ties no corr for ties 1 T 8 8 p 0 0663 Page s Test Page s Test Nt 3 k b 5 L 158 m 135 s 8 66 SL 2 656 p 0 05159 exact p lt 0 01 critical value for L 51110 11 15011551160 La bo te de dialogue appelant le test est la m me que celle du test de Friedman remani e Dans le cas ou le nombre de blocs k est inf rieur 10 on consulte une table sp ciale dans le cas pr sent est sup rieure la valeur critique au seuil de 1 L 158155 Le Z SL qui correspond Z est approximatif dans le cas o k est inf rieur 10 et ne doit pas tre employ il est donn ici titre documentaire Au del la formule employer est Fa us 4 n k k 144 k 1 36 ou L est l approcimation normale de L d s que k gt 10 elle suit une loi de X 1 ddl n est le nombre d observations il doit y avoir le m me nombre a chaque colonne et k est le nombre de blocs Voyons un autre exemple pour un grand chantillon je le tire de l ouvrage de La
100. sente la variable d un chantillon de 12 individus la 2 colonne est la moyenne soit 55 48 Le test du chi2 montre que la moyenne observ e ne diff re pas de la moyenne th orique avec p 0 08 non significatif NS Toutefois Excel ne permet que de comparer un vecteur d observations avec un autre vecteur donnant les valeurs th oriques ici nous avons choisi la moyenne La formule a employer est 0 EXP pay oer EXP 1 Dans l exemple pr sent r p tons le il s agit de comparer une distribution observ e une distribution th orique il s agit du test du chi2 dit d ajustement Au 2 on envisage le chi2 dit d homog n it permettant de mesurer le fait que deux chantillons appartiennent ou non la m me population 2 le tableau de contingence ne figure pas dans l Analysis Tool Pack d Excel Another useful way of looking at the relationship between two nominal or categorical variables is to cross classify the data and get a count of the number of cases sharing a given combination of levels i e categories and then create a contingency table cross tabulation showing the levels and the counts A contingency table lists the frequency of the joint occurrence of two levels or possible outcomes one level for each of the two categorical variables The levels for one of the categorical variables correspond to the columns of the table and the levels for the other categorical variable corresp
101. t de rang partiel T y Quand une corr lation est observ e entre deux variables il y a toujours la possibilit que cette corr lation soit due a l association entre chacune des deux variables et une troisi me variable Les effets de variation due une troisi me variable sur la relation entre deux autres variables X et Y sont limin s par une corr lation partielle D une autre fa on la corr lation entre X et Y est calcul e alors que la troisi me variable est maintenue constante Nous esp rons donner bient t une suite pratique cet expos sur le coefficient de rang partiel Il est certain que le Tau de Kendall poss de des avantages pratiques et p dagogiques Les statisticiens calculent assez souvent une quantit comme un coefficient de corr lation sans demander ce que la quantit signifie au sens de est elle signifiante Car une diff rence peut tre significative sans que pour autant elle soit le moins du monde signifiante Le coefficient de Kendall d autre part a une interpr tation intuitivement simple Qui plus est sa structure alg brique est beaucoup plus simple que celui du coefficient de Spearman Il peut m me tre calcul a partir des observations r elles sans passer par le classement en rang se rapprochant un peu en cela du test de Komogorov Smirnov Un coefficient de corr lation est destin mesurer la force d une liaison Mais des coefficients de corr lation diff rents mesurent une
102. tat lsu edu faculty geaghan EXST7005 Spring2002 Freelance On compare des concentrations d un m dicament de cellules suspendues dans des solutions diff rentes Le tableau suivant montre les r sultats obtenus avec notre programme hank s 14 14571727615 sucrose 22 21971626413 hennennennenmeneennennnshennennenneneenerennnne iPO i 1i 3 5 bottes a IT the 14 3 5 BR LE RASE RIDE ECET E O E critical value 0 i i TABLEAU VII comparaison de deux solutions Le lecteur int ress verra que nous donnons plus d informations que celles propos es par le r dacteur de la page En particulier les valeurs critiques au risque 5 et 1 b exemple 2 http www nist gov speech tests sigtests wilcoxon htm Nous laissons l auteur s exprimer The Wilcoxon signed rank test like the Sign test is a test on speakers or conversation sides or other prespecified subsets but it takes some account the magnitude of the performance differences on each subset rather than only which system had the better performance Table 1 offers an example of using the Wilcoxon test For each specified subset the difference in performance scores of systems A and B is determined and these differences are ranked by magnitude irrespective of sign A mean rank is used in case of equal performance differences A sign is then attached to each rank corresponding to the sign of the difference system A 97 88 75 90 85 94 77 89 82 90 s
103. te de dialogue propre a notre macro qui va permettre de piloter l outil r gression L accent est mis sur le fait que l utilisateur peut employer soit ses propres donn es d j calcul es predicted Y soit qu il va r aliser une premi re analyse Posons que nous soyons dans ce deuxi me cas de figure La figure suivante montre les quivalences de zones de saisie entre la bo te de dialogue du DW et celle de l outil r gression En effet pour l utilisateur le fonctionnement de l outil r gression sera transparent puisque la bo te de dialogue propre cet outil n appara tra pas Si nous reprenons les donn es de Shazam nous obtenons d abord en s lectionnant 2 at first perform an analysis of linear regression les donn es suivantes Regression Statistics Multiple R 0 9753367 R Square 0 95128167 Adjusted R Square 0 94432191 Standard Error 5 56335574 Observations 17 Analysis of Variance df Sumof Squares Mean Square F Significance F Regression 2 8460 93643 4230 46822 136 683086 6 514E 10 Residual 14 433 312979 30 950927 Total 16 8894 24941 Coefficients Standard Error t Statistic P value Lower 95 Upper 95 Intercept 130 706587 27 0942926 4 8241373 0 00018691 72 5950577 188 818117 INCOME 1 06170963 0 26667397 3 98130214 0 00107341 0 48975035 1 63366891 PRICE 1 38298546 0 08381426 16 5005981 1 8141E 11 1 56274933 1 20322158 4 le test de Durbin Watson A partir des donn es de la f
104. tendue de C1 est donc 0 Sa variance est donn e par l quation pr c dente Ici on a Z 17 71 Si l approximation par la loi normale est permise on a le r sultat par l cart r duit de C1 11 et C1 1 543 dans notre exemple Le test C1 selon ce qu en dit Schwartz revient normaliser les observations et leur appliquer ensuite le test de l cart r duit 5 le test T de Wilcoxon appliqu aux s ries appari es E ne figure pas dans l Analysis Tool Pack d Excel On forme pour chaque paire d observations la diff rence puis on classe ces observations en valeurs absolues croissantes en mentionnant pour chacune si elle est positive ou n gative les diff rences nulles sont limin es L exemple suivant est tir de Armitage P amp G Berry 1994 Statistical Methods in Medical Research Third Edition Blackwell Scientific Publications Oxford L hypoth se nulle est il n y a pas de diff rence significative entre le m dicament tudi et le placebo Le r sultat est affich sur le tableau suivant drug 19 11 14 17 23 11 15 19 11 8 placebo 22 18 17 19 22 12 14 11 19 7 DEEE EEE H TABLEAU V test T de Wilcoxon Quand le nombre de paires est inf rieure 20 ici N 10 on emploie une table sp ciale ins r e dans le logiciel A droite la valeur du rang de chaque paire L encore on doit tenir compte des ex aequo Nous allons donner quelques exemples suppl mentaires de ce test fort
105. tez enfin que le test de Wald Wolfowitz est moins puissant que le test de Kolmogorov Smirnov Les formules permettant de d terminer le Z sont les suivantes sachant que l approximation normale est atteinte quand n et n2 gt 10 24 2 fs H 22 Bias 2 22 272 2 7 Con m a or Jai A S 24 23 Notez encore que le test de la m diane se rapproche du test des signes Et qu enfin il existe un test qui permet de relever si deux chantillons ont une m me variance Ce test est connu comme le Moses test for equal variability est cong n re du test de Wald Wolfowitz et se rapproche par sa mise en oeuvre du test de Mann Whitney U parce qu il est bas sur un classement en rang qui s inspire absolument de celui qui est visible au tableau VII Ilya peu d information qui circule sur le web pour ce test on peut citer un fichier pdf dont seule la version en cache est disponible h las les formules en sont illisibles C est un fragment de cours d bit en plusieurs le ons qui tire son origine de http cui unige ch koval taras Param 20Nonparam 20Stat 20Pro c test15 pdf En voici un extrait Developed by Moses 1963 the Moses test for equal variability is a nonparametric procedure that can be employed in a hypothesis testing situation involving two independent samples If the result of the Moses test for equal variability is significant it indicates there is a significant difference be
106. tion tudi e Elles ignorent notamment l hypoth se classique de la normalit de la population Ces tests peuvent tre appliquer comme nous l avons dit de petits chantillons Ils peuvent s appliquer a des caract res qualitatifs des grandeurs de mesure des rangs de classement Ils peuvent s appliquer des donn es incompl tes ou impr cises Des recherches th oriques ont montr que l efficacit des tests non param triques n est que l g rement inf rieure celle de leurs quivalents param triques quand la distribution de la population tudi e est sp cifi e par exemple la loi normale Elle est en revanche sup rieure celle des tests param triques quand la distribution de la population d vie sensiblement de la distribution sp cifi e normale Michel Le Her Il convient de s assurer de la normalit d un chantillon avant d employer un test dit param trique comme le test t de Student Fisher Le test de Kolmogorov Smirnov que nous retrouverons plus loin peut encore tre utilis a cette fin c est le test le plus prot iforme que je connaisse II permet de tester la normalit d un chantillon en le testant a travers diff rentes lois uniforme normale Poisson etc Dans le cas g n ral le test de Kolmogorov Smirnov vise a d terminer si les fonctions de r partition de deux populations sont identiques Il est utilis lorsqu on est en pr sence de deux chantillons provena
107. tre comrpis et illustr d apr s la figure suivante di d 4 d 4 d FIGURE IX le sens de l interpr tation du test de DW Selon la position de DW on peut conclure Regions of Acceptance and Rejection of the Null Hypothesis a 10 4 4 Reject Null H Negative Autocorrelation Reject Null H Positive Autocorrelation FIGURE X Dans notre cas de figure DW 2 019 et compris entre d2 1 02 et 4 d2 2 46 4 1 54 On accepte donc Ho autocorrelation 0 Les tables pour interpr ter la valeur du DW sont incluses dans la feuille macro et consultables sous forme de fichiers image On en trouvera en outre une version au format pdf au risque 5 et au risque 1 ll Le logiciel Il se compose d une feuille macro MANNWHIT XLM au format Excel 4 0 Quand on lance MANNWHIT XLM une feuille de calcul est batie en M00D2 XLS H H f TS i i i f f H ESTESE SE COIN T NDORO POOO EN ERSE EEE NEETER eneee be eee termine Uowwarsts Can 2 nv ES DS TS ES EN CS a A aay es ae a a benne nn he RL CREER SNS 4 a Sohne Somenanunel Lamson al Ccuimemone 4 i TABLEAU XXIII Le bord sup rieur gauche de la cellule contient un bouton sur lequel on clique pour faire appara tre le menu On peut aussi se servir de la s quence de touches ctrl a On saisit ensuite les donn es dans des colonnes adjacentes Voici le menu g n ral sous la forme d une bo te de dialogue Il y a actuell
108. tween the sample variances and as a result of the latter the researcher can conclude there is a high likelihood that the samples represent populations with different variances The Moses test for equal variability is one of a number of tests of dispersion also referred to as tests of scale or spread that have been developed for contrasting the variances of two independent samples Some sources recommend the use of nonparametric tests of dispersion for evaluating the homogeneity of variance hypothesis when there is reason to believe that the normality assumption of the appropriate parametric test for evaluating the same hypothesis is violated Sources that are not favorably disposed toward nonparametric tests recommend the use of Hartley sF test for homogeneity of variance F test for two population variances Le test permet de tester la difference des rangs pour une variable donn e organis e en deux groupes Le groupe contr le est d fini comme tant celui qui contient la valeur la plus basse l autre groupe est tiquet comme exp rimental Les deux groupes sont combin s exactement de la m me mani re que pour le test de Wald Wolfowitz On d finit alors une quantit nomm e par les anglo saxons le span que l on peut traduire par intervalle quoique le terme stricto sensu soit impropre Il serait sans doute plus avis de dire l cart ou m me mieux la distance Cette distance span repr s
109. urs critiques peuvent tre trouv es dans les tables appropri es et ce sont les indications qui apparaissent plus bas avec les valeurs critiques au seuil de 5 et de 1 Ces tables peuvent tre trouv es pour partie sur le site suivant http cons dev univ lyon1 fr Enseignement Stat Il est n cessaire de disposer des tables suivantes valeurs critiques pour un chantillon Siegel S 1956 Non parametric Statistics for the Behavioral Sciences McGraw Hill idem pour deux chantillons avec n1 n2 pour n lt 40 Sprent 1992 et n gt 40 Siegel 1956 idem pour deux chantillons avec n1 lt gt n2 grands chantillons bilat ral Siegel 1956 Ces tables sont int gr es dans la feuille macro elles peuvent tre consult es et copi es Mais il y a une autre mani re de regrouper les distributions cumul es en classes On pourra trouver le d tail de la fa on de classer des distributions sur le site suivant dont nous tirons l encore cet extrait http conte montesquieu u bordeaux fr index html Rappel par d finition Ni lt ou Ni lt est le nombre total d e individus ayant une valeur prise dans l ensemble des i 1 ou i premi res modalit s la PTE modalit tant not e D s Xf Dans un cumul la fran aise ou l anglo saxonne on inscrit donc a la ligne i en face de x xj le nombre Ni lt ou Ni lt c est dire le nombre d individus dont la valeur est inf r
110. urs discr tes 1 et 0 par d faut L entr e des donn es se fait comme d habitude en s lectionnant les plages de cellules voulues Ici au cas o l option 1 serait choisie le r sultat serait Mc Nemar test ni n2 5 20 exactp 0 002 chi2 7 84 p 0 005 14 Test de Jonckheere Terpstra Alors que le test de Kruskal Wallis ANOVA non param trique permet de mesurer une diff rence entre plusieurs moyennes sans pr juger de leur ordre le test de J T permet de mesurer un ordonnancement de differentes moyennes pourvu que ces chantillons soient ind pendants ce qui diff rencie la statistique de Jonckheere de celle de Page voila donc un test a utiliser pour valuer par exemple un effet dose Il est donc cong n re de la statistique de Page qu voque Tomassone la page 243 de sa Biom trie Curieusement le test de J T n est pas cit Il s agit ici de voir s il existe une structure sous les traitements Mais la diff rence de la statistique de Page ce test ne s emploie que lorsqu on est port consid rer que les chantillons dont l on dispose sont ind pendants Il n a pas t ais de trouver une documentation substancielle sur ce test J ai pu n anmoins s lectionner les sources suivantes capu18 pdf Testing for trends School of Psychology University of Nottingham http evolution unibe ch teaching ExpDesign Exp Designstats Kapitel 54 files http www id unizh ch software unix statmath s
111. ves of distribution for two independent samples Russian Bull Moscow Univ 2 3 16 Daniel W W 1990 Applied Nonparametric Statistics second edition Boston PWS Kent pp 574 576 for Table A 20 null distribution The F test for the ratio of two normal variances classical Ott R L 1993 An Introduction to Statistical Methods and Data Analysis fourth edition Belmont CA Wadsworth pp 340 345 Many other books can be cited for this test I do not know the original source but it is probably Fisher 1925 see the references for the sign test The Moses two sample dispersion test Moses L E 1963 Rank tests of dispersion Annals of Mathematical Statistics 34 973 983 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 93 102 textbook treatment The Ansari Bradley two sample dispersion test Ansari A R and Bradley R A 1960 Rank sum tests for dispersions Annals of Mathematical Statistics 31 1174 1189 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc pp 83 93 textbook treatment The Miller Jackknife two sample dispersion test Miller R G Jr 1968 Jackknifing variance Annals of Mathematical Statistics 39 567 582 Hollander M H and Wolfe D A 1973 Nonparametric Statistical Methods New York John Wiley amp Sons Inc
112. xon Signed Rank test WSR wordt uit de verschilreeks een rangnummer vastgesteld voor elke score paar en wordt een of rangteken toegevoegd al naar gelang het verschil A B groter of kleiner dan 0 is Bij de WSR toets tellen de positieve en negatieve tekens mee Zowel van de Tekentoets T als van de Wilcoxon Signed rank toets W kan op de verkregen toetswaarde een Z waarde bepaald worden met de normale benadering Voormeting X 82 63 85 77 83 86 74 79 58 88 Nameting Y 7863 82 71 73 81 74 80 58 86 TABLEAU X Nous concluerons une diff rence significative puisque le nombre de paires P est inf rieur la valeur critique de 2 P 1 5 bis le test du signe ne figure pas dans I Analysis Tool Pack d Excel ll est mettre au m me rang si l on peut dire que le test T de Wilcoxon dont il constitue en somme une g n ralisation L encore nous mettrons contribution l excellent aide m moire que nous avons d j signal lors de l examen du test des s quences de Wald Wolfowitz Le test du signe consiste tester l galit de la m diane m une valeur mo connue avec un chantillon de variables Xi dont la m diane m est inconnue On trouvera infra le test de la m diane Mood Test pour deux chantillons g n ralisable plusieurs chantillons extensed median tes Trois hypoth ses Ho sont possibles selon que m Mo contre H M Mo alternative bilat rale m lt mo contre H M gt M
113. ystem B 96 86 79 89 91 89 86 99 94 96 esp Se Wilcoxon ri cores ue 1 7 as H p T PE EE ae L EN E CSS Tithe T ki 4 as i a i Eee En ERED 2 BORER Pc SOON RME PSS a critical value 3 TABLEAU VIII performance de deux syst mes For large enough n gt 8 or so Z has an approximately normal distribution The test statistic is then the approximately standard normal value Let w be the value obtained for W The null hypothesis HO is rejected if Prob W gt w lt 0 05 one tailed Prob W gt wl 2 Prob W gt w lt 0 05 two tailed For the example above Z 44 0 m 27 5 s 96 25 and W 1 68 we find the value of e 1 784 At p 0 05 this is not significant as a two tailed test but as a one tailed test this is significant by a slight margin Thus if system B is intended to be an improved version of system A we may want to conclude that it does offer significant improvement From tables 2 and 3 it may be observed that no such conclusion could be reached based on the sign test We can also define Z as the unsigned sum of the negative signed ranks If table lookup is preferred to the normal approximation to find critical regions for the test it is easier to use the statistic Z min Z Z source of this data G Kanji 100 Statistical Tests SAGE Publications 1994 The Wilcoxon test is generally a more powerful test than the Sign test Studies have shown that the relative efficien
Download Pdf Manuals
Related Search
Related Contents
MURAL - Amazon Web Services Mazda MAZDA3 4-Door Smart Start Guide MN8151-76 内蔵LTO - 三菱電機インフォメーションネットワーク株式会社 Meriva, v.8 (rev 3) Fusion color 18 FC rgbw Thèse par articles : mode d`emploi SAN32B-E4 Installation, Service, and User Guide EPO ELISA Kit Manuel d`opération et d`entretien du Propriétaire Instrucciones de Operación e Instalación para Unidad de Copyright © All rights reserved.
Failed to retrieve file