Home
M@n@gement
Contents
1. valuer la compatibilit de l hypoth se de base avec le ph nom ne r el Plus pr cis ment le rai sonnement correspond au syllogisme suivant Gill 1999 1 Si A alors B 2 Non B est observ 3 Donc non A Pour les TSS ce raisonnement se traduit de la mani re suivante 1 Si HO est vraie alors les donn es auront une forme particu li re 2 Les donn es n ont pas la forme particuli re correspondante 3 Donc HO est fausse Le grand probl me est que dans l application concr te de cette logi que formelle aux TSS on bascule d affirmations certaines des affir mations probabilistes En effet le raisonnement devient 1 Si A alors B est hautement probable 2 Non B est observ 3 Donc A est hautement improbable Pour les TSS cela donne 1 Si HO est vraie alors les donn es auront tr s probablement une forme particuli re 2 Les donn es n ont pas la forme particuli re correspondante 3 Donc HO est tr s probablement fausse De prime abord cette logique semble plausible Pourtant il est faux d affirmer que la pr sence de donn es atypiques ou improbables sous une hypoth se de base donn e implique que l hypoth se de base est fausse Il se peut tout simplement qu un ph nom ne rare c est dire peu probable soit advenu Cohen 1994 Gill 1999 Consid rons l exemple suivant 1 Si une personne parle fran ais elle n est tr s probablement pas membre de l AIMS 2 La
2. VE o gement ISSN 1286 4892 Editors Emmanuel Josserand HEC Universit de Gen ve Editor in Chief Jean Luc Arr gle EDHEC editor Stewart Clegg University of Technology Sydney editor Philippe Monin EM Lyon Editor Jos Pla Barber Universitat de Val ncia editor Linda Rouleau HEC Montr al editor Michael Tushman Harvard Business School editor Olivier Germain EM Normandie editor book reviews Karim Mignonac Universit de Toulouse 1 editor Thibaut Bardon Universit Paris Dauphine CREPA HEC Universit de Gen ve editorial assistant Florence Villes che HEC Universit de Gen ve editorial assistant Martin G Evans University of Toronto editor emeritus Bernard Forgues EMLyon Business School editor emeritus M Ababacar MBENGUE 2010 Faut il br ler les tests de signification statistique M n gement 13 2 99 127 accept par Louis H bert M n gement est la revue officielle de AIMS Copies of this article can be made free of charge and without securing permission for purposes of teaching research or library reserve Consent to other kinds of copying such as that for creating new works or for resale must be obtained from both the journal editor s and the author s A l M M n gement is a double blind refereed journal where articles are published in their original language as soon as they have been accepted Association Internationale For a free subscription to M n gement a
3. pes sociaux d organisations des processus etc sont ils galement valables pour d autres cas individus groupes sociaux organisations processus etc non inclus dans la recherche initiale II s agit l d un trait essentiel de la d marche scientifique puisque l int r t d une re cherche est souvent largement tributaire du caract re plus ou moins g n ralisable de ses r sultats m me si bien entendu toute recherche ne vise pas des r sultats de port e universelle De fait le chercheur se contente rarement de d crire des situations des ph nom nes ou des Faut il br ler les tests de signification statistique donn es bruts Tr s souvent il est amen a partir d l ments particu liers pour aboutir des conclusions de port e plus g n rale Autrement dit il doit proc der une inf rence pour g n raliser ses r sultats On distingue g n ralement deux formes principales d inf rence 1 l inf rence th orique ou g n ralisation analytique Kennedy 1979 Yin 1984 Firestone 1993 Smaling 2003 dont l objectif est de g n raliser des propositions th oriques sur la base d un raisonnement logique 2 l inf rence statistique qui est une forme de g n ralisation qui s appuie sur les propri t s de la statistique math matique Bien que chacune de ces deux formes d inf rence occupe une place im portante dans la recherche scientifique c est l inf rence statistique qui est au coeur des TSS en cela q
4. alablement la traduire en hypoth se statistique Les modalit s de cette traduction de l hypoth se de recherche en hypoth se statistique sont de ce fait cruciales pour la validit d une inf rence portant sur l hypoth se de re cherche Pour autant les th ories des tests statistiques ne concernent que l inf rence portant sur l hypoth se statistique et la question de la pertinence de la traduction de l hypoth se de recherche en hypoth se statistique n est pas de leur ressort Poitevineau 1998 Une hypoth se statistique se pr sente traditionnellement sous la dou ble forme d une premi re hypoth se appel e hypoth se nulle et d une seconde hypoth se appel e hypoth se alternative ou contraire L hy poth se nulle d signe en g n ral les situations d absence de change ment ou d cart par rapport un statu quo ou encore d absence de dif f rence entre des param tres C est de l que provient la d nomination d hypoth se nulle Kanji 1993 Dodge 1993 Tr s souvent l objectif du chercheur est de r futer cette hypoth se nulle au profit de l hypoth se alternative Dodge 1993 Sincich 1996 Zikmund 1994 L hypo th se alternative est alors celle que le chercheur souhaite tablir celle a laquelle il croit Sincich 1996 L hypoth se nulle et l hypoth se alter native ou contraire sont incompatibles et d crivent deux tats compl mentaires de la nature L hypoth se nulle est g n ralement not e HO et l h
5. et le groupe de contr le les salari s n ayant pas suivi la formation repr sentent alors deux populations diff rentes Le groupe exp rimental pr sente une performance moyenne de 76 et un cart type de 4 3 et le grou pe de contr le une performance moyenne de 72 avec un cart type de 4 3 On peut d montrer qu avec des chantillons repr sentatifs des deux populations il faut une taille d au moins 11 salari s par groupe pour obtenir une diff rence statistiquement significative entre les per formances des deux groupes Donc si la recherche porte sur moins de 11 salari s par groupe on obtiendra un r sultat statistiquement non significatif alors qu avec un nombre de salari s sup rieur 10 on aura un r sultat statistiquement significatif Dans cet exemple le chercheur peut directement d cider du caract re statistiquement significatif ou non significatif de ses r sultats uniquement en contr lant la taille de l chantillon Une autre fa on de voir les choses est de partir des po pulations et non plus des chantillons Il est tr s probable qu l chelle des populations l hypoth se nulle soit fausse il y aura une diff rence m me infinit simale D s lors tout test conduira un r sultat signi ficatif et l information apport e par le test est donc quasi nulle Cela conduit plusieurs d tracteurs des tests la conclusion de l inutilit de recueillir des donn es et de proc der de tels tests dont les r
6. g n ralement 5 96 mais parfois aus Si 10 96 ou 1 96 etc est totalement arbitraire et pourtant il conduit di rectement d cider du rejet ou du non rejet des hypoth ses Prenons l exemple de la comparaison d une moyenne d un chantillon une valeur donn e On dispose d un chantillon constitu de 144 observa tions La moyenne trouv e sur cet chantillon est m 493 L cart type estim sur l chantillon est s 46 89 et le seuil de signification observ ou valeur p 0 07 Dans cet exemple on ne rejettera pas l hypoth se nulle selon laquelle la moyenne de la population est 10 500 si le seuil de signification a retenu est 5 alors qu on la rejettera si le seuil de signification a retenu est 10 96 Ce qui est clairement arbitraire La valeur p ou seuil de signification observ qui est caract risti que des donn es observ es est indicatrice du degr de r futation de l hypoth se nulle si p est jug e suffisamment faible on rejette hypo th se nulle on consid re qu on a r ussi en montrer la fausset et le r sultat est d clar significatif Poitevineau 1998 Nickerson 2000 Seulement la valeur p elle m me n est pas exempte de critiques En particulier elle d pend de la taille de l chantillon plus l chantillon est grand plus les valeurs p seront faibles toutes choses gales par ailleurs Il devient donc difficile de distinguer dans une valeur p don n e ce qui provient de la gra
7. on suppose qu une hypoth se est vraie la probabilit des donn es compte tenu de cette hypoth se ne correspond pas la probabilit de cette hypo th se compte tenu des donn es Par exemple la probabilit qu une entreprise ma trisant exactement dix facteurs cl s de succ s soit per formante n est pas n cessairement gale la probabilit qu une entre prise performante maitrise exactement dix facteurs cl s de succ s La premi re probabilit serait en toute hypoth se tr s forte et la seconde en toute hypoth se tr s faible Aucune contradiction aussi peu proba ble qu elle soit ne peut r futer quoi que ce soit si les pr misses sont incertaines Troisiemement enfin les TSS ne sont pas d une aide par ticuli re concernant les possibilit s de r plication des r sultats dans le futur Carver 1978 Morgan 2003 Hume 1978 a remarqu que l inf rence ne peut pas tre autrement valid e que par l inf rence elle m me L inf rence partir d un chan tillon de quelque taille qu il soit ne peut pas fournir de connaissance certaine propos des caract ristiques de la population Pourtant parce nos inf rences ont pu tre av r es dans le pass nous esp rons qu il en sera de m me l avenir Cela en soi est une inf rence qui ne peut tre justifi e que par d autres inf rences et ainsi de suite Krueger 2001 Morgan 2003 La recherche empirique doit soit accepter cet acte de foi soit se bri
8. prouve la fois en premi re et derni re instances toutes les th ories et hypoth ses du chercheur en management Faut il br ler les tests de signification statistique COMMENT MIEUX UTILISER LES TESTS DE SI GNIFICATION STATISTIQUE CERNER LES CAUSES DE LA PERSISTANCE DES PROBLEMES En d pit des trois types de probl mes pos s par les TSS statistique technique philosophique leur popularit reste grande aupr s des chercheurs Armstrong 2007b Levine Weber Hullett Hee Sun Park et Lindsey 2008 Malgr les nombreuses critiques dont leur usage fait constamment l objet les TSS sont conventionnellement accept s comme une preuve de la validit des conclusions et sont une norme incontournable pour la publication des r sultats de recherche Tout se passe comme si on tait en pr sence d une pratique critiquable aux plans th orique et m thodologique mais sociologiquement adapt e d un outil mal utilis car son mode d emploi se r v le particuli rement trompeur mais b n ficiant n anmoins d une aura jusque l intacte Poitevineau 1998 2004 r sume les principales raisons de ce para doxe apparent e L ambiguit de la terminologie les TSS sont des tests de signification ce qui renvoie significatif quelque cho se qui donne du sens qui a de l importance etc Ce faisant la confusion entre significativit s statistique et substantielle est induite L objectivit les chercheurs s
9. 1960 Tukey 1991 Parmi les nombreux exemples d hypoth ses nulles on peut mentionner une fr quence ou une pro portion gale z ro une corr lation gale z ro un coefficient de r gression gal z ro une galit entre deux ou plusieurs moyennes etc Selon Schwab et Starbuck 2009 de tels exemples sont tr s fr quents dans la recherche en management De nombreux d tracteurs des TSS mettent en cause l utilit m me d une hypoth se nulle HO ponctuelle c est dire une hypoth se attribuant au param tre une va leur pr cise et non un intervalle En effet une telle hypoth se est pra tiquement toujours fausse ne serait ce qu plusieurs d cimales apr s la virgule Oakes 1986 Tukey 1991 Morgan 2003 Ainsi toute dif f rence m me infinit simale deviendra statistiquement significative pour autant que la taille de l chantillon soit suffisamment grande Par exemple pour un test de diff rence de moyennes entre deux grou pes toute diff rence non rigoureusement nulle pourra tre rendue significative pour autant que la taille des groupes soit suffisamment grande Consid rons l exemple d une recherche visant tester par une Faut il br ler les tests de signification statistique exp rimentation l hypoth se en r alit vraie selon laquelle une ac tion de formation sp cifique augmente la productivit des salari s Le groupe exp rimental les salari s ayant suivi la formation
10. Ici l enjeu r el n est pas tant de savoir si la formation a un effet sur la productivit que de savoir si cet effet est suffisamment important pour justifier d investir dans un plan de formation L usage des TSS aurait conduit formuler l hypoth se nulle selon laquelle la formation n a aucun effet et si cette hypoth se nulle venait tre rejet e inter pr ter le r sultat comme une preuve de l utilit des plans de formation Naturellement une telle conclusion n est pas strictement justifi e par le r sultat du TSS En somme les questions pertinentes restent les suivantes est ce qu une diff rence de moyennes est triviale faible moyenne ou forte Cette diff rence fait elle sens naturellement Est elle suffisamment importante pour tre incluse dans un mod le plus large Toutes ces questions de recherche importantes ne sont pas trait es par les TSS car elles en d passent le cadre Les chercheurs en sciences sociales ont souvent beaucoup de diffi cult s d finir ce qui est substantiellement significatif Autrement dit ils ont du mal d terminer partir de quelle taille une diff rence une proportion un coefficient de corr lation ou de r gression etc devient important int ressant pertinent Bien qu il n existe pas de r gles abso lues pour interpr ter la grandeur des effets des lignes directrices sont d velopp es dans les diff rents champs de recherche cet gard l ouvrage de Cohen 1988 demeu
11. S 2001 Bayesian Models for Early Warning of Bank Failures Management Science 47 11 1457 1475 a Sawyer A G amp Peter J P 1983 The Significance of Statistical Signi ficance Tests in Marketing Research Journal of Marketing Research 20 2 122 133 M n gement vol 13 no 2 2010 99 127 ea Schmidt F L amp Hunter J E 2002 Are there benefits from NHST Ameri can Psychologist 57 65 66 a Schwab A amp Starbuck W H 2009 Null hypothesis significance tests in be havioral and management research we can do better Research Methodology in Strategy and Management 5 29 54 a Selvin H C 1957 A Critique of Tests of Significance in Survey Research American Sociologi cal Review 22 519 527 a Sincich T 1996 Business statistics by example Upper Saddle River NJ Prentice Hall a Smaling A 2003 Inductive analogical and communicati ve generalization International Journal of Qualitative Methods 2 1 1 31 a Thompson B 1996 AERA editorial policies regarding statis tical significance testing Three sugges ted reforms Educational Researcher 25 2 26 30 a Tukey J W 1991 The philosophy of multiple compari sons Statistical Science 6 100 116 a Wainer H 1999 One cheer for null hypothesis signifi cance testing Psychological Methods 6 212 213 Yin R 1984 Case study research Design and methods Beverly Hills CA
12. Sage 126 M n gement vol 13 no 2 2010 99 127 a Zikmund W G 1994 Business research methods Orlando Florida The Dryden Press a Zuckerman M Hodgins H S Zuckerman A amp Rosenthal R 1993 Contemporary issues in the analysis of data A survey of 551 psychologists Psychological Science 4 49 53 127 Ababacar MBENGUE
13. a Martinez Pons M 1999 Statistics in modern research Applica tions in the social sciences and educa tion New York New York University a Mbengue A 2007 Tests statistiques de signification n R A Thietart amp coll Eds M thodes de recherche en management pp 297 349 Paris Dunod a Meehl P E 1990 Why summaries of research on psycho logical theories are often uninterpreta ble Psychological Reports 56 Suppl 1 195 244 a Mittag K C amp Thompson B 2000 A national survey of AERA members perceptions of statistical significance tests and other statistical issues Edu cational Researcher 29 4 14 20 Faut il br ler les tests de signification statistique a Morgan P L 2003 Null Hypothesis Significance Testing Philosophical and Practical Considera tions of a Statistical Controversy Ex ceptionality 11 4 209 221 e Morrison D E amp Henkel R E Eds 1970 The Significance Test Controversy Chicago Aldine Mulaik S A Raju N S amp Harshman R A 1997 There is a time and place for significan ce testing In L L Harlow S A Mulaik amp J H Steiger Eds What if there were no significance tests pp 65 116 Ma hwah NJ Lawrence Erlbaum a Nelson N Rosenthal R amp Rosnow R L 1986 Interpretation of significance levels and effect sizes by psychological researchers American Psychologist 41 1299 1301 a Nic
14. affirmer la distribution de stock options ne modifie pas la fid lisation des dirigeants car il s agit l d une inf rence De fait Cohen 1994 a montr que prouver I hy poth se nulle est une impossibilit logique dans le contexte des TSS Plusieurs autres auteurs mettent galement en garde contre une telle erreur Gill 1999 Krueger 2001 Les erreurs pr c dentes sonnent comme autant de critiques suppl mentaires des TSS une m thode donnant lieu tant d erreurs dans son application m me chez des usagers avertis n aurait elle rien se reprocher Mais les TSS pr sentent encore un troisi me type de probl mes d ordre philosophique cette fois DES PROBLEMES D ORDRE PHILOSOPHIQUE LES LIMITES DE L INFERENCE La logique des TSS est fond e sur l inf rence Fisher 1942 Krueger 2001 Morgan 2003 Les pr curseurs de l inf rence tels David Hume au milieu du XVIIIe si cle et Karl Pearson au d but du XXe si cle af firment que les futurs v nements peuvent tre anticip s a partir des s quences ou fr quences d v nements ant rieurs Alexander 1972 MacNabb 1972 Morgan 2003 D apr s Hume et Pearson les causes et les effets ne peuvent se justifier que comme une s rie tendue de co ncidences que l on commence associer une anticipation Black 1972 L une des implications philosophiques de cette conception est que bien qu il soit possible de prouver que quelque chose est
15. br ler les tests de signification statistique et publi s Quelle assurance avons nous de ne pas tre dans un tel sc nario lorsque nous proc dons a une revue de la litt rature Pra tiquement aucune C est la encore une fois une illustration du devoir de vigilance d audace et d esprit critique de la part du chercheur Et ces qualit s sont d autant plus n cessaires que les outils deviennent plus sophistiqu s nombreux et ais ment disponibles Clairement cette exigence individuelle gagnerait tre accompagn e d une action col lective visant encourager la publication de r sultats statistiquement non significatifs ce qui permettrait de r duire un grave travers de l en vironnement professionnel des chercheurs Dans cette perspective il est int ressant de noter que dans des disciplines scientifiques autres que le management certaines revues scientifiques encouragent d j la publication de r sultats non scientifiques par exemple les varian tes de Journal of Negative Results D autres revues scientifiques requi rent qu une exp rience soit enregistr e avant d tre entreprise afin d viter l autocensure par exemple plusieurs revues membres de l International Committee of Medical Journal Editors CONCLUSION Cet article a voulu fortement attirer l attention des chercheurs en mana gement sur les dangers li s l usage irr fl chi des TSS Il prend appui sur une s rie de publications qui ont nourr
16. cas de rejet de l hypoth se nulle il faudrait pouvoir carter toutes les explications rivales l hypoth se de recher che et qui seraient susceptibles d expliquer galement le rejet de l hy poth se nulle En d autres termes rejeter l hypoth se nulle revient admettre qu il ne se passe pas rien mais n indique pas que ce qui Se passe est pr cis ment ce que dit l hypoth se de recherche Hypoth se nulle hypoth se alternative et hypoth se de recherche Lorsque l hypoth se de recherche celle laquelle le chercheur s int resse r ellement conduit une pr diction pr cise du param tre il est possible de l identifier l hypoth se nulle et non l hypoth se alterna tive C est notamment le cas lorsqu il s agit de validation de mod les Une illustration peut ainsi tre trouv e dans le test des mod les de cau salit par exemple un mod le causal expliquant la fid lisation des diri geants par l attribution de stock options Un autre exemple d hypoth se de recherche correspondant l hypoth se nulle est celui de l hypoth se selon laquelle la survie des organisations est un ph nom ne al atoire Cette derni re hypoth se s appuie sur les r sultats des nombreux tra vaux empiriques conduits dans le contexte analytique de l cologie des populations qui ont montr une absence de diff rence dans les taux de survie des jeunes et des vieilles organisations ou des petites et des grandes organisations Schwab et
17. clarer significatif un effet les TSS sont vus comme une solution M n gement vol 13 no 2 2010 99 127 116 M n gement vol 13 no 2 2010 99 127 117 Ababacar MBENGUE d chargeant le chercheur de la tache d interpr tation comme si la significativit statistique se suffisait a elle m me Tout porte donc croire que le succ s persistant des TSS est d a un formidable malentendu une apparence d objectivit et de scientificit ainsi qu une illusion d ad quation aux besoins des chercheurs permise par l ignorance que la plupart de ces derniers ont de la nature et des conditions d utilisation desdits TSS Pourtant les critiques qui ne sont pas nouvelles commencent produire lentement leurs premiers effets L l ment d clencheur est non pas un r veil brusque ou une prise de conscience subite des chercheurs utilisateurs des TSS mais plut t le relais des critiques pris ces derni res ann es par des insti tutions comme l American Psychological Association ou des comit s ditoriaux de revues scientifiques qui prescrivent de nouvelles normes de publication Pour l essentiel les r sultats des analyses statistiques traditionnelles devraient tre compl t s au del des seuls seuils de signification observ s ou valeurs p pour inclure syst matiquement la pr sentation d indicateurs de la grandeur des effets et leurs estimations par intervalles Dans cette veine quelles sont plus g n ra
18. compr hension des recommandations des institutions comme l American Psychological Association ou de la consid ration de m thodes nouvelles d inf rence statistique comme les m thodes bay siennes une troisi me voie d am lioration qui nous parait de loin la plus importante concerne l attitude m me du chercheur Reprendre la posture du chercheur Il s agit de retrouver certaines qualit s fondamentales du chercheur comme l esprit critique la vigilance le doute l audace la cr ativit la puissance de la volont etc Diverses raisons sociologiques historiques cognitives affectives etc peuvent conduire le chercheur parfois manquer de prise de distance et d esprit critique vis vis de son environnement de travail en particulier vis vis des outils de recherche disponibles Le type de formation la recherche recu cole de pens e profil des maitres et des pairs l orientation paradigmatique dominante dans les structures d appartenance laboratoires clubs associations acad miques etc de m me que les pr f rences ou aptitudes personnelles sont claire ment structurants et faconnent pour une grande part les croyances et comportements du chercheur Ces l ments peuvent naturellement favoriser le mim tisme et inhiber l esprit critique en mati re de m tho dologie de recherche Or la meilleure recherche celle susceptible de produire les r sultats les plus int ressants n cessite indubitablement
19. fournir l information sur la taille de l chantillon et le processus qui a conduit au choix d une telle taille Expliciter les postulats concernant la grandeur des effets l chantillonnage et la mesure des variables de m me que les proc dures analytiques utilis es pour le calcul de la puissan ce Dans la mesure ou le calcul de la puissance fait davantage sens lorsqu il est effectu avant la collecte et l examen des don Faut il br ler les tests de signification statistique n es il est important de montrer comment des estimations de la grandeur des effets ont t d duites des recherches et th ories ant rieures pour carter le soup on qu elles ont pu tre extraites des donn es de l tude en cours ou pis encore qu elles ont t construites pour justifier un chantillon donn Les m thodes statistiques compl mentaires De nombreux statisticiens plaident depuis plus ou moins longtemps pour des m thodes statistiques alternatives aux TSS fr quentistes classiques Gill 1999 Nickerson 2000 Parmi ces m thodes sta tistiques alternatives aux TSS on peut mentionner les m thodes de vraisemblance et les m thodes bay siennes Poitevineau 1998 Les m thodes de vraisemblance dans le cas simple de deux hypoth ses ponctuelles HO et H1 la m thode du rapport de vraisemblance consiste calculer le rapport des densit s de probabilit de la statistique observ e x sous HO et sous H1 savoir f xI
20. les ph nom nes al atoires Cette th orie permet l inf rence statistique de d terminer la probabilit qu un ph nom ne observ sur un chan tillon soit dd uniquement au hasard de l chantillonnage alors m me qu il serait inexistant dans la population tout enti re L inf rence statistique s effectue au moyen de tests d hypoth ses sta tistiques Une hypoth se statistique est un nonc quantitatif concer nant les param tres d une population Baillargeon et Rainville 1978 On appelle param tre d une population un aspect quantitatif de cette population comme la moyenne la variance un pourcentage ou encore toute quantit particuli re relative cette population Les param tres d une population sont g n ralement inconnus Cependant il est possi ble de les estimer de mani re statistique partir d un chantillon issu de la population Pour pouvoir proc der une inf rence statistique le chercheur doit traduire son hypoth se de recherche en hypoth se sta tistique Par exemple une hypoth se de recherche peut tre que pour une population donn e d entreprises celles qui ont adopt des d mar ches de gestion de la qualit totale obtiennent des performances su p rieures celles qui ne l ont pas fait Pour passer d une hypoth se de M n gement vol 13 no 2 2010 99 127 102 M n gement vol 13 no 2 2010 99 127 103 Ababacar MBENGUE recherche son test au moyen de la statistique il faut pr
21. marche de recherche cette recherche commence avant l ventuel test se poursuit pendant le test et continue apr s le test Quant au test lui m me il n est qu un outil et en tant que tel il ne vaut que si on sait s en servir et bon escient De ce point de vue les questions r currentes sur l utilit des TSS sont un bon stimulant et un garde fou pr cieux pour l exercice d une saine activit de recherche Nous avons commenc cet article en rappelant que les TSS taient au cceur de la statistique inf rentielle et par suite de la d marche d inf rence Krueger 2001 Morgan 2003 Nous avons galement montr que jamais m thode statistique n avait t autant critiqu e tout en res tant minemment populaire et tr s largement utilis e mauvais escient Krueger 2001 Armstrong 2007a 2007b Levine et al 2008 La question qui tait pos e dans cet article tait de savoir si en d finitive il fallait oui ou non br ler les TSS L analyse de la critique des TSS et la prise de conscience de possibili t s alternatives pourraient conduire r pondre par l affirmative apr s tout l abolition des TSS ne mettrait apparemment pas en p ril la d marche d inf rence encore moins l activit de recherche scientifique Pourtant il est apparu qu une grande part des d fauts des TSS est li e l usage inappropri qui en est fait ce qui remet moins en cause l outil TSS que ses utilisateurs En ce sens la mise
22. n ayant pas suivi de plan de formation Une diff rence d un centi me de point est constat e entre les scores de productivit moyenne des deux chantillons Une telle diff rence d un centi me de point dans un score de performance variant entre 0 et 100 est clairement triviale Pourtant cette diff rence triviale sera statistiquement significative si chaque chantillon est compos de mil liers de salari s l inverse une diff rence substantielle par exemple de plusieurs points peut se r v ler statistiquement non significative pour peu que les chantillons soient de taille suffisamment faible quel ques individus Dans ce dernier cas Carver 1978 sugg re de tenter une r plication pour v rifier si on trouve nouveau un effet d intensit comparable En d finitive il revient au chercheur qui a r fl chi son hypoth se de recherche d identifier ce qui fait sens Par exemple c est lui de savoir si du point de vue de la signification il ne vaut pas mieux choisir pour hypoth se nulle qu entre les moyennes de deux groupes la diff rence est gale une constante non nulle plut t qu une diff rence strictement nulle En tout tat de cause et sur un plan plus g n ral plusieurs auteurs Carver 1993 Thompson 1996 in sistent sur l expression statistiquement significatif qui ne devrait jamais tre remplac e par l expression significatif tout court L acceptation de l hypoth se nulle Un
23. ne peut pas commettre la fois les deux types d erreur On appelle puissance d un test statistique la probabilit 1 8 de rejeter l hypoth se nulle HO alors qu elle est fausse La puissance d un test est d autant plus grande que le risque de deuxi me esp ce p est faible La plupart des logiciels d analyse statistique fournissent la probabilit associ e la valeur observ e de la statistique calcul e ou seuil de signification ob serv plus connue sous le nom de valeur p p value Il s agit de la probabilit calcul e sous l hypoth se nulle d obtenir un r sultat aussi extr me que la valeur obtenue par le chercheur partir de son chan tillon Dodge 1993 L hypoth se nulle HO sera rejet e si la valeur p est inf rieure au seuil de signification fix a Sincich 1996 Concr tement les tests d hypoth se permettent d valuer le risque d erreur auquel le chercheur s expose en conf rant un caract re g n M n gement vol 13 no 2 2010 99 127 104 M n gement vol 13 no 2 2010 99 127 105 Ababacar MBENGUE ral aux r sultats de sa recherche Par exemple ayant constat sur un chantillon de soixante entreprises cot es a Paris une corr lation en tre la taille et la mise en place de politiques de gestion des comp ten ces des chercheurs veulent d terminer si l on peut raisonnablement conclure qu un ph nom ne de m me nature est galement pr sent dans l ensemble de la population des en
24. sultats sont connus d avance Meehl 1990 Krueger 2001 Morgan 2003 Une d marche anti scientifique L accent mis par les TSS sur l hypoth se nulle hasard absence de diff rence statu quo absence d effet etc aurait conduit affaiblir la d marche scientifique En effet celle ci consiste essentiellement confronter les donn es recueillies l hypoth se de recherche H1 puis quand elles semblent incompatibles avec H1 envisager d autres hypoth ses dont celle du hasard ventuellement Au contraire dans le cas des TSS l hypoth se du hasard HO est g n ralement mise en avant elle est la premi re test e quel que soit son in int r t scientifi que Carver 1978 1993 Cohen 1994 Par cons quent l hypoth se de recherche ne sera m me pas examin e si le test est non significatif alors qu elle pourrait pourtant pr senter une bonne compatibilit avec les donn es Si le choix d assimiler l hypoth se nulle aux situations de hasard d absence de diff rence et d effet etc pr sente de multiples avantages techniques comme la facilitation de certains calculs statisti ques il n en demeure pas moins que cela loigne de la pr occupation principale du chercheur qu est sa question de recherche souvent H1 Or lorsqu un TSS est utilis tout se passe comme si seuls deux mo deles existaient ou m ritaient d tre consid r s l hypoth se nulle et l hypoth se alternative souvent celle du chercheur
25. 2007 Schwab et Starbuck 2009 D s lors l objectif principal de cet article est pr cis ment de mieux informer la communaut des chercheurs en ma nagement de l existence de ces critiques des tests de signification statistique d en d tailler le contenu et les enjeux et surtout de proposer des recommandations permettant d am liorer le test d hypoth ses et au del la d marche d inf rence statistique dans la recherche en management Mots cl s inf rence m thodologie statistique signification statistique tests statistiques Inference plays a central role in management research as researchers are frequently led to draw conclusions or make generalizations from their observations or results In many cases they are able to do this rigorously through inferential statistics which is the process of inference whereby the statistician tests the generalization of information collected in a sample to the entire population the sample is from Statistical tests are thus at the heart of inferential statistics and consequently the process of inference Howe ver since they were first developed statistical significance tests have been the object of sharp and repeated criticism regarding both their nature and their role Nickerson 2000 Such criticism has been longstanding in virtually all disciplines with the notable exception of management that is just beginning to address the issue Mbengue 2007 Schwab amp Starbuck 2009 T
26. 4 Les utilisateurs ont recours aux TSS pour d cider si les r sultats ob tenus confirment ou infirment leur hypoth se Or les tests indiquent la probabilit p d obtenir les r sultats observ s sachant que l hypoth se nulle est vraie et non la probabilit de l hypoth se nulle au regard des donn es Nous avons d j signal que les valeurs de ces deux pro babilit s pouvaient diff rer tr s sensiblement m me s il reste vrai que plus p est petit plus les preuves contre l hypoth se nulle sont grandes En termes tr s g n raux un r sultat statistiquement significatif est un r sultat qui advient tr s rarement lorsque l hypoth se nulle est vraie Sawyer et Peter 1983 On trouve du reste des erreurs similaires concernant les intervalles de confiance ou fourchettes Souvent les chercheurs affirment propos d un intervalle de confiance 9596 X Y le param tre rt a une probabilit 0 95 de se trouver dans la fourchette ou l intervalle M n gement vol 13 no 2 2010 99 127 110 M n gement vol 13 no 2 2010 99 127 111 Ababacar MBENGUE X Y Cette interpr tation naturelle est n anmoins fausse Les pa ram tres sont g n ralement inconnus mais ils ont une valeur fixe non al atoire L v nement X lt rt lt Y est vrai ou faux car rt est fix et on ne peut pas lui attribuer de probabilit sinon 1 ou 0 L interpr tation correcte de l intervalle de confiance 95 96 e
27. 923 a APA 1996 Task Force on Statistical Inference Re port Washington DC American Psy chological Association a Armstrong J S 20073 Significance tests harm progress in fo recasting International Journal of Fore casting 23 2 321 327 a Armstrong J S 2007b Statistical significance tests are unne cessary even when properly done and properly interpreted Reply to commen taries International Journal of Forecas ting 23 2 335 336 a Baillargeon G amp Rainville J 1978 Statistique appliqu e Tome 2 6e di tion Trois Rivi res Les Editions SMG a Bakan D 1966 The test of significance in psychological research Psychological Bulletin 66 423 437 a Berkson J 1942 Tests of significance considered as evi dence Journal of the American Statisti cal Association 37 325 335 a Black M 1972 Induction The encyclopedia of philoso phy New York MacMillan 4 169 181 a Carver R 1978 The case against statistical significance testing Harvard Educational Review 48 378 399 a Carver R 1993 The case against statistical significance testing revisited Journal of Experimen tal Education 61 287 292 a Chow S L 1998 Statistical significance Rationale va lidity and utility Behavioral and Brain Sciences 21 169 240 a Cohen J 1988 Statistical power analysis 2nd ed Hillsdale NJ Lawrence Erlbaum a Cohen J 1992 A pow
28. Cela est illusoire dans la mesure ou plusieurs autres mod les alternatifs sont possibles Rozeboom 1960 Lindsay 1995 Morgan 2003 Prenons l exem ple d une hypoth se de recherche selon laquelle la distribution de stock options des dirigeants accroit leur fid lisation L hypoth se nulle s exprime alors de la mani re suivante la distribution de stock options des dirigeants ne modifie pas leur fid lisation Un test de M n gement vol 13 no 2 2010 99 127 106 M n gement vol 13 no 2 2010 99 127 107 Ababacar MBENGUE difference des moyennes entre deux chantillons de dirigeants ayant re u et n ayant pas re u des stock options r v le ensuite un taux de fi d lisation nettement sup rieur pour les dirigeants ayant re u des stock options qui se traduit par une diff rence de moyenne statistiquement significative Le rejet de l hypoth se nulle vaudra ici acceptation ou du moins non rejet de l hypoth se de recherche qui tait celle de l accroissement de la fid lisation due l attribution de stock options Or plusieurs ph nom nes autres que l attribution de stock options l hypo th se de recherche peuvent tre l origine de la diff rence de moyen nes observ e par exemple un biais m thodologique ou une erreur de mesure ou encore des variables comme le type d entreprise l ancien net dans l entreprise ou le profil personnel des dirigeants Comme le signale Carver 1978 en
29. HO f xIH1 Ce rapport exprime sur la base des r sultats observ s les chances d une hypoth se relative ment l autre On peut ventuellement retenir HO ou H1 selon que ce rapport est sup rieur ou inf rieur une constante choi sie arbitrairement un par exemple si l on ne privil gie aucune hypoth se La m thode du rapport de vraisemblance pr sente l avantage de ne faire intervenir ni probabilit s a priori ni l ments non observ s Si le rapport de vraisemblance permet de juger de la force probante des donn es entre deux hypoth ses ponctuelles il est malheureusement tr s rare dans la pratique que le chercheur soit confront un tel cas Les m thodes bay siennes utilis e en tant que m thode d in f rence statistique la m thode bay sienne consiste calculer au moyen du th or me de Bayes la distribution a posteriori pour le param tre auquel on s int resse partir des donn es observ es d un mod le d chantillonnage associ des probabilit s a priori sur le param tre Plusieurs auteurs ont pr conis le remplacement des TSS classi ques fr quentistes par une approche bay sienne Edwards Lindman et Savage 1963 Rouanet 1996 Au contraire des TSS classiques fr quentistes l approche bay sienne concerne directement la proba bilit de v racit de l hypoth se de recherche Bakan 1966 Carver 1978 L approche bay sienne a t et est encore beaucoup cr
30. Starbuck 2009 Mais quel que soit le choix adopt par le chercheur pour l hypoth se de recherche HO ou H1 les difficult s demeurent si on identifie l hypoth se de recherche l hypoth se alternative cas classique alors comme d j voqu il suffit de choisir un chantillon suffisamment grand pour tre s r d ob tenir un r sultat favorable significatif si en revanche on identifie l hypoth se de recherche l hypoth se nulle on se trouve confront au dilemme suivant Cohen 1992 Poitevineau 1998 Martinez Pons 1999 monter un design de recherche tr s sensible par exemple en choisissant un grand chantillon c est se ramener au cas pr c dent de rejet presque certain de l hypoth se de recherche alors m me que celle ci peut constituer une tr s bonne approxi mation de la r alit voire la meilleure disponible monter un design de recherche tr s peu sensible par exemple en choisissant un petit chantillon c est permettre une corrobo ration facile et artificielle de l hpypoth se de recherche Faut il br ler les tests de signification statistique Probabilit de l hypoth se ou probabilit des donn es Les TSS fournissent une probabilit des donn es observ es condi tionnellement la v racit de l hypoth se nulle ou Pr Donn eslHO Pourtant ce qui int resse vraiment le chercheur c est plut t la proba bilit des hypoth ses HO et ou H1 conditionnellement aux donn e
31. ables pertinentes comme c est le cas pour les exp rimentations Par exemple une recherche peut avoir mis en vi dence une relation positive statistiquement significative entre l adoption d une technique particuli re de formation et la productivit du person nel Ce r sultat peut ne pas se reproduire dans d autres recherches tout simplement parce qu une variable aussi importante que la qualit du formateur n a pas t contr l e alors qu elle tait la v ritable cause de l am lioration de la productivit davantage que la technique de for mation elle m me Clairement rien dans la logique des TSS n autorise interpr ter un r sultat statistiquement significatif comme une indica tion directe de la probabilit de reproduction du r sultat Carver 1978 Un autre argument mis en avant par Armstrong 2007b nous inspire l illustration suivante supposons qu il existe une corr lation de 0 3 en tre l adoption d un plan de formation et l accroissement de la producti vit du personnel Si cinquante tentatives de r plication avaient lieu l aide de tests ayant une puissance de 50 une valeur raisonnable en sciences sociales alors environ la moiti des tentatives de r pli cation concluraient l existence d une corr lation et l autre moiti l absence de corr lation au seuil de 5 Dans ce cas un TSS effec tu sur une m ta analyse des 50 r plications conduirait conclure tort qu il n existe pas de corr latio
32. ant seule une enqu te quantitative permettrait de conna tre l tendue pr cise et la nature exacte du mal ou du risque par exemple quelles sont les erreurs les plus fr quentes dans la communaut des chercheurs en management et dans quelles circonstances y est on le plus expos Une telle enqu te pourrait porter sur les articles publi s ce qui a t la principale d marche adopt e jusqu ce jour dans les travaux conduits dans les autres champs disciplinaires mais galement sur les pratiques ou connaissances des chercheurs mesur es travers des entretiens ou par questionnaires En ce qui concerne cette secon de m thode la seule exception notre connaissance est l tude de Mittag et Thompson 2000 Cette seconde m thode d enqu te nous semble tr s importante au regard du r le croissant de la litt rature grise avec le d veloppement d Internet et des conf rences aca d miques avec ou sans publications d actes dans la diss mination des bonnes ou mauvaises pratiques de recherche Une deuxi me piste de recherche pourrait consister en la conduite de m ta analy ses permettant des comparaisons diachroniques et ou transversales c est dire entre champs disciplinaires sur un mode proche du travail effectu mais cela date de plusieurs d cennies d j par Morrison et Henkel 1970 Toutes ces grandes enqu tes quantitatives pourraient tre utilement combin es avec des tudes quali
33. cher 22 4 16 23 124 M n gement vol 13 no 2 2010 99 127 w Finch S Cumming G amp Thomason N 2001 Reporting of statistical inference in the Journal of Applied Psychology Little evidence of reform Educational and Psychological Measurement 61 181 210 a Fisher R A 1942 The design of experiments 3rd ed London Oliver amp Boyd a Gibbons J M Crout N M amp Healey J R 2007 What role should null hypothesis signifi cance tests have in statistical education and hypothesis falsification Trends in Ecology amp Evolution 22 9 445 446 a Gill J 1999 The Insignificance of Null Hypothesis Significance Testing Political Research Quarterly 52 3 647 674 a Gliner J A Morgan G A Leech N L amp Harmon R J 2001 Problems with null hypothesis signifi cance tests Journal of the American Academy of Child and Adolescent Psy chiatry 40 250 252 a Hagen R L 1997 In praise of the null hypothesis statistical test American Psychologist 52 15 24 a Harlow L L 1997 Significance testing introduction and overview In L L Harlow S A Mulaik amp J H Steiger Eds What if there were no significance tests pp 1 21 Ma hwah NJ Lawrence Erlbaum 125 Holt D L amp Morrow P C 1992 Risk assessment judgments of auditors and bank lenders A comparative analy sis of conformance to Bayes theorem Accounting Orga
34. d aller parfois au del du mim tisme basique et de l usage routinier des dispositifs les plus usit s un moment donn Concernant plus sp cifiquement les TSS nous avons certes conscience qu ils sont de nos jours un crit re important dans la s lection des articles soumis publication dans le sens ou un r sultat non significatif a g n ralement encore tr s peu de chances d tre publi Le faible nombre de r sultats non significatifs publi s peut d ailleurs aussi bien r sulter d une politi que ditoriale d lib r e que d une s lection ou autocensure op r e par les chercheurs eux m mes Dans tous les cas il s ensuit un tr s faible taux de publication de ces r sultats non significatifs Cette situation peut conduire des cons quences catastrophiques R fl chissons un moment au sc nario suivant plusieurs chercheurs testent ind pen damment les uns des autres une m me hypoth se nulle HO qui est vraie Environ 5 96 d entre eux trouveraient un r sultat significatif rejet de HO au seuil de 5 96 et seraient pratiquement les seuls m me de publier laissant ainsi croire la r alit du ph nom ne tudi rejet de HO On se retrouverait alors uniquement avec des r sultats faux dans la litt rature Et les tentatives de r plications effectu es par des cher cheurs peu audacieux ne feraient qu aggraver la situation seuls les r sultats statistiquement significatifs seraient nouveau s lectionn s Faut il
35. e quatri me erreur est de conclure la v racit de l hypoth se nulle en cas de r sultat non significatif Par exemple un chercheur examine l hypoth se de recherche selon laquelle la mise en place d un plan de formation augmente la performance du personnel Un test de dif f rence de moyennes le conduit observer des r sultats statistique ment non significatifs il n observe pas de diff rence statistiquement significative entre les groupes ayant suivi ou non un plan de formation I doit en conclure qu il ne peut pas rejeter l hypoth se nulle et ne doit surtout pas affirmer qu il accepte cette hypoth se nulle Encore une fois il peut simplement dire qu il ne peut pas refuser l hypoth se nulle En revanche il ne doit pas affirmer la mise en place d un plan de formation n augmente pas la performance du personnel Cela qui M n gement vol 13 no 2 2010 99 127 112 M n gement vol 13 no 2 2010 99 127 113 Ababacar MBENGUE vaut accepter l hypoth se nulle et signifie qu on conclut par inf rence l ensemble de la population l absence d effet sans se contenter de jugements descriptifs incontestables De m me la phrase la va leur O tant comprise dans l intervalle de confiance on ne peut pas re fuser l hypoth se nulle selon laquelle les deux s ries de valeurs ont la m me moyenne est correcte car il s agit d une description concernant les chantillons Cependant on ne doit pas
36. er primer Psychological Bulletin 112 55 159 a Cohen J 1994 The earth is round p lt 05 American Psychologist 49 997 1003 a Corless J C 1972 Assessing prior distributions for ap plying Bayesian statistics in auditing Accounting Review 47 556 566 M n gement vol 13 no 2 2010 99 127 a Cox D R 1958 Some problems connected with statis tical inference Annals of Mathematical Statistics 29 357 372 a Dawes R M 1991 Probabilistic versus causal thinking In D Cicchetti amp W M Grove Eds Thinking clearly about psychology Vol 1 Matters of public interest Essays in honor of Paul Everett Meehl pp 235 264 Minneapolis University of Minne sota Press a Dawes R M 1997 Qualitative consistency masquerading as quantitative fit In M L Dalla Chiara D Kees D Mundici amp J van Bentheim Eds Structures and norms in science pp 387 394 Dordrecht the Nether lands Kluwer Academic a Dodge Y 1993 Statistique Dictionnaire encyclop di que Paris Dunod a Edwards W Lindman H amp Savage L J 1963 Bayesian statistical inference for psy chological research Psychological Re view 70 193 242 a Falk R amp Greenbaum C W 1995 Significance Tests Die Hard Theory and Psychology 5 396 400 a Firestone W A 1993 Alternative arguments for generalizing from data as applied to qualitative re search Educational Resear
37. euses critiques les TSS conti nuent d tre aussi populaires qu employ s a mauvais escient Finch Cumming et Thomason 2001 Morgan 2003 De fait les multiples recherches effectu es dans des champs disciplinaires aussi divers que la psychologie la sociologie le marketing la comptabilit les scien ces de l ducation les sciences politiques l cologie la prospective la psychiatrie etc montrent de mani re constante que les chercheurs m connaissent les bases les plus l mentaires des TSS Nelson Ro senthal et Rosnow 1986 Zuckerman Hodgins Zuckerman et Rosen thal 1993 Mittag et Thompson 2000 Alors faut il oui ou non br ler les TSS Pour r pondre cette question nous allons d crire bri vement la logi que g n rale des TSS pr senter les principales critiques qui leur sont adress es puis proposer des recommandations permettant d am liorer le test d hypoth ses et au del la d marche d inf rence statistique dans la recherche en management LOGIQUE G N RALE DES TESTS DE SIGNIFICA TION STATISTIQUES INFERENCE ET STATISTIQUE La d marche d inf rence occupe une place centrale dans l activit du chercheur qui est fr quemment amen interpr ter des r sultats ti rer des conclusions ou proc der des g n ralisations partir de ses observations Par exemple dans quelle mesure les r sultats obtenus lors d une recherche sur un nombre limit de cas d individus de grou
38. faux du fait d une absence de coincidences il devient impossible de prouver que quelque chose est vrai Howell 1997 Krueger 2001 Morgan 2003 Fisher comme Hume et Pearson estime que l inf rence est fonda mentalement le seul processus permettant la d couverte de nouvelles connaissances Fisher 1942 Par cons quent l objectif du syst me d inf rence de Fisher est de tester et plus pr cis ment de r futer une hypoth se selon laquelle un traitement particulier a conduit des diff rences entre chantillons Mulaik et al 1997 Morgan 2003 Constitutive de l inf rence la supposition selon laquelle l avenir res semble au pass n est fond e sur aucun argument elle d rive simple ment de l habitude par laquelle nous sommes d termin s attendre pour l avenir le train de choses auquel nous avons t habitu s Hume 1978 Et comme le montre Morgan 2003 l analyse de donn es ex p rimentales conduit des inf rences sur la probabilit d v nements futurs lorsque les diff rences entre les conditions sont improbables sous l hypoth se nulle les chercheurs attribuent ces diff rences la stabilit des causes sous jacentes et s attendent donc observer de nouveau les m mes diff rences dans des circonstances similaires Faut il br ler les tests de signification statistique La d marche g n rale consiste a faire une hypoth se de base a ob server un ph nom ne r el et ensuite
39. ge Dans un test statistique portant sur une seule population on cherche savoir si la valeur d un param tre de la population est identique une valeur pr sum e L hypoth se nulle qui est dans ce cas une supposition sur la valeur pr sum e de ce param tre se pr sente alors g n ralement sous la forme suivante HO 6 60 Faut il br ler les tests de signification statistique o 0 est le param tre de la population estimer et 60 la valeur pr su m e de ce param tre inconnu 8 Quant l hypoth se alternative elle pose l existence d une diff rence ou d une in galit Par exemple on peut faire l hypoth se d une su p riorit de performance des entreprises qui planifient formellement Dans un tel cas le test statistique qui sera effectu est un test dit test unilat ral ou unidirectionnel droite Si l hypoth se tait celle d une inf riorit de performance des entreprises planificatrices il faudrait effectuer un test unilat ral ou unidirectionnel gauche Enfin si l hy poth se formul e devenait simplement celle d une diff rence de per formance sans autre pr cision il faudrait effectuer un test bilat ral ou bidirectionnel Il appara t ainsi que l hypoth se alternative peut prendre trois formes diff rentes H1 6 gt 00 unilat ral ou unidirectionnel droite H1 6 lt 00 unilat ral ou unidirectionnel gauche H1 00 bilat ral ou bidirectionnel Les tests statistiques
40. he main purpose of this paper is to provide researchers in management with clear information about the controversy surrounding statistical signifi cance tests to detail the content and issues and most importantly to offer recommen dations for improving the testing of hypotheses and beyond in other words the process of statistical inference in management research Keywords methodology inferential statistics statistical tests statistical significance 100 M n gement vol 13 no 2 2010 99 127 101 Ababacar MBENGUE INTRODUCTION D s leur introduction les tests de signification statistique TSS ont fait l objet de multiples critiques portant la fois sur leur nature et sur leur r le Et si quelques auteurs ont fourni une d fense parfois int ressante de ces tests Hagen 1997 Mulaik Raju et Harshman 1997 Wainer 1999 de nombreux autres ont appel a leur abolition pure et simple Hunter 1997 Gill 1999 Armstrong 2007a 2007b De fait peu de m thodes statistiques ont t aussi fortement et durablement criti qu es que les TSS Morgan 2003 C est ainsi que Rozeboom 1960 416 les a qualifi s de sophisme Bakan 1966 436 d exercice d insouciance dans la conduite de recherche Carver 1978 397 de forme corrompue de la m thode scientifique Krueger 2001 16 de m thode erron e et Schmidt et Hunter 2002 66 de d sas tre Pourtant en d pit de ces nombr
41. holls N 2001 The insignificance of significance tes ting Bulletin of the American Meteoro logical Society 82 981 986 a Nickerson R S 2000 Null Hypothesis Significance Testing A Review of an Old and Continuing Controversy Psychological Methods 5 2 241 301 e Nunnally J 1960 The place of statistics in psychology Educational and Psychological Measu rement 20 641 650 a Oakes M 1986 Statistical inference A commentary for the social and behavioral sciences New York Wiley a Poitevineau J 1998 M thodologie de l analyse des donn es exp rimentales tude de la pratique des tests statistiques chez les cher cheurs en psychologie approches nor mative prescriptive et descriptive Th se de Doctorat Universit de Rouen a Poitevineau J 2004 L usage des tests statistiques par les chercheurs en psychologie aspects nor matif descriptif et prescriptif Math mati ques et Sciences Humaines 167 5 25 a Reichenbach H 1951 The rise of scientific philosophy Berke ley University of California Press a Roberts H V 1963 Bayesian Statistics in Marketing Jour nal of Marketing 27 1 4 a Rozeboom W W 1960 The Fallacy of The Null Hypothesis Si gnificance Test Psychological Bulletin 57 5 416 428 a Rouanet H 1996 Bayesian methods for assessing impor tance of effects Psychological Bulletin 119 149 158 ea Sarkar S amp Sriram R
42. i et continuent d alimenter la critique des TSS Ces publications ont concern pratiquement tous les champs disciplinaires la statistique Berkson 1942 la psychologie Hunter 1997 la sociologie Selvin 1957 le marketing Sawyer et Peter 1983 la comptabilit Lindsay 1995 les sciences politiques Gill 1999 les sciences de l ducation Morgan 2003 la psychia trie Gliner et al 2001 la prospective Armstrong 20073 l cologie Anderson Burnham et Thompson 2000 Gibbons Crout et Healey 2007 la m t orologie Nicholls 2001 la communication Levine et al 2008 etc On remarque que la critique des TSS a connu un nouvel essor par tir de la deuxi me moiti des ann es 1990 et qu elle s est progressi vement tendue de la statistique la psychologie avant de traverser pratiquement tous les champs disciplinaires l exception notable du management qui commence tout juste soulever la question Mben gue 2007 Schwab et Starbuck 2009 C est pr cis ment de l qu est n e la motivation principale de cet article informer la communaut des chercheurs en management de l existence de cette critique des TSS en d tailler le contenu et les enjeux les dangers li s l usage irr fl chi des TSS et fournir des recommandations permettant d am liorer la d marche de test d hypoth ses et plus g n ralement la d marche d inf rence statistique dans la recherche en management Par ra
43. itiqu e comme une m thode trop subjective car elle n cessite de sp cifier des probabilit s a priori Toutefois le poids de la distribution a priori dans la distribution a posteriori diminue d autant que la masse des donn es s accroit Ainsi deux chercheurs partant de distributions a priori diff rentes s accorderont sur leurs conclusions si les donn es sont suffi santes Il est d ailleurs recommand de faire varier les distributions a priori position optimiste neutre pessimiste et d analyser la sensibilit des r sultats En fait les m thodes bay siennes semblent disposer de nombreux atouts pour s imposer comme v ritables challengers des TSS On trouve du reste de nombreux exemples d utilisation des m thodes bay siennes en sciences de gestion notamment en fi M n gement vol 13 no 2 2010 99 127 118 M n gement vol 13 no 2 2010 99 127 119 Ababacar MBENGUE nance Corless 1972 Holt et Morrow 1992 Sarkar et Sriram 2001 et en marketing Roberts 1963 Levitt 1972 La recherche d Albert Grenier Denis et Rousseau 2008 consacr e a l tude du risque ali mentaire est galement totalement pertinente pour les chercheurs en gestion Par ailleurs on constate que de plus en plus de logiciels statis tiques incorporent d sormais des modules d analyse bay sienne c est le cas par exemple du logiciel SPSS avec son programme Amos ou encore plus r cemment du logiciel MPLUS Au del de la
44. lement les principales voies d am lioration possibles QUELQUES VOIES D AMELIORATION Plusieurs voies d am lioration sont envisageables Une facon pratique de les aborder est de commencer par les recommandations du groupe de travail charg par le bureau des affaires scientifiques de l American Psychological Association APA d tudier le r le des TSS dans la re cherche en psychologie APA 1996 On pourra ensuite explorer des voies compl mentaires Les recommandations de l American Psychological Association Tests d hypoth ses il est difficile d imaginer une seule situa tion dans laquelle une d cision binaire d acceptation refus se rait pr f rable au fait de reporter les valeurs p ou mieux encore un intervalle de confiance Par ailleurs ne jamais utiliser l ex pression malheureuse accepter l hypoth se nulle Intervalles des intervalles devraient tre fournis pour toute grandeur d effet concernant les r sultats principaux Fournir de tels intervalles pour les corr lations et les indices d association ou de variation chaque fois que c est possible Grandeur des effets toujours pr senter les grandeurs d effets pour les r sultats bruts Si les unit s de mesure ont un sens pratique par exemple nombre de cigarettes fum es par jour pr f rer une mesure non standardis e coefficient de r gression ou diff rence de moyennes une mesure standardis e Puissance et taille de l chantillon
45. ll 1999 mettent en garde contre les affirmations erron es suivantes la probabilit que l hypoth se nulle soit vraie est p ou a la probabilit que les r sultats soient dus au seul hasard est p ou a la probabilit que l hypoth se alternative soit vraie est 1 p ou 1 a La valeur p seuil observ est calcul e en postulant que l hypoth se nulle est vraie c est dire que toute diff rence observ e est unique ment due au hasard Cette valeur p sert ensuite d cider du rejet ou du non rejet de cette hypoth se nulle postul e Par exemple un test de diff rence de scores moyens entre deux chantillons montre une diff rence de 10 points a laquelle est associ e une valeur p de 3 Cette valeur p de 3 signifie que si l hypoth se nulle est vraie c est dire si les populations ont en fait le m me score moyen il existe 3 chances sur 100 d observer une diff rence des scores moyens sup rieure ou gale 10 points et 97 chances sur 100 d obtenir une diff rence des Scores moyens inf rieure ou gale 10 points entre deux chantillons quelconques tir s de chacune des deux populations La valeur p porte donc clairement sur la probabilit des donn es la diff rence de scores moyens observ e et non sur la probabilit de l hypoth se nulle Les erreurs d interpr tation s expliquent par l cart entre ce que les utilisateurs attendent et ce que les tests fournissent Cohen 199
46. mort des TSS s appa renterait une sentence pour le moins excessive Maintenant on peut videmment reprocher un outil de ne pas tre suffisamment facile d utilisation ce qui pourrait finalement conduire un verdict interm diaire entre la peine capitale et l acquittement En fait la question de l opportunit de l incin ration des TSS est en soi plus int ressante que n importe quelle r ponse positive n ga tive interm diaire qui pourrait lui tre apport e En effet une telle question renvoie fondamentalement la place de l inf rence dans la d marche de recherche Seulement les TSS n ont pas le monopole de l inf rence statistique encore moins de la d marche d inf rence en g n ral C est pourquoi leur critique pouvait difficilement tre analys e en dehors d une r flexion plus g n rale sur la nature de l inf rence et son statut dans l activit des chercheurs ce qui a t esquiss dans le cadre de cet article Faut il br ler les tests de signification statistique Finalement notre texte se r v le moins iconoclaste que son titre ne le laisse pr sager Il peut tre lu comme une r ponse la question de savoir comment mieux utiliser les TSS A l analyse il n apparait pas v ritablement n cessaire de proscrire l usage de ces tests Tout juste faut il mettre en garde contre une facon irr fl chie et routini re d y re courir Alors que l utilisation de cet outil a d j fait l objet d
47. n statistiquement significative entre l adoption d une technique particuli re de formation et la productivit du personnel Faut il br ler les tests de signification statistique Significativit statistique et significativit substantielle Une troisi me erreur est de confondre la significativit statistique avec la significativit substantielle Sawyer et Peter 1983 Gliner Morgan Leech et Harmon 2001 Cela revient a consid rer que plus un r sultat est statistiquement significatif plus il est scientifiquement int ressant et ou plus l effet correspondant dans la population est grand Les d veloppements pr c demment consacr s la grandeur de l effet effect size et l effet de la taille de l chantillon sample size ont montr la diff rence entre les deux significativit s Rappelons apr s Carver 1978 qu un r sultat statistiquement significatif est litt ralement un r sultat dont la probabilit d occurrence est faible si l hypoth se nulle est vraie Or comme la significativit statistique d pend de la taille de l chantillon des diff rences triviales sont souvent interpr t es com me importantes lorsque la taille de l chantillon est tr s grande Par exemple supposons que la productivit des salari s soit mesur e sur une chelle allant de O 100 et qu on dispose de deux chantillons regroupant l un des salari s ayant suivi un plan de formation sp cifique et l autre des salari s
48. nd more information de Management Strat gique http Avww management aims com M n gement is the official journal of AIMS 2010 M n gement and the author s M n gement vol 13 no 2 2010 99 127 Faut il br ler les tests de signification statistique Ababaca r M B E N G U E Reims Management School ababacar mbengue univ reims fr La d marche d inf rence occupe une place centrale dans la recherche en management Tr s souvent le chercheur est amen tirer des conclusions ou proc der a des g n ralisations partir de ses observations ou de ses r sultats Dans certains cas la statistique peut lui permettre de le faire de mani re rigoureuse travers la statistique inf rentielle qui est la d marche d inf rence par laquelle le statisticien teste la g n rali sation d une information collect e sur un chantillon l ensemble de la population dont est issu cet chantillon Les tests statistiques sont ainsi au coeur de la statistique inf rentielle et par suite de la d marche d inf rence Pourtant depuis leur introduction les tests de signification statistique font l objet de critiques vives et r currentes portant aussi bien sur leur nature que sur leur r le Nickerson 2000 La critique des tests de signi fication statistique est pr sente depuis longtemps dans pratiquement tous les champs disciplinaires l exception notable du management qui commence tout juste aborder la question Mbengue
49. ndeur de l effet test effect size de ce qui provient de l effet taille de l chantillon sample size Dans tous les cas qu il s agisse du seuil de signification a ou de la valeur p la position du curseur qui va d terminer la fronti re entre ce qui est sta M n gement vol 13 no 2 2010 99 127 108 M n gement vol 13 no 2 2010 99 127 109 Ababacar MBENGUE tistiquement significatif et ce qui ne l est pas restera une position valeur arbitraire La grandeur de l effet La grandeur de l effet effect size mesure l amplitude ou la force de la relation entre deux ou plusieurs variables dans la population Par exemple une augmentation de 20 96 des primes vers es aux sala ri s peut se traduire par une augmentation de 30 de leur producti vit Les tests ont souvent n glig la grandeur de l effet Cohen 1988 1994 Schwab et Starbuck 2009 Or comme le souligne Poitevineau 1998 un r sultat statistiquement significatif n est qu une indication de l existence de l effet suppos alors qu un r sultat non statistiquement significatif n est qu un constat d ignorance Aller plus loin sur la seule base du test serait assimiler tort significativit statistique et grandeur de l effet En fait le chercheur est surtout int ress par la grandeur et la pr cision des effets Prenons l exemple de l hypoth se de recherche selon laquelle la formation professionnelle accro t la productivit des salari s
50. nizations and Society 17 6 549 559 a Howell D C 1997 Statistical methods for psychology 4th ed Belmont CA Duxbury a Hubbard R amp Bayarri M J 2003 Confusion over measures of evidence p s versus errors a s in classical sta tistical testing The American Statisti cian 57 171 178 a Hume D 1978 A treatise of human nature Glasgow Scotland William Collins original da tant de 1739 a Hunter J 1997 Needed A ban on the significance test Psychological Science 8 3 7 a Kanji G K 1993 100 Structural tests Thousand Oaks Sage a Kennedy M M 1979 Generalizing from single case studies Evaluation Quarterly 3 4 661 678 Krueger J 2001 Null Hypothesis Significance Testing American Psychologist 56 1 16 26 Ababacar MBENGUE a Levine T Weber R Hullett C Park H S amp Lindsey L 2008 A Critical Assessment of Null Hypothe sis Significance Testing in Quantitative Communication Research Human Com munication Research 34 2 171 187 a Levitt T 1972 Industrial Purchasing Behavior A Baye sian Reanalysis Journal of Business Administration 4 79 81 a Lindsay R M 1995 Reconsidering the Status of Tests of Significance An Alternative Criterion of Adequacy Accounting Organizations and Society 20 35 53 a MacNabb D 1972 David Hume The encyclopedia of philo sophy New York MacMillan 4 74 90
51. ouhaitent disposer de m thodes objectives et formalis es leur permettant de savoir si un jeu de donn es pr sente des variations al atoires ou syst matiques Et ils estiment important de ne pas devoir s en remettre leurs seules intuition et subjectivit pour d terminer la part d al atoire et de syst matique dans les donn es D s lors les TSS conf rent aux conclusions des chercheurs cette impression d objecti vit qui est chez eux un souci crucial La scientificit dans des disciplines comme le management qui souffrent plus ou moins d un complexe de non scientificit du moins par rapport des sciences plus dures l appa reillage math matique et le formalisme des TSS fournissent bon compte une apparence de scientificit En outre la rigueur des math matiques et l aura dont elles jouissent sont cens es diffuser sur l ensemble de la recherche assurant de facto sa validit Le renfort de Karl Popper les TSS offrent une grande res semblance avec l id e de Popper selon laquelle la d marcation entre nonc s scientifiques et non scientifiques est r alis e sur la base du caract re r futable ou non de ces nonc s Une hypoth se scientifique est une hypoth se qui peut tre empiri quement test e La th orie des TSS a ainsi pu b n ficier du succ s des id es de Popper Un confort assur et une conomie les TSS assurent un confort certain leurs utilisateurs Avec leur pouvoir de d
52. personne est membre de l AIMS 3 Donc elle ne parle tr s probablement pas francais Cet exemple avec sa conclusion absurde montre bien les limites de l inf rence statistique fond e sur les TSS Lorsque l hypoth se nulle est rejet e dans le cadre d un TSS cela sugg re simplement que les r sultats ne doivent pas tre attribu s au hasard Autrement dit cela sugg re qu il n y a pas rien selon l expression de Dawes 1991 252 Cette inf rence probabiliste est une d monstration par l absurde modus tollens Si l hypoth se nulle est vraie l existence de donn es ordonn es est improbable Si les donn es semblent improba bles alors l hypoth se nulle est probablement fausse Si l hypoth se nulle est fausse alors quelque chose de fondamental et autre que le hasard est probablement en ceuvre Chow 1998 Morgan 2003 Mais le probl me principal avec cette chaine d inf rence c est que les syllogismes ne sont pas valides lorsqu ils sont appliqu s l inf rence Trois critiques sont principalement avanc es Morgan 2003 Premi rement toute hypoth se ponctuelle est fausse et aucune don n e n est la limite n cessaire pour la rejeter Tukey 1991 Morgan 2003 Par cons quent l objectif des TSS doit tre autre chose que le M n gement vol 13 no 2 2010 99 127 114 M n gement vol 13 no 2 2010 99 127 115 Ababacar MBENGUE seul rejet d hypoth ses nulles Deuxi mement m me si l
53. pport l article de Schwab et Starbuck 2009 notre texte mobilise une litt ra ture plus large offre une discussion approfondie de l inf rence r orga nise les probl mes pos s par les TSS en trois types statistique techni que et philosophique fournit plusieurs exemples li s au management M n gement vol 13 no 2 2010 99 127 120 M n gement vol 13 no 2 2010 99 127 121 Ababacar MBENGUE et propose au chercheur de nombreuses recommandations concr tes organis es en trois cat gories le suivi des recommandations de l APA l usage de m thodes statistiques compl mentaires ou alternatives aux TSS et le retour aux qualit s fondamentales du chercheur Il existe un accord g n ral sur les dangers de l usage des TSS Un premier danger pour le chercheur utilisant les TSS serait d ignorer leur mode d emploi c est dire leurs conditions d utilisation Ce dan ger devient particulierement menagant compte tenu de la disponibilit croissante des logiciels statistiques Un autre danger pour le chercheur consisterait s abriter derri re l image scientifique des tests statisti ques c der leur aura et au confort apparent li leur utilisation pour abdiquer sa responsabilit Or c est le chercheur qui doit choisir S il teste ou pas ce qu il teste et par quel moyen il le teste Mais plus encore le chercheur doit garder l esprit que les TSS ne sont qu un instrument l int rieur d un dispositif et d une d
54. re une r f rence incontournable L auteur a d fini des conventions qui au fil des ann es sont pratique ment devenues des normes universelles petit effet 0 20 moyen effet 0 50 grand effet 0 80 Pourtant la lecture attentive de l ouvrage permet de d couvrir que l auteur met en garde contre cette situation et qu il demande aux chercheurs de d finir eux m mes la taille de l effet Les valeurs choisies n ont pas plus de fiabilit comme base que ma propre intuition Elles sont fournies comme convention parce qu elles sont n cessaires dans un climat de recherche caract ris par un man que d attention pour tout ce qui concerne la grandeur de l effet Co hen 1988 532 Faut il br ler les tests de signification statistique DES PROBLEMES D ORDRE TECHNIQUE DE FRE QUENTES ERREURS A L USAGE Au del de leurs d fauts intrins ques on reproche aux TSS d tre la source d erreurs fr quentes commises par les chercheurs m me si on pourrait estimer que ces derniers sont le plus bl mer Voici les principales erreurs rencontr es Sawyer et Peter 1983 Poitevineau 2004 Le renversement des conditions Une premi re erreur la plus typique et que nous avons d j voqu e est de consid rer la valeur p seuil observ ou a comme une proba bilit concernant l hypoth se Pr HOIDonn es et non plus condition nelle celle ci Pr Donn eslHO De nombreux auteurs Cohen 1994 Poitevineau 1998 Gi
55. s observ es Pr HOlDonn es ou Pr H1lDonn es Cette position peu naturelle et peu intuitive conduit du reste des erreurs d interpr tation constantes comme le mentionnent plusieurs auteurs Carver 1978 Cohen 1994 Gill 1999 De nombreux utilisateurs interpr tent ainsi les r sultats observ s Pr Donn eslHO comme la probabilit condi tionnelle de l hypoth se nulle savoir Pr HOlDonn es Pourtant les valeurs de ces deux probabilit s peuvent tre tr s diff rentes l une de l autre par exemple 0 005 et 0 82 dans un cas c l bre d crit par Falk et Greenbaum 1995 Consid rons l exemple d une recherche visant tester l hypoth se selon laquelle la pr sence d un service de pla nification strat gique dans les PME am liore la performance de ces derni res L erreur consisterait confondre les deux probabilit s sui vantes 1 Pr Performance sup rieure Pr sence d un service de planification strat gique qui est la probabilit d observer une perfor mance sup rieure en cas de pr sence d un service de planification strat gique dans la PME 2 Pr Pr sence d un service de planification strat gique Performance sup rieure qui est la probabilit de la pr sence d un service de planification strat gique dans une PME pr sen tant une performance lev e Or ces deux probabilit s peuvent bien entendu tre tr s diff rentes a est arbitraire la valeur p est ambigue Le seuil de signification a retenu
56. ser Parce que le savoir doit contenir des pr visions fiables Reichenbach 1951 89 nous agissons comme si nous avions r solu le probl me de l induction Dawes 1997 387 Il est int ressant de constater que c est une r flexion sur les TSS qui permet de re d couvrir que l activit du chercheur au sein de laquelle la d marche d inf rence occupe une place centrale exige fondamen talement des actes de foi Hume 1978 Reichenbach 1951 Dawes 1997 Krueger 2001 Car le recours aux TSS et plus g n ralement la pr occupation de g n ralisation statistique rel vent essentiellement d une certaine conception plut t positiviste de la science qui reste discutable si l on envisage la recherche en management comme une Science historique ayant pour objectif de rendre intelligible une cer taine cat gorie de ph nom nes sans pr tendre identifier des lois qui les gouverneraient Dans cette optique le principal int r t de la r flexion sur les TSS reste bien de faire appara tre ces derniers comme un outil ordinaire d inf rence Tout cela renvoie aux qualit s id ales du chercheur en management et sa capacit de trouver un quilibre toujours fragile parce que dynamique entre d une part audace vo lont d invention de cr ation de d couverte et d autre part prudence h sitation doute humilit et respect des donn es de l exp rience sen sible qui inspire et
57. sont effectu s dans le but de prendre une d ci sion en l occurrence rejeter ou ne pas rejeter l hypoth se nulle HO Mais parce que la d cision est fond e sur une information partielle issue d observations portant sur un chantillon de la population elle comporte un risque d erreur Baillargeon et Rainville 1978 Sincich 1996 Zikmund 1994 On distingue deux types d erreurs dans les tests statistiques l erreur de premi re esp ce dont la probabilit est not e a et l erreur de seconde esp ce dont la probabilit est not e f Les observations de l chantillon peuvent conduire rejeter l hypoth se nulle HO alors que la population remplit effectivement les conditions de cette hypoth se Le risque de premi re esp ce a mesure cette probabilit de rejeter l hypoth se nulle HO alors qu elle est vraie Inver sement les observations de l chantillon peuvent conduire ne pas rejeter l hypoth se nulle HO alors que la population remplit les condi tions de l hypoth se alternative H1 Le risque de seconde esp ce f mesure cette probabilit de ne pas rejeter l hypoth se nulle HO alors qu elle est fausse Une erreur de premi re esp ce ne peut survenir que dans les cas ou l hypoth se nulle est rejet e De m me une er reur de seconde esp ce ne peut avoir lieu que dans les cas ou l hy poth se nulle n est pas rejet e Par cons quent soit le chercheur ne commet pas d erreur soit il en commet mais d un seul type Il
58. st la suivante 95 96 des intervalles calcul s sur l ensemble des chantillons possibles tous ceux qu il est possible de tirer dans la population contiennent la vraie valeur m Chaque intervalle particulier a une probabilit O ou 1 de contenir la vraie valeur Ici ce n est pas le param tre qui est al a toire mais les bornes de l intervalle de confiance ou fourchette qui varient d un chantillon l autre La probabilit de reproduction du r sultat Une deuxi me erreur est de consid rer 1 p ou 1 a comme la pro babilit de reproduire le r sultat observ Falk et Greenbaum 1995 Poitevineau 1998 Gill 1999 Les th ories traditionnelles des tests ne fournissent aucune indication de la probabilit de reproduire le r sultat observ Cette reproductibilit peut tre envisag e de deux mani res soit elle ne concerne que la significativit du r sultat c est le cas le plus courant ce qui donne un nonc du type la proba bilit qu une r plication soit significative est 1 p ou 1 a soit la reproductibilit concerne la valeur m me de l effet il y a 95 de chances d observer un m me r sultat dans les tra vaux ult rieurs Ces nonc s sont bien entendus erron s m me s il est exact que plus le seuil observ p est faible et plus la reproductibilit est assur e En fait la reproductibilit des r sultats d pend essentiellement de la contr labilit des vari
59. tatives fines dans le but d aboutir des diagnostics pr cis pouvant conduire des pistes M n gement vol 13 no 2 2010 99 127 122 M n gement vol 13 no 2 2010 99 127 123 Ababacar MBENGUE de th rapies efficaces Nous esp rons que de nombreux chercheurs exploreront ces pistes importantes Mais surtout nous esp rons qu ils le feront en mobilisant leurs qualit s fondamentales de chercheurs l esprit critique le refus du mim tisme le culte du doute la cr ativit et la pers v rance Ababacar MBENGUE est professeur l universit de Reims et Reims Management School Ses th mes de recherche sont le management strat gique et le renforcement des capacit s des organisations la gestion des connaissances et la m thodologie Il a t professeur visitant Wharton Snider Enterpreneurial Center et l Universit d Orel Russie Faut il br ler les tests de signification statistique REFERENCES a Albert l Grenier E Denis J B amp Rousseau J 2008 Quantitative Risk Assessment from Farm to Fork and Beyond A Global Bayesian Approach Concerning Food Borne Diseases Risk Analysis 28 2 557 571 a Alexander P 1972 Karl Pearson The encyclopedia of phi losophy New York Macmillian 6 68 69 a Anderson D R Burnham K P amp Thompson W L 2000 Null Hypothesis Testing Problems Pre valence and an Alternative Journal of Wildlife Management 64 4 912
60. treprises cot es Paris cette fin ils proc dent un test statistique pour v rifier dans quelle me sure avec quel risque d erreur la corr lation observ e sur l chantillon de soixante entreprises peut tre g n ralis e l ensemble de la po pulation des entreprises cot es Paris Pr cis ment cette d marche de test d hypoth se permet de d terminer la probabilit qu un r sultat gal ou sup rieur celui qui a t obtenu sur l chantillon soit d uni quement au hasard de l chantillonnage Elle conduit donc valuer le risque d erreur d effectuer une g n ralisation abusive du r sultat de l chantillon pour la population LA CRITIQUE DES TESTS DE SIGNIFICATION STATISTIQUE Fondamentalement les TSS posent trois types de probl mes 1 sur le plan statistique ils pr sentent des faiblesses intrins ques qui sont trop souvent ignor es 2 sur le plan technique l usage dominant de ces outils est g n ralement inad quat 3 sur le plan philosophique ils po sent le probl me plus g n ral des limites de l inf rence et reposent in fine sur la conviction ind montrable que la connaissance du pass per met de pr dire l avenir Cox 1958 Krueger 2001 Morgan 2003 DES PROBLEMES D ORDRE STATISTIQUE Une hypoth se vraiment nulle Plusieurs minents statisticiens ont reconnu de longue date que l hy poth se nulle d absence de diff rence n est jamais vraie dans la popu lation Nunnally
61. u elle permet au chercheur de tester la g n ralisation d une information collect e sur un chantillon l en semble de la population dont est issu cet chantillon Cette inf rence statistique mobilise deux classes d outils d une part les m thodes de test qui seront examin es dans cet article et d autre part les m thodes d estimation ponctuelle et par intervalle dont la pr sentation sort du cadre de notre propos En tout tat de cause toute g n ralisation statistique des r sultats d une recherche n a de sens qu en des termes probabilistes Cela si gnifie que l inf rence statistique ne conduit jamais des jugements certains mais au contraire uniquement des jugements plus ou moins probables Cela signifie aussi qu elle ne peut pas liminer compl te ment le risque d erreur associ au choix de conf rer un ph nom ne une validit qui d passe le contexte restreint dans lequel il a t obser v Pour autant la d marche d inf rence statistique garde un int r t tout fait r el dans la mesure o elle peut contr ler ce risque d erreur Plus exactement elle parvient en faire une estimation th oriquement pr cise indiquant au chercheur la probabilit qu il a de se tromper en g n ralisant les conclusions de son tude cette fin l inf rence sta tistique fait appel la statistique descriptive et la th orie des probabi lit s dont l objet est l tude des lois et des r gularit s qui r gissent
62. une abon dante r flexion critique dans la plupart des disciplines scientifiques ce n est malheureusement pas le cas dans le domaine du management L essentiel du texte vise donc alerter les chercheurs en management Sur les trois types de probl mes statistique technique philosophi que pos s par ces TSS L article en appelle donc une utilisation plus rigoureuse plus consciente plus r fl chie et plus critique de ces tests tout en sugg rant de recourir l occasion d autres m thodes statistiques en l occurrence les m thodes bay siennes ainsi que les m thodes d estimation ponctuelle ou par intervalle Bien entendu notre recherche n a pas puis toutes les questions po s es par l usage des TSS Plusieurs pistes de recherche future sont ouvertes Une premi re piste consisterait mener une grande enqu te quantitative sur les pratiques des chercheurs en management Cer tes on peut trouver raisonnable l hypoth se selon laquelle le champ du management aurait peu de raisons de diff rer de l ensemble des autres champs disciplinaires au sein desquels les enqu tes effectu es ont jusqu ce jour produit des r sultats constants quant la pr valen ce g n ralis e d erreurs dans l usage des TSS Certes galement de nombreux l ments qualitatifs nous sugg rent que peu de chercheurs en management ont r ellement connaissance de l existence et en core moins de la teneur de la critique des TSS Cepend
63. ypoth se alternative H1 ou Ha On notera que les tests statistiques sont concus pour la r futation et non la confirmation d hypoth ses En d autres termes ces tests n ont ni l ambition ni le pouvoir de prouver des hypoth ses ils permettent de montrer qu une hypoth se ne peut pas tre accept e parce qu elle est associ e un niveau de probabilit trop faible Kanji 1993 M me s ils sont g n ralement pr sent s comme une th orie unifi e les TSS sont en fait une hybridation de deux paradigmes concurrents celui du test de signification de Fisher et celui du test d hypoth se de Neyman et Pearson Hubbard et Bayarri 2003 La distinction entre ces coles de pens e concurrentes ne semble pas avoir occup un grand r le dans le d bat sur l utilisation des TSS bien que certains auteurs expliquent une grande part des limites des TSS par cette hybridation originelle Harlow 1997 Gill 1999 Hubbard et Bayarri 2003 TESTS ET ERREURS STATISTIQUES L valuation de la validit d une hypoth se statistique se fait au moyen d un test statistique effectu sur des donn es issues d un chantillon repr sentatif de la population tudi e Ce test statistique est une proc dure permettant d aboutir en fonction de certaines r gles de d cision au rejet ou au non rejet d une hypoth se de d part en l occurrence l hypoth se nulle La forme des tests statistiques d pend du nombre de populations concern es une deux ou davanta
Download Pdf Manuals
Related Search
M@n@gement management management styles management studio management concepts management skills manajemen dapodik management team responsibilities management of carotid artery dissection
Related Contents
TC-E, EX - DIA 3 installation of indoor unit Guía del Usuario プリント柄ピッチ付折りたたみ式杖 取扱説明書 Copyright © All rights reserved.
Failed to retrieve file