Home

Régression linéaire

image

Contents

1. R gression lin aire Le but d une r gression lin aire est de trouver la meilleure relation affine entre deux s ries statistiques Motivation On poss de deux s ries statistiques de donn es entre lesquelles on veut trouver ou v rifier une relation Il est tr s facile de v rifier qu une relation est lin aire entre deux s ries En revanche 1l est difficile de savoir si une relation est logarithmique parabolique L id e est donc de construire des s ries de donn es partir des deux s ries d origine et de v rifier que le lien entre ces deux nouvelles s ries est lin aire Il faut toutefois bien s r avoir une id e de la relation construire Il y a donc plusieurs tapes e deviner la relation entre les deux s ries statistiques et ventuellement calculer les nouvelles s ries n cessaires e effectuer une r gression lin aire entre ces deux s ries e v rifier si elle est de bonne qualit si c est le cas on pourra consid rer que la relation est effectivement correcte sinon c est que la relation de d part n tait pas bonne On va expliquer tout d abord le principe d une r gression et dire comment on peut quantifier sa qualit puis on donnera quelques infos sur les calculatrices Enfin on donnera un exemple et une petite liste d erreurs classiques Principe S1 on place dans un plan les points correspondants aux couples form s par les deux
2. La r gression donne Hauteur 2 1 Temps 0 7 avec un coefficient de r gression r 0 999 La droite est donc de bonne qualit et la r gression valid e Remarque Inutile de donner trop de chiffres significatifs puisque de toutes fa ons la droite est une approximation du nuage de points Deux ou trois CS seront donc largement suffisants Exemple 2 tout n est pas lin aire t 0712137169 12715 18 Ici le nuage n est visiblement pas lin aire Il ressemble plus un nuage exponentiel On va donc faire l hypoth se que la concentration en diiode est une fonction exponentielle du temps On aurait donc une relation du type I gt a e Comme on cherche une droite on peut valuer le logarithme de la concentration en diiode puisque In I In a b t qui est bien une relation lin aire si toutefois notre hypoth se est correcte bien s r Attention cependant dans ce cas la r gression nous donnera comme pente b et comme ordonn e l origine In a On construit alors une ligne suppl mentaire au tableau en divisant la concentration de diiode par une concentration de r f rence Co 1mol L afin d assurer l homog n it On effectue alors la r gression entre cette ligne et celle du temps N h sitez pas ajouter cette ligne suppl mentaire lorsque vous effectuez une r gression En cas d erreur vous trouverez plus facilement si vous avez gard une trace de ce calcul interm diaire
3. e TI Ouvrir l diteur de donn es via STAT EDIT 1 On arrive dans l diteur le curseur tant positionn sur la cellule L1 1 Il suffit de taper les valeurs dans les diff rentes cellules les valeurs de x dans la colonne L1 et celles de y dans L2 Ouvrir l diteur de graphes avec 2nd STAT PLOT 1 Valider l option On puis choisir le type de points par exemple le nuage trac discontinu Entrer les listes correspondant aux abscisses et aux ordonn es Llet L2 Choisir le type de marque par exemple la bo te carr Afficher automatiquement les points sur la totalit de l cran en r glant le zoom ZOOM 9 Revenir dans l diteur de donn es avec STAT et choisir le mode calcul par CALC Si les points sont peu pr s align s on choisit comme mod le la r gression lin aire S LinReg ax b et on pr cise abscisses et ordonn es L1 L2 Pour visualiser la droite de r gression il faut passer par Y CLEAR puis VARS 5 Statistics et s lectionner EQ 7 RegEQ Le retour l cran graphique par GRAPH permet de retrouver les points exp rimentaux et la droite de r gression 1l est possible de se d placer sur chacune des repr sentations gr ce TRACE associ e aux touches du curseur Exemple 1 quand tout va bien Temps 8 Hauteur m 31 307 48 393 Apr s avoir rentr les donn es on peut d j voir que le nuage ressemble une droite
4. que la qualit de la r gression est lev e On consid rera que la droite est de bonne qualit si on a au moins deux ou trois 9 apr s le 0 pour r ou r Ainsi la qualit sera suffisante si r gt 0 99 ou mieux 0 999 ou r lt 0 99 voire 0 999 si r est n gatif L emploi de r l ve toute ambigu t sur ce dernier point Une valeur de r 0 97 n est en effet pas suffisante pour dire que la r gression est correcte on fera le test plus loin Diff rents types de calculettes Chacun doit savoir effectuer une r gression avec sa calculatrice et chacun est responsable de la ma trise de sa propre calculatrice Voici quelques infos mais bien s r non exhaustives y compris pour chaque marque En cas de besoin lisez votre mode d emploi e Casio On va dans le menu STAT et on rentre les deux s ries statistiques dans une liste pour chaque s rie On peut d j regarder le nuage en tapant GRAPH puis en choisissant un GPHI par exemple Appara t alors sous le graph un menu si on veut une r gression en X on appuie sur la case X justement Une fen tre LinearReg donne alors les valeurs de a b et r en pr cisant l quation trac e Attention Une erreur classique est de ne pas avoir dit entre quelles s ries on effectuait la r gression Cela se r gle lorsque l on appuie sur GRAPH et qu on choisit le bouton SET qui permet de dire quelle liste joue le r le de x et laquelle joue le r le des y
5. s ries statistiques F Meilleure droite fournies on obtient ce qu on appelle un nuage de Ve points Effectuer une r gression lin aire entre les deux s ries consiste trouver la droite qui passe au plus pr s de l ensemble de ses points La calculette cherchera ainsi toujours l quation d une droite m me si visiblement cela n a aucun sens par exemple si le lien semble tre exponentiel on obtiendra quand m me une quation elle sera de mauvaise qualit toutefois Mais la notion de meilleure droite est subjective Comment d terminer ce qu est une bonne droite Il y a de nombreux crit res existants le plus courant tant celui des moindres carr s tr s souvent utilis notamment en SI Pour cela on cherche une droite d quation y ax b o x et y sont les deux s ries statistiques et on value l erreur commise entre le point r el et le point de m me abscisse ou ordonn e sur la droite Puisque l erreur commise est tant t positive tant t n gative et est de Minimisation de la somme plus en g n ral al atoire la moyenne de ses erreurs des carr s de ces sera souvent nulle la somme des erreurs est donc d viations verticales une mauvaise id e L astuce consiste retenir comme grandeur la somme des carr s des erreurs on ajoute ainsi des grandeurs positives et c est cette grandeur que l on va chercher minimiser d o l appellation de crit re des moindres carr
6. On trouve effectivement une droite de pente In L 2 92 0 21 t soit a 18 5 et b 0 21 La qualit est correcte car r 0 998 on a deux 9 apr s la virgule Erreurs classiques e Attention l erreur classique qui est l change de liste la r gression ne s effectuant pas dans le bon ordre alors voire entre deux listes qui ne correspondent pas ce que vous voulez e Il faut TOUJOURS donner la valeur de r ou r car sinon on ne justifie en rien le fait que la droite soit valable ou pas Ne donnez pas trop de CS non plus n oubliez pas que l on cherche approximativement une droite qui passe par des points exp rimentaux ca fait beaucoup pour donner 6 CS tout a e Si vous chercher faire une r gression sur une relation non lin aire prenez le temps de faire appara tre les transformations qui font appara tre une loi lin aire et de construire les lignes donnant la ou les deux nouvelles s ries sur lesquelles vous allez faire votre r gression En voulant aller trop vite vous pourriez rater la forme que vous cherchez
7. s Le calcul math matique permet alors de calculer trois l ments la pente de la droite a son ordonn e l origine b et le coefficient de r gression ou de corr lation r compris entre 1 et 1 ou parfois r compris entre 0 et 1 fatalement C est la calculatrice qui effectue cette op ration m me si les calculs ne sont en fait pas tr s compliqu s et font intervenir des grandeurs statistiques caract ristiques des deux s ries Mais cela d passe le cadre du cours Remarque il est possible de chercher des relations plus compliqu es entre par exemple plus de deux s ries statistiques on parle alors de r gression multiple mais c est tr s au del de nos besoins en pr pa Interpr tation des coefficients r et r qualit d une r gression a y est la calculatrice nous a donn une relation affine entre nos deux s ries mais on ne sait pas encore si c est une droite de bonne qualit car rappel la calculatrice vous trouvera toujours une relation affine mais celle ci sera peut tre catastrophique et ne collera pas du tout avec les donn es La calculette r pond votre question quelle est la meilleure droite passant dans ce nuage de points mais elle vous dit galement voil la droite mais bon c est un peu idiot car ce n est pas une bonne droite pour un tel nuage c est pas terrible l aide du coefficient r ou r Ce dernier est d autant plus proche de 1

Download Pdf Manuals

image

Related Search

Related Contents

HP H35000 User's Manual  AeO depliant_2009.indd  Tecumseh AJA9484EXD Drawing Data  CyberPower PR1500LCDRT2U uninterruptible power supply (UPS)  Español - Florida SHOTS  REGOLAMENTO IGIENE - Gazzetta Amministrativa  取扱説明書  TAFCO WINDOWS NU2-344S-I Instructions / Assembly  マルノコ 取扱説明書  発売概要  

Copyright © All rights reserved.
Failed to retrieve file