Home

[halshs-00287786, v1] Visualisation interactive et réexpression des

image

Contents

1. Cadre 7 sym trique du cadre 3 R partition des pays suivant le taux d accroissement en ordonn es et le taux de natalit en abscisses Cadre 8 sym trique du cadre 6 R partition des pays suivant le taux d accroissement en ordonn es et le taux de mortalit en abscisses Cadre 9 Les valeurs extr mes du taux d accroissement sont 0 2 et 4 0 halshs 00287786 version 1 12 Jun 2008 Le Line Plot Le Line Plot ou trac de donn es reli es par des lignes est adapt la repr sentation des s ries temporelles L utilisation de la couleur ou de trac s diff rents facilitera la visualisation en cas de prise en compte d une troisi me dimension d termin e par une variable nominale cas du deuxi me exemple ci dessous Nombre d enfants mort n s en Belgique de janvier 1841 d cembre 1843 456 F R E Q M T R T JU JU Ju MAR1S841 SEP1841 APR1842 OCT1842 MAY1843 DATE Nombre mensuel d enfants mort n s en Belgique ann es 1841 1843 MORT42 BU HORT43 MORTA41 6 halshs 00287786 version 1 12 Jun 2008 Le Rotating Plot Le Rotating Plot ou graphique dynamique de rotation en 3 dimensions permet de rep rer d ventuelles structures qui ne sont ni visibles sur des graphiques statiques ni d tectables par des m thodes analytiques De ce point de vue l exemple ci dessous pourrait para tre assez mal choisi puisque l on s y int resse la r partition de nos 173 pays sui
2. fm rique Asie Europe Oc anie Continent Bar Chart et Mosaic Plot La fa on dont se r partissent les observations selon les valeurs d une variable nominale ici la r partition des pays suivant le continent peut tre repr sent e au moyen d un Bar Chart ou d un Mosaic Plot Bar Chart JL TT m rique Europe Oc anie continent halshs 00287786 version 1 12 Jun 2008 Mosaic Plot cont inent Une autre utilisation possible du Mosaic Plot quivalent visuel de la proc dure Proc Freq de SAS est la repr sentation des croisements entre deux variables nominales Ainsi le graphique ci dessous permet de visualiser la fa on dont se r partissent les 173 pays observ s selon le continent et le PNB grossi rement d coup en 3 modalit s haut bas non r ponse Orr D ZTU cont inent Le Scatter Plot Le Scatter Plot ou diagramme de dispersion permet tout la fois d appr cier le type de liaison lin aire ou autre pouvant exister entre deux variables de diagnostiquer une ventuelle h t rosc dasticit de rep rer les groupes clusters et les observations atypiques outliers Le Scatter Plot ci dessous visualise la fa on dont se r partissent les 173 pays observ s suivant le taux de natalit et le taux de mortalit Y a t ajout e une troisi me dimension via l utilisation de cinq marqueurs diff rents rep rant le continent d appartenance des pays on peut ainsi remarquer une forte co
3. matrice de diagrammes de dispersion mettant en oeuvre la proportion des moins de 15 ans celle des plus de 65 ans et le taux de f condit nombre d enfants par femme Si l on s lectionne en les encadrant les quatre observations atypiques du Box Plot on voit imm diatement se surimprimer la position des pays en question sur le Bar Chart et les diagrammes de dispersion effet loupe ils sont situ s en Europe le taux de f condit et la proportion des moins de 15 ans y sont particuli rement faibles la proportion des plus de 65 ans y est particuli rement lev e 6 5 Afrique s 1e fm rique Europe Oc anie continent 4 1 13 AGE65 5 6 E us JE mr 5 1 15 prop 6La il prop 65ans halshs 00287786 version 1 12 Jun 2008 R expression des donn es On a vu dans l article AED mode d emploi l un des fondamentaux de l analyse exploratoire des donn es est la transformation ou r expression des variables l op ration pouvant en particulier permettre de sym triser une distribution ou encore de lin ariser une liaison Avec SAS insight il est possible de directement transformer une variable partir d une repr sentation graphique sans qu il soit n cessaire de revenir au tableur Soit par exemple la fen tre ci dessous dans laquelle nous avons regroup deux Box Plots le premier relatif la distribution du PNB le second la distribution du taux d urbanisation et le Scatter Plot pr sentant
4. IN PN T halshs 00287786 version 1 12 Jun 2008 Pa a s Manuscrit auteur publi dans Courrier des Statistiques INSEE 90 1999 25 31 Visualisation interactive et r expression des donn es avec SAS Insight La premi re partie du menu Analyze de SAS Insight propose sept types de graphiques diff rents La fa on dont se distribue une variable sera repr sent e sous forme d un histogramme ou d un Box Plot si la variable en question est une variable d intervalle par un Bar Chart ou un Mosaic Plot s il sagit d une variable nominale Le Line Plot et le Scatter Plot diagramme de dispersion ou nuage de points permettent de visualiser la fa on dont se r partissent les observations suivant deux variables distinctes le Line Plot tant plus particuli rement adapt la repr sentation d une s rie temporelle Enfin la fa on dont se r partissent les observations suivant trois variables distinctes peut tre visualis e au moyen d un Rotating Plot diagramme de rotation l exception des Line Plots la totalit des graphiques pr sent s dans cet article ont t r alis s partir d une m me table SAS incluant 173 observations en l occurrence 173 pays et 25 variables en particulier les taux de natalit NAT et de mortalit MORT pour 1 000 habitants le taux d accroissement naturel annuel de la population ACCR en le taux de f condit ou nombre d enfants par femme FERTI la part en de la populati
5. indique la position de la moyenne valeur 11 21 Sa grande diagonale de longueur 2 6 permet d appr cier la valeur de l cart type 1 Le coefficient appliqu Q3 Q1 est param trable halshs 00287786 version 1 12 Jun 2008 Histogramme F j E Q T E n C r 12 15 18 21i 24 27 JB tx mortalit Box Plot tx mortalit Red coupage d un histogramme Avec SAS Insight il est tr s simple et tr s rapide gr ce la souris de modifier le d coupage en classes de la variable tudi e L effet sur l allure de l histogramme peut tre surprenant comme le montre l exemple ci dessous relatif la distribution du taux de natalit pour 1 000 habitants JL T TT UV JIATLCEITsT i 15 26 25 39 35 48 45 56 55 23 25 34 29 23 29 tx natalit tx natalit halshs 00287786 version 1 12 Jun 2008 Juxtaposition de Box Plots Les 173 pays observ s ont t r partis en 5 groupes selon le continent Les 5 Box Plots juxtapos s ci dessous ici en mode vertical repr sentent la distribution du taux de f condit nombre d enfants par femme dans les diff rents continents Particuli rement efficace ce type de pr sentation permet d appr cier en un coup d oeil la fa on dont se distribue une variable d intervalle en fonction des modalit s d une variable nominale En outre il constitue une excellente introduction visuelle l analyse de la variance Ts et I Q 0 Ts T a Afrique
6. la fa on dont se r partissent les 173 pays observ s suivant ces deux m mes variables halshs 00287786 version 1 12 Jun 2008 S lectionnons le libell de variable PNB sur le premier Box Plot ou le Scatter Plot et transformons cette variable en son logarithme logPNB par l interm diaire du menu Edit Variables On obtient imm diatement la repr sentation transform e r sultante sur laquelle on va pouvoir constater d une part que la distribution de logPNB est quasi sym trique d autre part qu il semble y avoir une liaison lin aire entre cette variable et le taux d urbanisation 6H He tx urbanisation tx urbanisation 26 464 6H SE 146 _ _ _ _ t_ a S S _ _ _ _ Sophie DESTANDAU et Monique LE GUEN Cet article a t publi dans DESTANDAU S LADIRAY D LE GUEN M 1999 Analyse Exploratoire des donn es et SAS INSIGHT Courrier des Statistiques n 90 juin 1999 INSEE pp3 44
7. ncentration de pays africains dans la partie sup rieure droite du diagramme On aurait tout aussi bien pu en en ajouter une quatri me rep rage par exemple des pays selon la tranche de PNB au moyen de la couleur halshs 00287786 version 1 12 Jun 2008 o a gasie ai Tf frique Oc anie ME e Thi E ri 1H 15 2H tx mortalit Les liaisons 2 2 entre plusieurs variables d intervalle ici les taux de natalit et de mortalit pour 1 000 habitants et le taux d accroissement naturel de la population en peuvent tre visualis es au moyen de matrices de diagrammes de dispersion nt sp R X C an 1e Tur I t 34 t tx mortalit accroissement Guide de lecture de gauche droite et de haut en bas Cadre 1 Les valeurs extr mes du taux de natalit sont 10 et 53 Cadre 2 R partition des pays suivant le taux de natalit en ordonn es et le taux de mortalit en abscisses Cadre 3 R partiton des pays suivant le taux de natalit en ordonn es et le taux d accroissement en abscisses Cadre 4 sym trique du cadre 2 R partition des pays suivant le taux de mortalit en ordonn es et le taux de natalit en abscisses Cadre 5 Les valeurs extr mes du taux de mortalit sont 3 et 29 Cadre 6 R partition des pays suivant le taux de mortalit en ordonn es et le taux d accroissement en abscisses
8. on totale des moins de 15 ans AGE15 et des plus de 65 ans AGE65 le produit national brut PNB et le taux d urbanisation URBA en de la population totale Histogramme et Box Plot L histogramme r v le la forme ou plut t une forme de la distribution tudi e dans l exemple ci dessous celle du taux de mortalit variable MORT Le Box Plot ici pr sent en mode horizontal apporte de nombreuses informations suppl mentaires la longueur de la bo te rectangle central d termine l tendue de la partie centrale de la distribution taux de mortalit compris entre les quartiles Q1 et Q3 valeurs 7 et 15 la bande verticale mat rialis e l int rieur de la bo te indique la position de la m diane valeur 10 l tendue des queues de distribution hors points atypiques est d termin e par la longueur des moustaches rectangles lat raux tant pr cis que l extr mit de la moustache de gauche est ici fix e par la plus petite valeur 3 sup rieure ou gale Q1 1 5 Q3 Q1 celle de la moustache de droite par la plus grande valeur 23 inf rieure ou gale Q3 1 5 Q3 Q1 de part et d autre des moustaches sont mises en vidence les observations atypiques avec valeur inf rieure Q1 1 5 Q3 Q1 ou sup rieure Q3 1 5 Q3 Q1 ici la Gambie et la Sierra Leone o le taux de mortalit est particuli rement lev la petite diagonale du losange superpos la bo te
9. vant le taux de natalit le taux de mortalit et le taux d accroissement naturel de la population Nota L axe NAT est ici perpendiculaire au plan de la page HAfrique Europe 4 En faisant tourner le nuage de points on met en vidence la relation liant les trois variables en question ici ACCR NAT MORT 10 puisque les taux de natalit et de mortalit sont exprim s en pour mille et le taux d accroissement en pour cent Europe o P RI Am rique Oc anie s frique t4 u a c anie n efsie Afrique halshs 00287786 version 1 12 Jun 2008 Interactivit Il est tout fait possible de regrouper plusieurs repr sentations graphiques dans une m me fen tre et d animer l ensemble gr ce l interactivit Regroupons par exemple dans une m me fen tre un histogramme relatif la distribution du taux de natalit et un Bar Chart donnant la r partition par continent des 173 pays observ s Si l on s lectionne la barre Europe du Bar Chart on verra alors instantan ment se superposer l histogramme global un deuxi me histogramme limit au cas de ce continent U J TLC Ts tx natalit F E T T E n C frique sie m rique Europe Oc anie cont inent halshs 00287786 version 1 12 Jun 2008 Plus spectaculaire encore regroupons dans une m me fen tre ce m me Bar Chart le Box Plot relatif la distribution de la proportion des plus de 65 ans ainsi qu une

Download Pdf Manuals

image

Related Search

Related Contents

Canada  Coby CX90  ASSMANN Electronic AK 154 5M printer cable  Guide d`instruction (20 ko, PDF)  イーサネット通信ソフト FTPExtractor 取扱説明書  Palmarès Concours Général Agricole  PDF(439KB) - JX日鉱日石エネルギー  sysIO Usage Guidelines for Lattice Devices  取扱説明書 ホイールサンダ  

Copyright © All rights reserved.
Failed to retrieve file