Home

Petit manuel d`utilisation de R à destination des étudiants du

image

Contents

1. tre lus simplement ils font alors appel des fonctions qui ne sont pas de base La fonction read table permet de lire tr s facilement un fichier de donner Par exemple gt messonnees lt read table mesdonnees txt cr e un tableau de donn es nomm mesdonnees et les variables sont par d faut nomm es V1 V2 POur acc der ces derni res il suffit de taper mesdonnees V1 ou mesdon nees V1 ou encore mesdonnees 1 Diff rentes options sont disponibles dans cette fonction Prenez le temps d aller consulter l aide aff rente de fa on obtenir l effet escompt En ce qui concerne la fonction scan elle offre un peu plus de flexibilit puisqu elle permet entre autre de sp cifier le mode des variables Elle permet galement de cr er diff rents objets gr ce l option what Par exemple gt mesdonnees2 lt scan mesdonnees txt what list 0 0 cr e une liste de trois objets dont le premier est de mode caract re et les deux suivants de mode num rique Dans le cas o les modes sp cifi s dans la fonction scan ne correspondent aux donn es un message d erreur appara tra Pour de plus amples informations consulter l aide en ligne 3 2 2 Enregistrement des donn es La fa on la plus simple d crire des donn es cr es dans R dans un fichier consiste utiliser la fonction write La syntaxe par d faut write x file donnees txt permet de s
2. 3 3 3 3 4 4 3 3 4 Manipulation des objets v data frame x z x z 1 1 e NN 2 7 3 1 4 7 v data frame x y Un message d erreur est alors renvoy car il y a une incompatibilit au niveau de la longueur des vecteurs Remarque 3 4 1 La lecture des messages d erreur qui apparaissent l cran donne dans la plupart des cas la cl de l erreur commise Donc lisez attentivement ces messages car ils sont d une aide pr cieuse en cas de difficult s Liste Une liste permet de regrouper dans un m me objet des l ments diff rents sans aucune contrainte li e la taille ou au mode de ces derniers Si l on reprend les notations de l exemple ci dessus voil ce que l on peut obtenir gt L1 lt list x y gt L1 1 1 1234 C 21 1 123 Par d faut les noms des objets regroup s dans une liste n est pas conserv Si l on veut pouvoir les nommer il faut op rer comme ci dessous o figure gauche du signe le nom donn l objet gt L1 lt list x x y y gt L1 x 1 1234 y 1 123 Expression Ce dernier mode est essentiel pour R Il consiste en une suite de caract re qui peut tre interpr table par le logiciel et valuer par la suite au moyen de la commande eval C est bien l un point non n gligeable Mais regardons cela plus pr cis ment sur un exemple 10 8 5 Op rations l mentaires gt x lt
3. Emmanuel Paradis R pour les d butants e John Maindonald Using R for data Analysis and Graphics Introduction Examples and Commentary pour aller plus loin Voici une derni re r f rence qui est totalement orient e vers l utili sation de R des fins statistiques Le site est tr s bien fait mais un peu complexe Voici l adresse http pbil univ lyon1 fr R enseignement html 16
4. d une tude statistique puis d apprendre rechercher de l aide sur les fonctions utilis es de mani re savoir les arguements int grer ou comprendre les r sultats obtenus Chapitre 2 Pour d marrer 2 1 Fonctionnement de R La syntaxe associ e R est relativement simple m me si quelques r gles sont conna tre Ainsi il faut savoir que pour tre ex cut e une fonction doit toujours tre suivie de paren th ses m me si ces derni res ne contiennent aucun argument En effet leur absence entra ne l affichage par R des lignes de commande de la fonction appel e Le symbole gt qui appara t en d but de ligne montre que R est pr t tre utilis Quand R est utilis les variables donn es fonctions r sultats etc sont stock s dans la m moire de l ordinateur sous forme d objets qui poss dent un nom L utilisateur va pouvoir interagir sur ces objets au moyen d op rateurs ou de fonctions De nombreuses fonctions sont d j stock es dans une biblioth que localis e sur le disque dans le r pertoire R_HOME library R_ HOME d signant le r pertoire o R est install Ce r pertoire contient des packages de fonctions eux m mes pr sents sur le disque sous forme de r pertoire Le package base constitue le c ur du logiciel et contient comme son nom l indique les fonctions de base Si l on souhaite utiliser des fonctions appartenant un autre package il suffit de
5. 1 y lt 2 z lt 3 gt exp1 lt expression x y z gt expl expression x y 2 gt eval expi 1 0 2 Ce moyen de conserver en m moire une expression sous sa forme litt rale peut s av rer essen tielle puisque certaine fonction l image de D calcul des d riv es partielles prennent de tels objets comme argument Remarque 3 4 2 Il existe un autre objet qui ne sera pas d taill ici il s agit des s ries temporelles qui peuvent tre obtenues l aide de la commande ts ou encore des fonctions function que l on peut cr er ou tout simplement de tableau appel array Il existe une commande qui permet de convertir un objet en un autre il suffit d utiliser as quelquechose as numeric par exemple Cependant cette manipulation r pond cer taines r gles de codage qui peuvent par cons quent modifier la forme m me des donn es 3 5 Op rations l mentaires 3 5 1 Op rateurs usuels Voici une liste des principaux op rateurs qui sont regroup s en trois grandes classes op rateurs Arithm tique Comparaison Logique addition lt inf rieur x NON logique soustraction gt sup rieur x amp y ET logique multiplication lt inf rieur ou gal x amp amp y idem division gt sup rieur ou gal x y OU logique puissance gal x y idem modulo l diff rent xor x y OU exclusif division enti re Il est bon de savoir que pour indiquer une do
6. 29 a 29 1 1 2 3 4 5 6 7 8 9 10 Matrice Une matrice est un tableau comportant des lignes et des colonnes Par cons quent la lon gueur associ e une matrice comprend deux informations celle relative au nombre de lignes et la seconde au nombre de colonnes Cette information est alors donn e R sous la forme gt matrix data NA nrow l ncol j Ceci a le m rite de produite une matrice comptant l lignes et j colonnes avec que des l ments NA Si l on souhaite directement remplir une matrice avec des valeurs sp cifi es il faut alors les inscrire dans un vecteur en tant qu argument data et faire attention si l on souhaite que le remplissage de la matrice s op re par ligne ou par colonne Voici la diff rence sur un exemple gt x lt 1 10 gt matrix data x ncol 5 nrow 2 byrow TRUE 1 2 3 4 5 1 14 2 3 4 5 2 6 7 8 9 10 gt matrix data x ncol 5 nrow 2 byrow FALSE 1 2 3 4 5 1 1 3 5 T 9 2 2 4 6 8 10 Ainsi selon que l option byrow est active ou non le mode de remplissage de la matrice ne s op re pas de la m me fa on Donc prenez garde Data frame Un data frame est un objet implicitement cr e lors du recours la commande read table On peut fabriquer un tel objet de mani re explicite au moyen de data frame comme ci suit gt x lt 1 4 gt y lt 1 3 gt z lt c 1 7 gt t lt 3 gt data frame x t x t 1 1 3 2 2
7. Petit manuel d utilisation de R destination des tudiants du MASTER IMEA 2 Universit de Nice Sophia Antipolis Ann e Universitaire 2011 2012 Table des mati res Chapitre 1 Pr sentation g n rale Le but de ce document est de fournir les l ments de base permettant une prise en main rapide du logiciel R afin de faciliter le d roulement de certains TD mais aussi de vous aider lors des ateliers auxquels vous participerez Ce document est largement inspir d un manuel produit par Emmanuel Paradis Pour une documentation plus compl te vous pourrez vous r f rer aux diff rentes ressources que vous trouverez dans le chapitre de ce pr sent document R est un syst me d analyse statistique et graphique d velopp par Ross Ihaka et Robert Gentleman Ce logiciel constitue une alternative au logiciel S PLUS m me si de nombreuses diff rence dans la conception existent Cependant de nombreux programmes crits pour S PLUS sont directement utilisables sous R Un point fort de R r side dans le fait que ce logiciel est distribu librement Son installa tion peut tre mise en uvre partir du site internet du Comprehensive R Archive Network CRAN qui d une part met disposition les ex cutables et d autres part donne des informa tions relatives la proc dure d installation Au cours de ces diff rents chapitres ce document permet tout d abord de conna tre les com mandes essentielles la r alisation
8. aper chacune des valeurs comme ci suit gt c n_1 n_2 n_3 qui produit le vecteur contenant les valeurs n1 n2 n3 D autres fonctions sont galement disponibles telles e rep qui permet de r p ter un objet un certain nombre de fois e sequence qui cr e une suie de s quences de nombres entiers se terminant chacune par les valeurs sp cifi es en argument e gl k n qui g n re une s rie r guli re dans un facteur comprenant k niveaux et n r p titions 3 3 2 Donn es al atoires En statistique on appr cie de pouvoir g n rer des donn es al atoires Il s av re que R est capable de le faire et ce pour un grand nombre de densit de probabilit Ces fonctions sont de la forme rfunc n p1 p2 o func d signe la loi de probabilit n le nombre de donn es g n rer et p1 p2 les param tres de la loi Voici un tableau qui fait appara tre la d nomination et les param tres de certaines lois 3 4 Manipulation des objets nom de la loi fonction dans R Gauss normale rnorm n mean y4 sd 0 exponentielle rexp n rate gamma rgamma n shape a scale s poisson rpois n weibull rweibull n shape a scale s cauchy rcauchy n location a scale s student rt n df fisher rf n df1 df2 binomiale rbinom n size prob g om trique rgeom n prob uniforme runif n min a max b Afin d obtenir la densit de probabilit on utilise dfunc en lieu et place de rfun
9. c En ce qui concerne la densit de probabilit cumul e ce sera pfunc et qfunc pour la valeur du quantile Par contre les arguments diff rent selon la fonction utilis e il est donc n cessaire de consulter laide associ e 3 4 Manipulation des objets Nous venons de cr er des objets par l interm diaire de l oprateur d assignation Cependant il est possible de cr er des objets en d finissant leur mode et leur longueur Cette option permet par exemple de cr er des objets vide puis de les remplir au fur et mesure vecteur La commande vector qui comprend deux arguments mode et length cr e un vecteur com pos de 0 si le vecteur est num rique FALSE s il est logique et s il s agit d un caract re facteur Le codage d une variable cat gorielle fait appel la commande factor qui inclue les valeurs de la variables mais aussi toutes les modalit s possibles gt factor 1 7 1 1234567 Levels 1234567 gt factor 1 7 levels 1 10 1 1234567 Levels 12345678910 gt factor 1 4 levels c A B F2 lt G 1 ABFG Levels ABF G On constate que levels permet d indiquer les modalit s d une variable dans le cas pr sent mais elle peut aussi tre utiliser pour conna tre les diverses modalit s li es un facteur 3 4 Manipulation des objets gt s lt factor 1 7 1levels 1 10 gt levels s ar 4 22 an 4 22 an 4 2 24 29 an 4 22 24 22 an 4 29 tt 3 3 a
10. charger ce dernier l aide de la commande library Par exemple library rpart permet de charger les fonctions d di es CART Si l on souhaite trouver les fonctions qui composent un package d fini il suffit de se rendre dans le r pertoire aff rent Par exemple pour le package R il suffit de visiter le fichier R_HOME library base R base Une des commandes les plus simples consister afficher le contenu d un objet en tapant tout simplement son nom Par exemple si l objet n contient la valeur 10 gt n 1 10 Le chiffre 1 qui appara t entre crochets indique que l affichage commence au premier l ment l ment de n Cette commande est similaire print n Cette derni re sera r guli rement 2 2 Assignation et aide utilis e pour l affichage de r sultats interm diaires lors du recours des boucles En ce qui concerne la syntaxe des objets il faut savoir que le nom d un objet doit d buter par une lettre et qu ensuite il peut comporter des lettres des chiffres des points et des espaces soulign s D autre part R effectue une distinction entre les minuscules et les majuscules Ainsi A et a d signent deux objets diff rents 2 2 Assignation et aide Afin de cr er un objet utilisable par le logiciel diverses commandes existent La plus simple consiste utiliser l op rateur d assignation qui correspond une fl che gt n lt 3 gt n 1 3 ou gt 3 gt n gt
11. dans l aide plot x graphe des valeurs de x sur l axe des y ordonn es sur l axe x plot x y graphe de y en fonction de x boxplot x bo te moustaches hist x histogramme des fr quences de x barplot x histogramme des valeurs de x qqnorm x quantiles de x en fonction des valeurs attendues selon une loi normale qqplot x y quantiles de y en fonction de ceux de x Pour toutes ces fonctions il existe un nombre impressionnant d option qu il est bon de consul ter Par ailleurs des commandes comme legend title text permettent de commenter des gra phiques ce qui est essentiel la compr hension d un graphe Remarque 4 2 1 R permet une repr sentation graphique tr s pr cise dont les r gles sont assez intuitives d o le peu d informations donn dans ce document Pour compl ter cette section vous pouvez vous reporter au document r diger par E Paradis 15 Chapitre 5 Ressources bibliographiques Voici quelques r f rences qui pourront compl ter votre apprentissage du logiciel R Manuels ils sont pour la plupart distribu s avec R et se situent dans R_ HOME doc manual e An introduction to R R intro pdf e R Data Import Export R data pdf e Writing R Extensions R exts pdf e R Language Definition R lang pdf Ressources en ligne de nombreuses documentations sont disponibles sur le site de CRAN dans l onglet documentation puis contributed En voici quelques unes e
12. n 1 3 Une assignation peut galement prendre la forme d une op ration ou d une fonction mais seul le r sultat sera conserv dans l objet cr Attention si un objet existe d j et qu une nouvelles valeur lui est assign e la valeur pr c dente est automatiquement effac e Ainsi il peut tre bon d afficher la liste des objets utilis s Ceci s effectue au moyen de la commande ls Si l on souhaite conna tre quelques d tails sur les objets cr s on peut aussi recourir la commande Is str Remarque 2 2 1 Diff rentes options sont disponibles dans ces fonctions Par exemple pattern de ne rechercher que les objets contenant un caract re donn Is pattern n retourne la liste des objets dont le nom contient le caract re n Is pattern restreint la recherche au objet com men ant par n Afin de conna tre avec pr cision les options d une fonction il suffit de consulter l aide en en ligne accessible gr ce la commande help Par exemple help ls affiche l aide relative la fonction ls On y trouve ainsi des informations sur les arguments possibles mais aussi sur le r sultat retourn D autres syntaxes quivalentes existent help ls ou ls 2 2 Assignation et aide Remarque 2 2 2 Dans certains cas seule la seconde syntaxe existe par exemple pour les op rateurs logiques help E Par ailleurs il peut tre utile d ajouter l option tr
13. non peut tre Les attributs li s un objets sont de deux types le mode et la longueur Le mode correspond la nature m me de l objet il en existe principalement 4 num rique caract re complexe et logique La longueur repr sente le nombre d l ments constitutifs de l objet Afin d obtenir ces diff rentes informations il suffit de faire appel aux commandes mode et length gt x lt 1 gt mode x 1 numeric gt length x 1 1 Les valeurs manquantes sont toujours repr sent es par la cha ne de caract res NA D autre part R repr sente correctement les valeurs infinies Inf et Inf et celles qui ne sont pas des nombres NaN 3 2 Lecture et enregistrement de donn es Il est possible de cr er des donn es directement dans R mais il est aussi possible d en importer comme d en exporter Quelle que soit l op ration choisie il faut faire attention la localisation du r pertoire de travail Ainsi la commande getwd permet de savoir le r pertoire o l on se trouve S il s av re n cessaire d en changer setwd peut nous y aider ex setwd home christinet R permet d acc der au r pertoire R du dossier christinet 3 3 Cr ation de donn es 3 2 1 Lecture de donn es Diff rentes fonctions permettent de lire des donn es Ainsi read table scan et read fwf permettent d acc der des donn es stock es dans des fichiers de type ASCII D autres for mats peuvent
14. tocker l objet x un vecteur une matrice ou un tableau dans le fichier donnees txt Des options permettent d enregistrer les donn es correctement comme l option ncol En ce qui concerne l enregistrement d objets de tout type on peut utiliser la commande save uelle que soit l option retenue il est pr f rable d utiliser le format d enregistrement ASCII q P P g option ascii TRUE car cela permet une meilleure compatibilit entre les diff rents sys t mes d exploitation S il s av re que l on a besoin de charger ces donn es on pourra taper ult rieurement load nomdufichier 3 3 Cr ation de donn es Il existe diff rentes mani re de cr er des donn es quelles soient r guli res ou al atoires 3 3 Cr ation de donn es 3 3 1 Donn es r guli res Une premi re solution pour cr er une s quence de donn es r guli res est la suivante gt a b qui cr e partir de la valeur a et par pas de 1 une suite de nombres inf rieurs ou gaux b Remarque 3 3 1 La commande pr vaut sur toute autre op ration Si le pas diff re de 1 la commande utiliser est seq dont la syntaxe est la suivante gt seq a b p o a est la valeur de d part b la valeur maximale ne pas d passer et p le pas Il se peut que la valeur b ne soit jamais atteinte Bien d autres syntaxes utilisant seq sont possibles elles sont discut es dans l aide Enfin il y a toujours la possibilit de t
15. uble in galit du genre 0 lt x lt 1 on crira 0 lt x amp x lt 1 Attention l omission du symbole logique ET entra ne une r ponse mais qui n est pas celle attendue Une autre de fonction de comparaison existe il s agit de identical et sa soeur all equal 11 8 5 Op rations l mentaires 3 5 2 Indexation Que l on soit en pr sence d un vecteur ou d une matrice on peut vouloir extraire un l ment ou une suite d l ments Une fa on d op rer consiste recourir la syntaxe suivante gt x lt c 1 5 7 2 gt x 3 1 7 On a ainsi extrait le 3 me l ment du vecteur x Ceci peut galement permettre de modifier une des composantes du vecteur gt x 3 lt 2 gt X 1 1522 Cependant on peut galement extraire un ensemble d l ments par gt x c 1 4 1 1 2 Dans le cas o x est une matrice on peut faire la m me chose comme l illustre les s quences suivantes gt x lt matrix 1 6 2 3 gt x 1 2 3 1 3 5 2 2 4 6 gt x 3 1 5 6 gt x 3 lt c 1 1 1 2 3 1 1 3 1 2 2 4 1 gt x 2 1 2 1 1 1 2 2 1 Ce qui vient d tre r alis sur les colonnes se fait tout aussi bien sur les lignes Une autre mani re de proc der l extraction d l ments consiste combiner ce qui pr c de avec des op rateurs logiques Par exemple si l on souhaite extraire les valeurs paires d une suite de
16. uelle s affichera les graphiques est la derni re appel e Afin de conna tre les fen tres ou device ouverts on utilise dev list qui nous donne le num ro associ chacune des fen tres Ce num ro sera tr s utile pour modifier la fen tre graphique au moyen de dev set num ro Enfin la commande dev off permet de fermer la fen tre active Apr s avoir ouvert un device on peut vouloir le diviser en plusieurs sous fen tres Plusieurs options sont possibles mais nous n en voquerons simplement deux Une premi re m thode consiste utiliser split screen de la fa on suivante gt split screen c 1 2 qui permet de diviser la fen tre en deux parties qui seront appel es par screen 1 et screen 2 Une solution quivalent consiste recourir la fonction par e par mfrow c 2 2 permet de scinder la fen tre en quatre sous fen tres 2 lignes et 2 colonnes Le mode de remplissage s effectue par ligne e par mcol c 2 2 permet de scinder la fen tre en quatre sous fen tres 2 lignes et 2 colonnes Le mode de remplissage s effectue par colonne 14 4 2 fonctions graphiques Remarque 4 1 1 Une aute fonction utile est layout qui peut conduire des partitions assez complexes 4 2 fonctions graphiques Dans ce paragraphe ne sera mentionn que les fonctions qui pourront tre utiles en statistique Cependant nous n en donnerons qu un petit aper u les d tails et options figurant
17. valeurs contenues dans x on tapera x x 2 0 12 8 5 Op rations l mentaires 3 5 3 Calcul matriciel Le logiciel offre des facilit s dans la manipulation des matrices Ainsi les commandes chind et rbind permettent de juxtaposer des matrices en conservant les lignes ou les commandes gt x lt matrix i ncol 2 nrow 2 gt y lt matrix 2 ncol 2 nrow 2 gt rbind x y 1 2 1 1 1 2 1 1 3 2 2 4 2 2 gt x lt matrix 1 ncol 2 nrow 2 gt y lt matrix 2 ncol 2 nrow 2 gt cbind x y 1 2 3 4 1 1 1 2 2 2 1 1 2 2 Un autre op rateur tr s utile est op rateur de multiplication matriciel qui s crit amp amp D autres fonctions notables existent telles diag solve qr eigen ou svd Mais nous ne les d taillerons pas ici 13 Chapitre 4 Repr sentation graphique 4 1 fen tre graphique En ce qui concerne cette section une multitude de notions pourraient tre abord es car beau coup de choses sont r alisables Dans un soucis de concision nous ne donnerons ici que l essen tiel et le reste sera acquis au fur et mesure de la manipulation et de vos besoins notamment en tudiant l aide sur les fonctions que nous allons mentionner Afin d ouvrir une fen tre graphique on peut utiliser les commandes X11 postscript ou pdf selon que l on souhaite un simple affichage ou un enregistrement Mais la fen tre graphique active autrement dit celle sur laq
18. y all packages TRUE dans la fonction help Ainsi si l on recherche de l aide sur la fonction rpart qui ne fait pas partie du package base help raprt nous informera simplement que dans les packages charg s l information demand e n existe pas La commande help rpart try all packages TRUE permet alors de savoir que la fonction brpart est localis e dans le package rpart puis help rpart pa ckage rpart permet d obtenir l affichage de l aide d sir e Il existe une autre possibilit pour obtenir de l aide Elle s obtient via la commande help start qui ouvre une aide au format html Une recherche par mots cl s est alors possible recherche galement disponible sur R par l interm diaire de help search Ainsi si vous tapez help search distribution vous aurez une liste de fonctions o al ler chercher davantage d aide Ainsi il n est pas obligatoire de conna tre les noms de fonction pour faire une recherche des mots cl s suffisent Chapitre 3 Les donn es 3 1 Objets R Le logiciel R manipule des objets Ces derniers sont caract ris s d une part par leur nom et d autre part par leurs attributs qui servent sp cifier la nature ou le type des objets Par exemple il peut tre bon de diff rentier le vecteur 1 2 3 suivant que celui ci repr sente une variable enti re ex le nombre d enfants par famille ou le codage d une variable cat go rique ex oui

Download Pdf Manuals

image

Related Search

Related Contents

取扱説明書  7426-600 Apollo 94p-0406.qxd  comune di castrolibero - Amministrazione Trasparente  Manuel de l`utilisateur PERCEUSE/VISSEUSE SANS  HP z545 Warranty and Support Guide  PN-ZH802 取扱説明書  SoftBank 304ZT ユーザーガイド - 取扱説明書  User`s Manual  Pyle Power Inverter 440W  "取扱説明書"  

Copyright © All rights reserved.
Failed to retrieve file