Home

PROCÉDURES D`AGRÉGATION - Infoscience

image

Contents

1. Ordonnance sur le relev et le traitement de donn es agricoles ou ordonnance sur les donn es agricoles ODA d cembre 1998 Lo f d rale sur la Protection des Donn es LPD juin 1992 Ordonnance relative la loi f d rale sur la protection des donn es OLPD juin 1993 Dans le cadre de ce travail nous nous r f rons en particulier la loi sur la protection des donn es ainsi qu aux articles sur les restrictions de diffusion de donn es statistiques dans la loi sur la statistique f d rale art 18 et dans l ordonnance sur les donn es agricoles art 16 L essentiel des nombreuses statistiques sur les exploitations qui sont recueillies par l OFS de mani re directe ou indirecte fait r f rence aux annexes de l ordonnance sur les relev s statistiques Toutes ces donn es font l objet de traitements divers tant au niveau cantonal que f d ral Outre ces informations sur la conduite de l entreprise et sur ses installations chaque centre d exploitation fait l objet d un g ocodage des b timents coordonn es des constructions dans le syst me national suisse MNO03 d s f vrier 2002 3 1 2 DANS LE CADRE DE CE PROJET L OFS produit diff rentes cartes sur la Suisse ou sur un canton donn repr sentant une ou plusieurs variables de la statistique agricole L agr gation manuelle des communes pour la repr sentation cartographique constitue un travail co teux en temps et en personnel Une premi re m thodologie est
2. 44 3 LA TAILLE DE L AGREGAT L importance de la taille de l agr gat se concr tise principalement lors de l agr gation des communes tessinoises Comme la majorit de ces entit s sont des germes il faut viter que le regroupement ressemble un effet boule de neige autour des quelques communes importantes Dans un tel cas de figure on se retrouverait avec une situation inacceptable o seulement une poign e d agr gats couvriraient le Tessin La n cessit devient alors vidente d tablir une limite quant la taille des agr gats Deux param tres possibles viennent imm diatement l esprit la surface ou le nombre d exploitations de l agr gat On peut discuter de l efficacit de l un ou et l autre mais il semble qu aucun des deux ne s impose particuli rement Le nombre d exploitations est choisi comme compl ment au crit re de confidentialit c est dire qu il fixe une limite sup rieure l agr gat au lieu de requ rir un minimum Dans ce cas galement l information est directement accessible dans la base de donn es relative aux communes Dipl me EPFL Bertrand Barbey Mars 2002 Page 26 Proc dures d agr gation multifactiorelle Etapes d agr gation 5 PRINCIPALES TAPES D AGR GATION Pour cette premi re laboration d un programme d agr gation nous nous sommes bas s sur les donn es 96 soit un contour des communes fourni par l EPEL et les donn es typologie et sp cialisation des communes du recensement
3. 2000 Une nouvelle approche pour recenser les entreprises du secteur primaire Communiqu de presse OFFICE F D RAL DE LA STATISTIQUE Neuch tel mai 2000 La statistique agricole n a jamais t aussi importante Communiqu de presse OFFICE F D RAL DE LA STATISTIQUE Neuch tel novembre 2000 Le secteur primaire toujours plus petit Communiqu de presse OFFICE F D RAL DE LA STATISTIQUE Neuch tel septembre 2001 Qu est ce qu un syst me d information g ographique Manuel de pr sentation de GEOSTAT OFFICE F D RAL DE LA STATISTIQUE Neuch tel 1999 Solution agricole dans le domaine Online Communiqu de presse USP PSL EMG SAGmbH Berne septembre 2001 Etablissement des informations statistiques Extrait du site web de l OFS OFFICE F D RAL DE LA STATISTIQUE Neuch tel septembre 1998 Sites Internet Agence d Information Agricole Romande AGIR www agirinfo com Agrigate AG wwWw agrigate ch AgriHebdo www agrihebdo ch EPFL Institut de g omatique Chaire de SIRS http dgrwww epfl ch SIRS index fr html ESRI www esri comou http esri suisse ch ou www esrifrance fr Office f d ral de l agriculture OFAG www blw admin ch f Office f d ral de l environnement des for ts et du paysage OFEFP www umwelt schweiz ch Office f d ral de la statistique OFS section agriculture et sylviculture wwWw statistik admin ch stat_ch ber07 fber07 htm Office f d ral de la statistique OFS section statisti
4. affaire des valeurs identiques de leur attribuer un rang moyen Pourtant nous n allouons un rang moyen que pour les variables nulles ce qui permet de diminuer suffisamment le hasard dans l ordre d attribution de ces rangs Nous pouvons alors esp rer que cette m thode poss de un pouvoir discriminant plus marqu Pour s en rendre compte nous effectuons des tests identiques ceux d velopp s ci dessus Voici les r sultats Seuil de Nombre corr lation d agr gations d a 0 98 gt r 0 83 348 Tableau 9 Corr lation sur les rangs r sultats d une it ration avec seuil de corr lation variable Nous pouvons d j remarquer que le nombre d agr gations est comparable celui obtenu lors de la r solution multicrit re 479 ce qui est favorable La r alisation du second test avec un degr de confiance de 0 95 soit un seuil de corr lation l g rement inf rieur la r alisation pr c dente nous fournit les r sultats suivants Statistiques Corr lation sur rangs Multicrit re Nombre total d agr gats Communes agr g es inchang es 83 4 86 9 88 9 02 2 Tableau 10 Corr lation sur les rangs r sultats comparatifs avec la m thode multicrit re sur la Suisse Nous pouvons noter une bonne similarit entre les deux m thodes ouvrant alors de nouvelles perspectives pour les traitements venir soit sur le type de production des entreprises agricoles en 2000 soit sur d autres statistiques a
5. au profit d une commune adjacente divergeant du germe sur plusieurs points mais plus proche quant au nombre d exploitations En rapport aux donn es du recensement nous pouvons d plorer peut tre la repr sentativit relative de quelques informations En effet tout relev d ampleur se doit de fixer une date de r f rence Dans le cas du recensement des structures agricoles les exploitants d crivent leurs cultures type surface leur b tail type nombre 1 etc tels qu ils sont le jour de r f rence Pourtant pour valuer la r elle production d une entreprise agricole ou autre il serait probablement judicieux de prendre en compte l ann e coul e jusqu au jour d termin Dans la situation propre ce projet l expression de l orientation de production ne subirait vraisemblablement que de faibles modifications mais nous disposerions d une somme sup rieure d informations autorisant cartographier plus de th mes porteurs avec un degr de fiabilit lev En outre la forme m me des donn es induit quelques probl mes de repr sentation cartographique En effet le recensement s attache d crire la structure et la production des exploitations agricoles Par cons quent nous disposons d un jeu ponctuel d informations li es au territoire l oppos de la statistique de superficie qui repr sente la couverture du sol Dipl me EPFL Bertrand Barbey Mars 2002 Page 56 Proc dures d agr gation multifactiorelle e
6. de corr lation sur les rangs et examinons les ressources offertes par la d termination d une distance sur les variables caract risant les communes Dans l tape suivante nous nous concentrons sur les possibilit s de g n ralisation de ce programme en sachant que de telles consid rations interviennent d j lors du d veloppement du prototype Il s agit d valuer une m thode consistant combiner deux des syst mes test s auparavant pour garder le traitement int gr de plusieurs facteurs tout en laissant totalement libre le choix des variables cartographier Nous optons pour une int gration du calcul de distance ou de la corr lation dans le processus de r solution multicrit re Finalement en quatri me partie nous effectuons une synth se des m thodes test es et d veloppons les avantages et les inconv nients li s aux solutions les plus performantes D autre part si le temps le permet nous nous attacherons relever les moyens dont disposent actuellement les SIT et qui peuvent permettre ce prototype d voluer vers un outil int gr de traitement et de cartographie de donn es statistiques Nous pourrons envisager quelques perspectives pour le traitement des donn es de l OFS mais galement quelques id es sur leur combinaison avec d autres couches d informations Dipl me EPFL Bertrand Barbey Mars 2002 Page 10 Proc dures d agr gation multifactiorelle Th orie PT EEE PEER PE EEE EL eege PE EE EEE EP DO EE
7. en premier lieu nous observons combien chaque agr gat regroupe de commune originales D autre part nous cherchons savoir combien de types de production distincts sont finalement absorb s par chaque agr gat Le tableau suivant contient un r sum de l annexe XVIIT 1 qui pr sente le d tail des r sultats Dipl me EPFL Bertrand Barbey Mars 2002 Page 52 4 IUCOUUI ED U ux CHULLUTIL IL UU LUI CLC WULU HLIDOUIULI H Nombre moyen de Nombre moyen de M thode communes par types de production agr gat par agr gat Typologie multicrit re Corr lation sur les rangs 1 504 1 298 Distance euclidienne 1 492 1 329 Sp cialisation multicrit re 1 464 1 266 Combinaison multicrit re et corr lation 1 501 1 297 Combinaison multicrit re et distance 1 478 1 273 Tableau 21 Comparaison des m thodes selon le nombre moyen de communes et de types de production diff rents regroup s dans chaque agr gat Ce tableau montre encore une fois que la m thode discr te attribution multicrit re des scores utilisant la typologie ou la sp cialisation comme base de ressemblance fournit les r sultats d agr gation modifiant le moins la signification de la repr sentation cartographique Nous pouvons galement remarquer que la combinaison de la r solution multicrit re et du calcul de distance constitue une solution favorable pour tout type de donn es Cette derni re impression se trouve confirm e par le tableau suivant cf annexe XVIII
8. la confidentialit est respect e lorsque 4 exploitations au moins par communes remplissent le crit re sur lequel est jug e la ressemblance Pour garantir en toutes situations l anonymat des donn es d orientation de production cartographi es sous la forme d une typologie la valeur de 12 exploitations constitue un fort gage de s curit L indicateur de confidentialit est directement caract ris par le nombre total d exploitations de chaque commune r pertori comme attribut part enti re dans la base de donn es sur les communes visible sous forme de tableau dans ArcView par apr s table des communes 4 2 CRIT RE DE RESSEMBLANCE Le crit re de ressemblance se d finit par deux indicateurs le nombre d exploitations de chaque entit et l objet de la cartographie en l occurrence l orientation de production Mentionnons que le second indicateur est le seul v ritable param tre qui est amen varier lors de la phase op rationnelle du projet Le prototype est d velopp partir des donn es concernant l orientation de production mais son application devrait tre possible pour la repr sentation cartographique d autres th mes privil gi s par la section d agriculture voire par l OFS en totalit C est pourquoi il est pr f rable que l information concernant cet indicateur soit directement disponible dans la table des communes Pour le cas de l orientation de production neuf champs en donnent les caract ristique
9. lius utilis comme seul facteur d agr gation il permet de r duire de 2 3 le nombre d agr gats ayant un indice G gt 1 6 par rapport l application normale Cependant le double de communes changent de typologie durant ce processus M me utilis e seule la LFC ne parvient gu re construire des agr gats de forme r guli re si l on compare avec l application du programme sans indicateur de forme Ce test confirme galement que la combinaison des indicateurs repr sente une sorte de compromis sur les solutions particuli res Compte tenu de ces observations nous d cidons d liminer un indicateur de forme afin de ne pas rallonger inutilement les temps de travail L avantage de l indice G de Grav lius c est sa robustesse face des situations d favorables En effet par sa formulation math matique l indice G est plus contraignant alors que l indicateur fronti re commune risque plus de laisser se former des agr gats ind sirables Sinon les temps de travail doivent tre quivalents et les deux param tres poss dent l avantage d tre ind pendants des autres indicateurs Pour les applications venir sur les donn es du recensement 2000 nous n utilisons plus que l indice de Grav lius comme indicateur de forme L annexe VII 4 propose quelques exemples tir s des r sultats graphiques de l ex cution du programme selon les circonstances et illustrant assez bien les relations entre les indicateurs de forme Dipl
10. 1 1 5 selon les m mes s quences de valeurs limites VL que ci dessus Figure 13 Tessin alternatives avec un poids fort sur l indicateur de taille L exp rience n est pas concluante puisque les formes des agr gats sont plus irr guli res et que leur typologie finale ne correspond que tr s partiellement la r partition originale Finalement nous tentons encore deux essais renfor ant l action de l indicateur de taille Intuitivement il nous para t important d accentuer le poids du facteur taille de mani re conserver des agr gats proches du seuil de confidentialit garantissant une meilleure repr sentation des donn es de base Nous appliquons les poids 1 0 1 3 3 5 et 1 0 1 1 0 5 avec une VL variable VL 2 4 8 12 pour obtenir les r sultats suivants Dipl me EPFL Bertrand Barbey Mars 2002 Page 35 Proc dures d agr gation multifactiorelle Situations contentieuses Figure 14 Tessin variantes avec indicateurs d esth tisme pr dominants L essentiel des remarques pr c dentes peut galement s appliquer la premi re image l exception de la taille et de la forme des agr gats qui sont ici plut t uniformes et r guli res Malgr la pr sence de formes trop irr guli res le second r sultat apporte des changements probants par rapport la solution de r f rence En effet la taille des agr gats est raisonnable tant au niveau spatial que sur le nombre d entreprises agricoles De plus l ex
11. 1 2 m me s ils sont l g rement inf rieurs la solution multicrit re de r f rence nous pouvons affirmer que nous tenons l une variante assez efficace ouvrant de grandes perspectives de g n ralisation En effet nous pouvons ais ment imaginer d velopper cette m thode pour la rendre polyvalente c d applicable avec d autres jeux de donn es issues de la statistique agricole ou non 9 3 M THODE PAR CALCUL DE DISTANCE Pour le calcul de distance chaque commune est consid r e comme un vecteur dont les composantes repr sentent les cinq MBS primaires Nous sommes contraints de normaliser les donn es transmises par l OFS pour que lors de l agr gation il n apparaisse aucun biais d la taille respective des exploitations Nous avons alors l assurance que la signification est identique pour des distances mesur es entre communes de grandeurs semblables ou tr s diff rentes Nous testons deux mani res de normaliser ces donn es d une part nous r duisons chaque MBS son pourcentage par rapport au total de ces gains potentiels ce qui correspond la m thode la plus fr quente D autre part nous transformons le jeu de variables initiales ici les MBS en composantes principales issues du traitement S Plus visant obtenir des param tres ind pendants La distance peut tre d finie de plusieurs mani res W N Venables amp B D Ripley 1994 Euclidienne racine de la somme des carr s des composantes
12. LPO TON LEP A te te ee ee EE EEE OR EE EL A E OR EEE te REC EE PE eege Menge EP EP eet CPE EEE EEE EE EEE EEE ICE ELEC TILL 2 THEORIE 2 1 SYST MES D INFORMATIONS R F RENCE SPATIALE 2 1 1 DONNEES Le but d un SIRS est de pr senter le monde r el sous la forme d un mod le Pour atteindre cet objectif deux types de donn es sont n cessaires la g om trie o Dans le mod le vectoriel les l ments de base sont concentr s en trois cat gories entit s ponctuelle lin aire ou surfacique Chaque objet est alors caract ris par un ensemble de coordonn es g ographiques repr sentant les points fondamentaux sommets d un polygone d but et fin d une ligne o Le mod le raster est constitu par une grille r guli re dont chaque l ment pixel contient une part de l information sur un th me sous la forme d un code Chaque pixel poss de une g or f rence soit les coordonn es d un point caract ristique et la taille de la maille la th matique La description des objets du mod le et les informations non g om triques sont regroup es dans un tableau annexe un extrait de base de donn es Les tables sont reli es aux entit s graphiques qu elles r f rencent par l information g ographique et entre elles par des champs communs 2 1 2 MANIPULATIONS Les SIRS int grent de nombreux outils permettant de manipuler toutes les donn es pour les rendre coh rentes et ne garder que celles qui sont essentielles
13. Nous mettons un accent particulier sur cette m thode car elle se rapproche le plus de la proc dure manuelle appliqu e jusqu pr sent Elle servira de base de comparaison face d autres proc d s envisag s comme les techniques statistiques telles que la corr lation Un r sum de l chelle de scores et des poids attribu s aux diff rents indicateurs est expos en annexe NL Le d tail des essais n est pas pr sent dans ce rapport n ayant comme r f rence que le nombre d agr gats esp r s et une carte papier des orientations de production sur les communes originales nous avons effectu des tests visuels en premier lieu De plus nous avons choisi le nombre total d agr gats et le nombre de communes agr g es respectivement agr geantes conservant leur orientation de production lors de l agr gation pour juger de l efficacit de la m thode Nous n avons eu besoin que de trois tentatives pour trouver un jeu de poids donnant des r sultats satisfaisants L objectif tant de rapidement progresser et migrer sur les donn es 2000 nous n avons conserv que les r sultats de la solution retenue D autre part la progression de la valeur limite du nombre d exploitations VL pour la s lection des germes est une notion apparue tr s t t dans les discussions et apportant rapidement les r sultats escompt s Cette solution s est de suite impos e comme r f rence tout en gardant en r serve la possibilit d utiliser une VL fixe sur
14. coupe 14 13 et il nous reste dans la liste pr c dente les relations 6 8 et 13 14 liminer de la liste issue de l tape 3 Etape 6 On effectue l agr gation des polygones et de leurs attributs Dans le cas pr sent il reste effectuer r ellement l agr gation sur les couples 2 1 8 7 14 13 Figure 3 Exemple th orique d agr gation Dipl me EPFL Bertrand Barbey Mars 2002 Page 28 Proc dures d agr gation multifactiorelle Etapes d agr gation Remarque les communes sans exploitation ne sont pas trait es dans la proc dure comme des germes mais agr g es en dernier ressort En effet il est impossible d tablir une ressemblance significative avec ces communes De plus il est pr f rable d effectuer l agr gation la fin le seul crit re tant d ordre esth tique Tous les tests r alis s avec les donn es 96 de l OFS Agr se basent sur la repr sentation initiale des communes 96 laquelle nous avons appliqu le masque d altitude et la proc dure d limination des communes complexes savoir la conservation du plus grand fragment d une commune compos e initialement de plusieurs polygones et l agr gation des autres parties leur plus grand voisin cf annexes IX 1 et 2 De plus quelques tests sur un programme multicrit re sont effectu s en premier lieu afin d tablir un jeu de poids permettant d aboutir un nombre d agr gations assez lev pour un r sultat satisfaisant
15. d achat de semences et d engrais pour les champs diminuent il se peut que l exploitation change de sp cialisation la marge li e aux animaux devenant alors inf rieure celle produite par les c r ales Cette situation traduit deux tendances contradictoires D un c t l volution de la structure du revenu agricole de l exploitation est parfaitement transmise Par contre l ennui r side dans le fait que d une ann e l autre l exploitation n a enregistr aucun changement de quantit dans sa production ce que laisserait supposer la modification de sp cialisation Dipl me EPFL Bertrand Barbey Mars 2002 Page 14 Proc dures d agr gation multifactiorelle Th orie tn CE tre EEE EE Ee eege Ereegnes ee PIE LE REP EC ege tte A EE Ee eege ee RE DEP OI EU ON LE TI TE 2 5 PRINCIPES DE LA R SOLUTION MULTICRIT RE La m thode multicrit re repr sente l exemple type de la r solution multifactorielle d un probl me Elle permet d valuer simultan ment plusieurs variantes en les comparant sur divers param tres avec la possibilit de conf rer des priorit s ou importances diff rentes aux crit res retenus en leur attribuant un facteur multiplicatif poids Crit re apr s crit re nous valuons le degr de ressemblance en attribuant un score choisi dans une chelle fix e auparavant par l op rateur Dans la situation qui nous occupe il s agit de trouver pour une commune comptant moins de 12 exploitations agricoles germe la co
16. entre les donn es du recensement et leur emprise spatiale puisque ces informations sont li es l exploitation sans v ritable connexion avec les parcelles concern es Nous proposons dans la suite quelques pistes et leur applicabilit Tout d abord un lien ponctuel peut tre cr en r f ren ant les donn es relev es l emplacement d un b timent d termin dont les coordonn es g ographiques suisses sont d j disponibles g ocodage C est le premier pas d une m thode qui n cessiterait une phase de spatialisation de donn es ponctuelles Dans ce domaine nous pensons des syst mes permettant de cr er des polygones autour de points de r f rence polygones de Thiessen ind pendants des attributs des points D autre part il existe une extension ArcView qui propose plusieurs proc d s d interpolation permettant directement de repr senter un th me donn comme sont souvent r gionalis s les ph nom nes m t orologiques En effet 1l serait envisageable d assimiler les donn es de MBS une mesure d intensit de production animale ou v g tale Pourtant 1l persisterait un probl me de repr sentation avec une telle m thode En effet nous pouvons ais ment imaginer que l essentiel des b timents agricoles se trouve concentr dans la partie construite des villages Le r sultat d interpolation ne correspondrait pas la distribution r elle des domaines exploit s et l agr gation m me si elle s applique directeme
17. est alors tr s proche de l activit agricole men e sur la commune mais nous perdons alors l information concernant la classe de production de chaque exploitation Par cet exemple nous montrons que l avantage peut tre le plus utile l OFS Agr est le caract re modulable et reproductible de la m thode le principe reste valable pour toutes sortes d agr gation et pour diverses donn es L application du prototype pour la repr sentation des surfaces herbag res rapport es la SAU totale de la commune apporte la confirmation son efficacit et de sa maniabilit 11 2 INCONV NIENTS ET LIMITATIONS La plus grande contrainte se situe au niveau du crit re de confidentialit puisqu il d termine en grande partie les statistiques qui ne pourront jamais tre repr sent es l chelle communale Par exemple il existe certaines productions animales qui restent relativement marginales si bien qu il faudrait agr ger beaucoup trop de communes pour atteindre le seuil de 4 exploitations Le r sultat ne serait plus repr sentatif de la localisation de ce type de production Comme cette condition d anonymat n est pas amen e changer l avenir 1l faudrait plut t s affranchir des limites administratives et politiques commune district canton ventuellement Nous en discuterons quelques aspects dans le chapitre 12 Dipl me EPFL Bertrand Barbey Mars 2002 Page 55 Proc dures d agr gation multifactiorelle Synth se Le probl me consist
18. gation multifactiorelle Situations contentieuses D autre part on peut observer que le r sultat est globalement bon au niveau de la forme des agr gats En outre le programme suit les contraintes implicites souhait es puisque l agr gation entre une commune d orientation animale et une de production v g tale est vit e autant que possible Finalement on peut remarquer que la fronti re cantonale a t respect e diminuant encore la probabilit d association entre Villeneuve et Granges Marnand Ce dernier point permet galement de justifier la r union de Marin NE en brun fonc Saint Blaise au Nord Ouest sur la figure 7 c est le crit re d appartenance au canton qui 3 d cid de l agr gation finale entre ces deux solutions assez proches En effet la commune de Gampelen BE se retrouve cart e au profit de St Blaise qui appartient au m me canton que Marin en d pit d un l ger avantage du point de vue de la ressemblance Figure 7 Influence du crit re d appartenance au canton Si dans le cas de Villeneuve et de Marin il tait tout de m me possible de r unir le village concern une commune de production semblable en modifiant le jeu de poids par exemple ce n est pas toujours le cas Voici quelques exemples o m me l intervention humaine se r v lerait impuissante Figure 8 Commune isol e du point de vue de la typologie exemple 1 Dans la r gion d Olten ci dessus comme vers Zurich ci dessou
19. l ensemble des it rations n cessaires l limination des germes Pour toutes les prochaines informations des chapitres 5 7 contenant d une s quence de poids l ordre des valeurs correspond la liste des indicateurs ci dessous 1 Appartenance au canton 2 Ressemblance nombre d exploitations 3 Ressemblance orientation de production 4 Esth tisme fronti re commune 5 Esth tisme indice de Grav lius 6 Esth tisme taille de l agr gat Par exemple le jeu de poids ayant abouti la meilleure agr gation jusqu ce point se pr sente sous la forme 1 3 5 2 2 1 valeur de r f rence Dipl me EPFL Bertrand Barbey Mars 2002 Page 29 Proc dures d agr gation multifactiorelle Situations contentieuses 6 SITUATIONS CONTENTIEUSES Dans ce chapitre sont pr sent s les r sultats concrets obtenus lors de l application du programme d agr gation par r solution multicrit re Les donn es de base sont les polygones repr sentant les communes et les informations du recensement 96 des entreprises agricoles Nous attribuons le jeu de poids de r f rence 1 3 5 2 2 1 aux indicateurs selon l ordre d taill au chapitre pr c dent Le crit re de confidentialit est assur par l tablissement d une valeur limite minimale VL du nombre d exploitations de la commune Nous choisissons de varier cette VL 2 4 8 12 et 12 lors de 5 it rations du programme de mani re favoriser l agr gation des petites communes
20. la r solution multicrit re summer 15 2 6 Pr sentation et valuation de quelques m thodes statistiques 15 2 6 1 TESTS SUR LES OBSERVATIONS nent innlianbsienitites 16 262 TESTS SURL S ennemie 17 2 6 3 ANALYSE EN COMPOSANTES PRINCIPALES ACEN 17 Dipl me EPFL Bertrand Barbey Mars 2002 Page 1 Proc dures d agr gation multifactiorelle SU LE EE DD D D RS DO LT D S SDS DL TE LG LL D ST ND mn ne ee een mener 3 INFORMATIONS PR LIMINAIRES cs eenneerneneeseeceneeeeeeneeeeens 19 31 Offce F d ral de la SMS tisane 19 MA FONCTIONNEMENT GENT eege 19 3 1 2 DANS LE CADRE DE CE PROJET WE 19 3a E 19 EK Tt ENEE ees 20 E A EE 21 4 e Dk Ee ee NEEN 22 Ad Cat re EES 23 4 2 Crit re de CS D rennes anne 23 4 3 Crit re d appartenance E en dossimenttedteiqunnes ed 24 d dE OU OP PR NT RE SET 24 4 4 1 LINDE DE C MPACITE nement 24 4 4 2 LA FRONTI RE COMMON geet ee eg 25 4 4 3 L TADIE DE LAOREGAT nn nie eee noi et 26 5 PRINCIPALES TAPES D AGR GATION su sssneesensesneeesseneesneneens 27 K A Un OO RU 1E 27 5 2 Simulation d agr gation eeeeeseeesesesssesssseresetstrererrerererssessssesessesesee 28 D SITUATIONS CONTENTIEUSES ssmesssssesesesssneensenesenennnnnnenee 30 6 1 Mauvaise agr gation du point de vue de la forme de l agr gat 30 6 2 Mauvaise agr gation du point de vue de la ressemblance 31 6 3 Le cas particulier du PO 33 7 SIGNIFICATION DES INDICATEURS AE 37 Lil EE 37 T D PE PE ET 37 SC d
21. mixte majorit animale ou v g tale est relativement mince permettant des communes de typologie diff rente d obtenir un coefficient de corr lation assez lev On se retrouve dans une situation tr s semblable celle pr sent e au paragraphe 9 1 2 et illustr par la figure 15 Dipl me EPFL Bertrand Barbey Mars 2002 Page 47 Proc dures d agr gation multifactiorelle D veloppement du prototype Il faut encore pr ciser que apr s la premi re op ration r 0 52 il reste 38 germes dont tous les voisins pr sentent un coefficient inf rieur au seuil fix 160 apr s la seconde et la quatri me 383 apr s la troisi me Comme il reste passablement de germes ne pouvant pas tre agr g s au vu des conditions impos es par le seuil de corr lation nous tentons deux alternatives D une part nous d cidons d ex cuter le programme sans seuil r 0 avec VL croissante et d autre part nous reprenons les r sultats de la deuxi me exp rience pour y appliquer le m me r gime r 0 sur deux it rations suppl mentaires avec VL 12 Coefficient de Nombre Communes Sur l orientation 78 5 ra agr g es de production g inchang es Sur la typologie 43 1 42 3 Communes Sur l orientation 89 4 91 0 agr geantes de production inchang es Sur la typologie 66 6 69 9 Tableau 17 Corr lation de Spearman variations du seuil de corr lation exemple 2 Au vu de ces r sultats d tails en annexes XII 2 et XV
22. rentes m thodes test es pourrait probablement s appliquer d autres domaines que la statistique agricole moyennant les modifications inh rentes aux particularit s de toute discipline 10 1 COMBINAISON DE M THODES Pour v rifier ces propos nous effectuons des exp riences consistant injecter la corr lation ou le calcul de distance dans le jeu d indicateurs de la m thode multicrit re en tant qu unique indicateur de ressemblance Dans les deux cas nous rempla ons l attribution discr te d un score par le syst me suivant on alloue le score maximal au x voisin s qui obtient obtiennent la corr lation la plus lev e ou la distance la plus faible et aux autres un score d gressif d pendant du nombre de voisins restants Cette formule permettra peut tre d augmenter le pouvoir discriminant de la m thode tant de surcro t appliqu e galement aux indicateurs d esth tisme taille et indice de Grav lius de l agr gat Pour la comparaison nous effectuons galement un test avec une attribution chelonn e des scores telle qu elle a t appliqu e jusqu ici Les sch mas d allocation des scores ainsi que le principe du score d gressif sont pr sent s en annexe XIL3 Remarquons encore que ce syst me r duit quelque peu le caract re empirique de l attribution des scores En effet seules les valeurs maximum et minimum de l chelle sont d cid es par l homme Ensuite le score n est pas d pendant d intervalles o sit
23. ristiques mais sans l identification des agriculteurs agr gation des r sultats par communes districts ou cantons selon les commandes Remarque sur la qualit des informations Les marges brutes standard MBS par type de production sont calcul es par la FAT la Station f d rale de recherche en conomie et technologie agricole de T nikon qui fait partie d un groupe de 6 stations de la recherche agricole suisse SAR Swiss Agricultural Research La FAT proc de une mise en valeur centralis e de donn es comptables issues d un chantillon de 3000 4000 exploitations et calcule sur cette base une s rie de chiffres cl s qui fourniront une information importante dans le cadre de l valuation de l impact des diff rentes mesures de politique agricole sachant que les paiements directs occupent le premier plan dans le revenu de l agriculteur De plus les r sultats sont galement mis disposition pour la recherche la formation la vulgarisation l estimation des biens fonds agricoles la prise de d cisions agro politiques y compris l valuation des mesures de politique agricole Pour l OFS la FAT tablit des normes ou standards sur chaque type de production agricole comme par exemple la marge brute standard MBS pour 1 hectare d orge Cette valeur correspond au rendement financier potentiel de la culture en question dont sont soustraites les d penses directement li es semences engrais La FAT donne galement des
24. sol sa d clivit la v g tation pr sente avec les propri taires et les subventions allou es constitue un exemple d analyse sophistiqu e que permet l usage d un SIRS Nous tendons d velopper une facette de cette fonctionnalit dans le cadre de Dipl me EPFL Bertrand Barbey Mars 2002 Page 11 Proc dures d agr gation multifactiorelle Th orie ce travail puisqu il s agit de comparer les polygones adjacents sur la base de leurs attributs respectifs 2 2 ARCVIEW AVENUE ArcView est l un des logiciels de SIRS les plus utilis s et les plus puissants pour la r solution de probl mes touchant l analyse spatiale et la cartographie Il permet d acc der aux donn es de fichiers aux formats les plus divers g om trie et attributs de ArcView ArcInfo et Maplnfo images TIFF JPEG BMP bases de donn es EXCEL dessins CAO AutoCAD MicroStation etc De cette technologie nous utilisons la version ArcView 3 2 pour des raisons de compatibilit entre l EPFL et l OFS Le langage Avenue est l une des m thodes les plus accessibles et les plus utilis es pour l laboration de programmes et applications ex cuter avec le logiciel ArcView Tout comme Visual Basic Avenue est un langage de programmation orient objet tr s simple de structure et d utilisation compatible avec le logiciel ArcView Comme le premier prototype a t r alis avec ce langage il est apparu vident de poursuivre dans cette voie bien
25. tes Tableau 3 R capitulatif des donn es disposition description et format Dipl me EPFL Bertrand Barbey Mars 2002 Page 20 Proc dures d agr gation multifactiorelle Informations pr liminaires 3 4 BESOINS L OFS Agr classe ses clients en 3 cat gories 1 le grand public la presse et les m dias g n raux 2 les sp cialistes des analyses et valuations statistiques i e les universit s les bureaux sp cialis s les organismes concern s au niveau de la recherche Institut d conomie rurale 3 les chambres f d rales commissions et les personnes ou organismes concern s au niveau politique cantons presse agricole sp cialis e tudiants Les premiers clients recherchent tout d abord une information n ayant pas pour but d analyser les donn es ou de les utiliser pour appuyer une d cision Ils se contentent le plus souvent de graphiques et tableaux ne demandant que peu souvent des donn es sous la forme cartographique Par contre la troisi me cat gorie de consommateurs de statistiques utilise essentiellement des cartes pour illustrer et renforcer un argument ou comme document servant de base une r flexion ou une conclusion Les sp cialistes commandent les deux types de donn es pour mieux tudier et comprendre certains ph nom nes dont ils s occupent Dans le domaine de l agriculture la statistique f d rale rev t le caract re d une statistique transversale qui touche et int gre
26. tessinois avec ces nombreuses communes ne comportant qu une ou deux entreprises agricoles Un exemple tir des bords du lac de Lugano r sume l ensemble des configurations sp ciales d taill es auparavant Figure 10 Tessin cas particulier sur les bords du lac de Lugano situations initiale et de r f rence Dipl me EPFL Bertrand Barbey Mars 2002 Page 33 Proc dures d agr gation multifactiorelle Situations contentieuses En surimpression se trouve le nombre d exploitations de chaque commune on peut remarquer qu il est impensable de former naturellement des unit s d une seule orientation de production d autant plus qu on commence par r unir les petites communes Ce probl me se r percute sur la forme de l agr gat et sur sa typologie finale quel que soit le mode d agr gation choisi Dans ce cas de figure il semble pourtant envisageable de trouver une meilleure solution qu illustr e par la figure 10 en essayant de limiter davantage la taille finale des agr gats par exemple cf figures 13 et 14 Nous avons effectu quelques essais en ex cutant le nombre d it rations n cessaire l limination de tous les germes Nous appliquons d abord le jeu de poids de r f rence 1 3 5 2 2 1 avec la valeur limite du nombre d exploitations fixe VL 12 puis en chelonnant davantage les valeurs attribu es au seuil VL VL 2 4 6 8 10 12 Figure 11 Tessin variations de la VL sur le nombre d exploita
27. vecteur caract ristique en fonction de la typologie du germe La distance D est d termin e sur la base des trois premi res composantes si le germe est de typologie v g tale sur les deux derni res s il est plut t orient sur la production animale sur les cinq sinon On peut galement appliquer un syst me similaire en se fondant sur la sp cialisation du germe Le fonctionnement de ces deux proc d s est d taill en annexe XVI 1 T d Fonction de Fonction de la ne la typologie sp cialisation e du germe du germe N Nombre 939 958 d agr gats Communes Sur I orientation 76 6 ne Ges agr g es de production inchang es Sur la typologie 39 6 38 1 44 8 Communes Sur l orientation g5 4o 86 4 90 1 agr geantes de production inchang es Sur la typologie 57 3 60 6 66 6 Tableau 18 Calcul de distance euclidienne selon diff rents sch mas fonctions de la typologie ou de la sp cialisation du germe Les remarques effectu es lors des variantes pr c dentes sp cialisation et corr lation peuvent s appliquer telles quelles propos de ces r sultats En effet ceux ci pr sentent un ordre de grandeur significatif rendant tangible une puissance plus faible de ce syst me par rapport la r solution multicrit re de r f rence Malgr tout la distance euclidienne constitue un moyen formidable et tr s simple de confronter deux vecteurs caract ristiques des communes comparer Aussi est il possible d appli
28. x Alg bre lin aire Prof THOMAS LIEBLING Lausanne 1996 amp Probabilit s et Statistique pour ing nieurs Prof STEPHAN MORGENTHALER Lausanne octobre 1995 amp Introduction la statistique Prof STEPHAN MORGENTHALER PPUR Lausanne 1997 amp Reflets de l agriculture suisse Edition 1998 OFFICE F D RAL DE LA STATISTIQUE Neuch tel 1999 GEOSTAT manuel de l utilisateur OFFICE F D RAL DE LA STATISTIQUE Neuch tel 2001 x D veloppement d une m thode d agr gation d entit s territoriales pour les besoins de diffusion et de protection des donn es de la statistique agricole M moire de dipl me de cycle postgrade ROMAIN TORNAY Lausanne octobre 2001 Modern applied statistics with S PLUS W N VENABLES amp B D RIPLEY Second Edition Springer Editions New York 1994 Statistique conomie gestion sciences m decine THOMAS H amp RONALD J WONNACOTT 4 dition Editions Economica Paris 1991 Dipl me EPFL Bertrand Barbey Mars 2002 Page 62 Proc dures d agr gation multifactiorelle Bibliographie Articles Un tour d horizon riche et s duisant Communiqu de presse OFFICE F D RAL DE LA STATISTIQUE Neuch tel novembre 1997 Net recul de l emploi dans l agriculture entre 1990 et 1996 Communiqu de presse OFFICE F D RAL DE LA STATISTIQUE Neuch tel janvier 1998 Programme pluriannuel de la statistique f d rale pour les ann es 1999 2003 OFFICE F D RAL DE LA STATISTIQUE Neuch tel
29. 12 Ensuite nous exp rimentons une formule diff rente en fixant VL 12 sur 5 it rations avec un coefficient de corr lation r 0 74 Dans le tableau ci dessous se trouve un r sum des r sultats obtenus pour ces premi res manipulations Coefficient de 0 74 0 74 et corr lation r d Ea 12 Nombre Communes Sur l orientation 757 793 80 2 80 4 agr g es de production inchang es Sur la typologie 43 8 43 6 441 7 Communes Sur l orientation oam ode 91 0 90 1 agr geantes de production i i inchang es Sur la typologie 69 0 66 5 67 0 Tableau 16 Corr lation de Spearman variations du seuil de corr lation exemple 1 Etonnamment toutes ces formules aboutissent des r sultats tr s semblables alors qu on pourrait s attendre un taux de r ussite plus important pour un seuil lev On peut envisager une partie d explication cette situation dans les Alpes les Pr alpes et la partie sup rieure du Jura l levage est presque exclusif les coteaux du Valais et du Tessin ainsi que des bords du lac L man sont vou s la viticulture la plaine s appuie sur les grandes cultures ou sur des exploitations mixtes Cette sorte de r gionalisation de la production diminue le risque de conflits d agr gation expliquant le bon taux g n ral de r ussite m me avec un seuil de corr lation bas voire nul comme ci dessous D autre part la fronti re entre les typologies peu marqu es
30. 2 pr sentant l indice de Grav lius et le nombre d exploitations moyens des agr gats diff rents entre la m thode de r f rence et chacun des autres syst mes Le nombre d agr gats identiques donne une indication sur la similarit des variantes Nb agr gats identiques_ Nombre Indice G Taille Nombre Indice G Taille _ Distance 4435 845 137 260 ME ee 423 138 251 EE WE __668 1 38 24 EE es 632 138 256 WE Communes Moyenne Moyenne Moyenne S 2896 1 31 24 3 Tableau 22 Nombre d agr gats indice de Grav lius et nombre d exploitations moyens par agr gat sur toute la Suisse et sur les r gions o les diff rentes m thodes n ont pas effectu les m mes agr gations Nous pouvons affirmer que la combinaison multicrit re distance repr sente l aboutissement de ces premiers d veloppements Toutefois dans l optique d une utilisation mod r e d un tel programme les r sultats obtenus par la simple r solution multicrit re en comparant les communes sur leur classe de production plut t que sur leur typologie laissent envisager quelques am liorations possibles En effet malgr la simplicit de la classification des communes d apr s la m thode utilis e pour d terminer la sp cialisation des exploitations les produits de l agr gation sont tr s semblables la solution de r f rence Nous pouvons d s lors imaginer qu en laborant un syst me de classification mixte entre la typ
31. 96 de l OFS Agr 5 1 DESCRIPTION TH ORIQUE Tout d abord un masque d altitude a t cr d apr s le mod le num rique de terrain MNA 100 d une r solution de 100m en s lectionnant tous les points sup rieurs 1600m d une part et 2000m dans une seconde application Toute la phase de transformation d une grille s lection de pixels du MNA vers un polygone contour vectoriel en format Shape shp a t r alis e par un collaborateur de la chaire de SIRS de l EPFL Ensuite le d coupage des communes suivant ce masque a fragment certaines communes Cette complication s est greff e au probl me des communes repr sent es par un polygone complexe entit compos e de plusieurs formes g om triques non adjacentes La dissociation de ces polygones l allocation des attributs au plus grand fragment et l agr gation des petites sections leur plus grand voisin en surface ont toutes t programm es par ce m me collaborateur et test es avec le masque pos 1600m d altitude L tude de ces scripts nous a permis de nous familiariser avec le langage Avenue et de comprendre les diff rents obstacles li s la programmation et la configuration g ographique des polygones Nous avons utilis le masque 2000m format vectoriel pour effectuer nos propres tests l aide de ces scripts afin d effectuer le parall le entre les fonctions programm es et les op rations r alis es sur les polygones et sur les donn es tabulaire
32. E AGR GATION DU POINT DE VUE DE LA RESSEMBLANCE Nous pouvons observer qu il n y a pas d erreur flagrante lors de l agr gation utilisant la m thode multicrit re mais juste quelques ambigu t s Prenons l exemple de la commune de Villeneuve FR figure 6 en brun fonc qui alors qu elle est sp cialis e en culture v g tale plus de 70 elle se retrouve agr g e des exploitations mixtes produisant de surcro t un agr gat dominante animale Figure 6 Situation litigieuse du point de vue de la ressemblance Dans cet exemple s exprime en r alit une grande partie de la complexit de la probl matique ainsi que la difficult de trouver des indicateurs efficaces et de leur attribuer des poids pertinents Si l on raisonne uniquement en terme de ressemblance une r union avec Granges Marnand VD en marron au Nord NE aurait t meilleure En plus l information th matique se trouve un peu liss e puisqu il ne reste que des teintes pastel sp cialisation peu dominante et une majorit d agr gats mixtes Une telle configuration finale rel ve aussi probablement de la proc dure d agr gation appliqu e En utilisant des valeurs limites successives croissantes on force les petites communes s agr ger en premier Dans l extrait ci dessus Villeneuve 10 exploitations s est certainement trouv e parmi les derni res communes devoir s agr ger Dipl me EPFL Bertrand Barbey Mars 2002 Page 31 Proc dures d agr
33. IT pour d terminer de nouveaux indicateurs en combinant les informations de l OFS avec des donn es de domaines vari s comme la topographie la p dologie ou la m t orologie Il s agit galement d ouvrir la discussion sur les possibilit s de s affranchir des fronti res administratives pour la repr sentation des statistiques agricoles 1 4 METHODOLOGIE Ce travail est essentiellement organis sur la r solution de l agr gation des communes ne v rifiant pas la contrainte de confidentialit Il se d roule en quatre phases principales la poursuite du travail de R Tornay 2001 sur les donn es du recensement 96 l adaptation et le d veloppement du prototype sur les donn es 2000 d orientation de production la mise en place d un syst me plus g n ral et une tape d analyses et de perspectives Pour la premi re phase il s agit tout d abord de d terminer un syst me d indicateurs et de param tres correspondants en tenant compte des contraintes informatiques et des v ux exprim s par l OFS Agr Ceux ci d terminent trois axes d agr gation Dipl me EPFL Bertrand Barbey Mars 2002 Page 9 Proc dures d agr gation multifactiorelle Introduction 1 respect de la protection des donn es 2 ressemblance entre communes bas e sur la variable repr senter 3 esth tisme du r sultat Ensuite nous programmons une solution traitant tous les facteurs susmentionn s de mani re int gr e soit une proc dure d agr gation multicr
34. Maximum valeur maximale des diff rences des composantes en valeur absolue Manhattan somme de la valeur absolue des diff rences des composantes Binaire proportion de valeurs non nulles que deux vecteurs n ont pas simultan ment en commun soit le nombre de bin mes avec un z ro et une valeur non nulle divis par le nombre de couples avec au moins une valeur non nulle Dans le cadre de ce travail nous nous contenterons de la formule la plus courante savoir la distance euclidienne La m thode Manhattan semble quasiment identique alors que la Dipl me EPFL Bertrand Barbey Mars 2002 Page 48 Proc dures d agr gation multifactiorelle D veloppement du prototype variante Binaire nous para t moins bien adapt e la probl matique Un test pourrait tre r alis lors de d veloppements futurs avec la m thode Maximum 9 3 1 DISTANCE SUR LES MBS EN POURCENT De la m me mani re que pour la m thode de corr lation nous utilisons l indicateur de la distance comme unique facteur d agr gation L exp rience de la corr lation ayant illustr que la mise en place d un seuil s av re insignifiante nous effectuons un seul test avec la formule suivante sera commune agr geante le voisin qui pr sentera une distance euclidienne minimale par rapport au germe VL 2 4 8 12 12 et 12 Ensuite nous tentons d affiner quelque peu la proc dure d agr gation en calculant la distance sur un nombre restreint de composantes du
35. SIRS en rapport avec la probl matique de ce travail Nous tendrons nos r flexions travers des perspectives de production et d utilisation de telles techniques au sein de l OFS sans donner de solutions d finitives mais plut t quelques indices pour r soudre de nouvelles situations Dipl me EPFL Bertrand Barbey Mars 2002 Page 21 Proc dures d agr gation multifactiorelle Crit res d agr gation 4 CRIT RES D AGR GATION Comme mentionn s auparavant la d cision et le choix des agr gats s effectuent encore par voie humaine sur la base de plusieurs facteurs de mani re assurer la coh rence et l esth tisme du r sultat Dans le cadre de ce travail de dipl me le choix des crit res d agr gation s est r duit reprendre les crit res tablis tout d abord par l OFS et rediscut s avec R Tornay lors de son travail de fin de cycle postgrade l EPFL Nous avons obtenu l explication et la justification de chaque crit re de mani re accorder nos points de vue sur l orientation donner ce projet Nous avons donc choisi de suivre les m mes principes directeurs en gardant le m me jeu de crit res relativement restreint puisqu il ne comporte que 4 l ments mais suffisamment toff pour repr senter tous les int r ts entrant en ligne de compte Il s agit alors des cat gories suivantes 1 Confidentialit soumis la loi sur la protection des donn es l OFS ne peut diffuser ses donn es que sous une forme ano
36. Sciences et Ing nierie de l Environnement mn pf es Chaire de SIRS oc COLE POLYTECHNIQUE Syst me d informations R f rence Spatiale F D RALE DE LAUSANNE Travail pratique de dipl me PROC DURES D AGR GATION MULTIFACTORIELLE D UNIT S TERRITORIALES Application l expression cartographique de diverses statistiques agricoles er Statistique suisse Office f d ral de la statistique di 7 Agriculture et sylviculture Lausanne mars 2002 Bertrand BARBEY Candidat Professeur Fran ois GOLAY Encadrement R gis CALOZ EPEL SIRS Jean Fran ois FRACHEBOUD OFS Proc dures d agr gation multifactiorelle A 0 RS GPA A LL LES LG LEO PUERTO NEEDS LEE LEGS LTD LA DUT STD D CODE LD LG LT DU Sn M SR nn en nn nee enr ennnnnnnt TABLE DES MATI RES INDEX DES TABLRAUX SR Re s rE EEEE 4 INDEX DES Le 5 KDEX DES EQUATIONS dde dec ce eeneg 5 REESEN tege 6 REME ROEMEN T ee 6 LISTE DES ABR VIATIONS ssessesseesesseeseestertesteseesresrestesresresresressesseeseesreee 7 n E 8 i L Omer orie ai 8 12 PS ei RE E E ERE E ARR 8 KEN EE 9 la Metodologie E 9 2 Co EEN 11 2 1 Syst mes d Information R f rence Spatiale SIRS 11 Ai ane ee ae einen 11 A E CG EEN 11 213 EE 11 EEN hante eat elec era ete 12 2 3 M thodes de relev s statistiques isssesretennestnrnesentosstpenerdauiete 12 2 4 Etablissement d une typologie des entreprises agricoles 000000000 13 2 5 Principes de
37. ailleurs que d autres d coupages existants comme le district par exemple Il arrive fr quemment qu une commune ne r unisse pas suffisamment d exploitations agricoles pour garantir l anonymat des agriculteurs comme dans des cas extr mes o une seule exploitation se trouve sur le territoire communal Pour garantir alors Dipl me EPFL Bertrand Barbey Mars 2002 Page 8 Proc dures d agr gation multifactiorelle Introduction les objectifs de la protection des donn es la solution actuellement mise en uvre consiste regrouper des communes en un agr gat et pr senter une statistique englobant les donn es de toutes les communes ainsi r unies La plupart des op rations cartographiques transformant les relev s en donn es anonymes s effectuent encore manuellement l heure o le d veloppement des SIT permet d envisager une assistance informatique efficace L OFS Agr s int resse d ailleurs fortement ces nouvelles techniques La chaire de SIRS du D partement de G nie Rural DGR adh re ce projet en esp rant qu une telle m thode puisse galement servir d autres domaines de la statistique ou de la cartographie 1 3 OBJECTIFS Pour garantir des donn es statistiques fiables et repr sentatives l OFS Agr doit s adapter aux changements induits entre autres par la nouvelle politique agricole PA2002 Des r organisations sur les syst mes d acquisition et de traitement des donn es sont d ailleurs pr vues dans le programme p
38. alyse D autre part le texte complet des programmes d agr gation multicrit re simple pour la cartographie de l orientation de production en 1996 et en 2000 est disponible dans un document parall le ce rapport Dipl me EPFL Bertrand Barbey Mars 2002 Page 50 Proc dures d agr gation multifactiorelle G n ralisation 10 G N RALISATION M me si ce projet se rattache principalement l OFS nous estimons que la probl matique de repr sentation cartographique sous une contrainte ici la confidentialit constitue un th me relativement fr quent De m me l agr gation de polygones sur la base de leurs attributs repr sente une th matique importante dans le domaine de la t l d tection num rique polygone pixel Ainsi une notion pr sente en arri re plan dans l ensemble de ce travail r side dans la proposition d une d marche g n rale dont le principe pourrait s appliquer d autres domaines Ce n est pas tant l agr gation physique des polygones et de leurs attributs qui importe mais plut t la s lection parmi les communes adjacentes de celle qui pr sente les caract ristiques les plus proches de la commune concern e germe Nous cherchons une formule capable de classer les voisins dans l ordre de ressemblance sur la base de plusieurs facteurs et ceci dans des configurations diverses Dans ce sens la m thode de r solution multicrit re semble la plus universelle puisqu elle permet d une part de traiter plus
39. ant former des r gions repr sentatives s immisce plusieurs degr s dans le cadre de ce projet En raison de la pr sence de la contrainte de confidentialit l agr gation n effectue pas la r union des m mes communes d une statistique l autre et entre deux jeux de poids diff rents Les configurations finales n tant pas identiques il n est d s lors pas possible de r aliser des comparaisons ou des recoupements entre ces cartes th matiques Afin d utiliser au mieux les fonctionnalit s offertes par le SIT en compl ment au programme d agr gation il serait profitable de former des r gions de r f rence entre les niveaux communal et de district Quelques pistes sont envisag es dans les Perspectives chapitre 12 Quelques probl mes de comparaison entre les diff rentes m thodes test es apparaissent cause de la typologie utilis e pour la cartographie En effet le calcul de distance et la corr lation ne pouvant tre simplement appliqu s la typologie nous avons choisi de manipuler les donn es de MBS pour valuer la ressemblance entre communes Cette r orientation induit quelques conflits de repr sentation th matique puisque l agr gation et la pr sentation du r sultat ne se font plus sur la m me variable Au niveau de la m thode et du programme les limitations ne proviennent pas du logiciel puisqu il rec le une multitude de fonctions assez puissantes et qu une nouvelle version ArcGIS 8 1 propose des d velopp
40. at 2000 utilis par l OFS M Steffen qui s occupe de la cartographie l OFS nous fournit une repr sentation de la Suisse qui abolit quasi totalement les enclaves carte correspondant au niveau de g n ralisation N 4 tablit par la section statistique de superficie de l OFS De plus quelques retouches y sont encore apport es pour un dessin des fronti res plus arrondi sur les rivi res et plus rectiligne sur les cr tes montagneuses 7 2 RESSEMBLANCE Nous nous sommes demand s il n y avait pas une r p tition dans le fait d utiliser le nombre d exploitations pour s lectionner les germes d une part et pour le crit re de ressemblance d autre part d autant plus que nous employons galement ce dernier param tre comme indicateur de taille Il est vrai que la comparaison d entit s de m me taille se r v le plus significative que lorsque la diff rence d entreprises agricoles est importante mais la r solution multicrit re devrait en tenir compte En effet la combinaison des facteurs Dipl me EPFL Bertrand Barbey Mars 2002 Page 37 Proc dures d agr gation multifactiorelle Signification des indicateurs pour le crit re de confidentialit est modulable Nous proposons de comparer l ex cution de r f rence du programme multicrit re avec une application sans cet indicateur de ressemblance correspondant respectivement aux poids 1 3 5 2 2 1 et 1 0 5 2 2 1 Pour chaque r alisation nous avons successivement attribu les va
41. au projet Citons titre d exemple la possibilit de combiner visuellement et physiquement dans une table de synth se plusieurs couches d informations ayant en commun la r f rence spatiale En outre pour de nombreuses op rations g ographiques la finalit consiste bien visualiser des cartes et des graphes La carte est en effet un formidable outil de synth se et de pr sentation de l information Les SIRS offrent la cartographie moderne de nouveaux modes d expression permettant d accro tre de fa on significative son r le informatif Les cartes cr es avec un SIRS peuvent d sormais facilement int grer des rapports des vues 3D des images photographiques et toutes sortes d l ments multim dia Par la transformation et le traitement des donn es il est possible d tablir des liens logiques entre des changements observ s et les mesures entreprises pour enrayer ou favoriser un ph nom ne naturel ou autre Ce genre d examen peut servir de base des d cisions pour des domaines aussi vari s que l administration l conomie ou la recherche 2 1 3 ANALYSE SPATIALE L int gration de donn es au travers des diff rentes couches d informations permet d effectuer une analyse spatiale rigoureuse Cette analyse par croisement d informations si elle peut s effectuer visuellement l identique de calques superpos s n cessite souvent la liaison avec des donn es alphanum riques Croiser la nature d un
42. b E 38 8 AUTRES PROC DURES D AGR GATION 41 Sl Mehodes ln Lt Lee OS AREE EEE 41 8 1 1 CORR LATION SIMPLE SUR LES OBSERVATIONS 41 5 12 CORR LATION SUR LES RANGS ntontonitaneastienaretntianihenl 42 8 2 e TT 42 8 2 1 SCORE DE PEARSON RH CARR sconisnrenerianeenaatenennannanne 42 s DISTANCE SUR LES COMPOSANTES PRINCIPALES nes 43 Dipl me EPFL Bertrand Barbey Mars 2002 Page 2 Proc dures d agr gation multifactiorelle A 0 SG D DA LL LS LG DO DUREE LEE LG LT DELA STD DO D LOT LG D D Sn MT SR nn ne near nent 9 D VELOPPEMENT DU PROTOTYPE SUR LES DONN ES 2000 44 OS Te ee ee 44 9 1 1 T POOO e eE iR Eege EENEG ee 44 9 1 2 SEREN EEE E O EA A EE 45 9 2 M thode de la corr lation sur les rangs egsgedreerdirgEegdeege eegene aeren 47 9 3 M ihode par calcul de RS diam geeeg 48 9 3 1 DISTANCE SUR LES MBS EN POURCENT eee re eeeee ee ceeeneeceeeneeeceecneeceeene 49 9 3 2 DISTANCE SUR LES COMPOSANTES PRINCIPALES srrmrereerereneeneeneeneenrenrenrenee 49 10 RS TO mean tt nt 51 10 1 Combinaison de m thodes ses eee ceeseceeresses 51 10 2 Application de l agr gation de communes sur d autres donn es 54 bh WE n a E E E S E E 55 11 1 Les avantages d un programme d agr gation d unit s territoriales 55 112 Inconv nients et Imtapons eee 55 11 3 Tableau synth tique des m thodes test es 57 12 ENEE 58 12 1 Optimisation GAEREN 58 12 2 LE Re ent e 58 123 Modifications de la Classification ssssersess
43. ce 1 5 3 1 et VL variable 2 4 8 12 et 12 La figure ci apr s r sume les r sultats de cette op ration dont le d tail se trouve en annexe XIV 3 4 carte Dipl me EPFL Bertrand Barbey Mars 2002 Page 45 Proc dures d agr gation multifactiorelle D veloppement du prototype Communes agr g es Communes agr geantes inchang es inchang es Nombre Sur l orientation Sur la Sur l orientation Sur la d agr gats de production typologie de production typologie 1 5 3 1 81 4 48 3 85 7 63 9 Tableau 15 M thode multicrit re sur la sp cialisation On remarque une l g re baisse g n rale de l efficacit du programme par rapport l application de r f rence Pourtant il faut relativiser quelque peu cette premi re impression En effet la m thode de r f rence compare en quelque sorte la r partition communale des types d entreprises En agr geant toutes les MBS des exploitations au niveau de la commune on d crit de fa on plus rigoureuse la structure de la production agricole de la commue Il peut d s lors arriver que des communes de structure semblable exprim e par le chiffre de la sp cialisation soient agr g es par ce second syst me mais pas par la r solution de r f rence car la majorit des exploitations ne correspondent pas cette sp cialisation globale Dans l exemple ci dessous illustrant une telle situation Mauraz est agr g e Pampigny en suivant la typologie L Isle en comparant la s
44. crit Dipl me EPFL Bertrand Barbey Mars 2002 Page 24 Proc dures d agr gation multifactiorelle Crit res d agr gation Les deux premiers sont utilis s principalement par des g ographes alors que le dernier convient bien l tude de bassins versants en hydrologie On remarque tout de suite qu ils se ressemblent tous puisqu ils font intervenir plus ou moins les m mes param tres Nous pouvons l gitimement supposer que dans le cas pr sent et pour le but que nous poursuivons tous ces indices pourraient tre utilis s et produire des r sultats semblables Par sa formulation il est ais de se repr senter g om triquement la signification de l indice de Grav lius puisqu il compare la forme consid r e avec un cercle En effet il est d fini comme le rapport du p rim tre du polygone au p rim tre du cercle ayant la m me surface De plus les composantes de l quation peuvent facilement tre d termin s partir de la g om trie d finissant chaque polygone dans ArcView Nous d cidons alors d adopter cet indice pour caract riser la forme d une commune ou d un possible agr gat entre deux communes d autant plus qu il est connu autant l EPFL qu l OFS Tant le p rim tre P que la surface S peuvent tre calcul s partir de la g om trie des polygones stock e dans la table des communes Le sch ma ci dessous met en vidence quelques valeurs prises par l indice exemple appliqu au domaine de l hydrologi
45. de nombreuses sources d informations statistiques de la superficie comptes conomiques statistiques des emplois des prix En ce sens la publication Reflets de l Agriculture Suisse tente de donner chaque ann e une vue synth tique de quelques aspects de l agriculture Sur le plan international l OFS Agr participe aux travaux de diff rentes organisations o Eurostat dans plusieurs groupes de travail traitant des concepts et des programmes de production statistique ainsi que de l analyse des r sultats o OCDE FAO CEE o Office nationaux de statistique avec lesquels une troite collaboration s est install e dans les domaines du traitement des donn es des DataWarehouses Dans chacune de ces relations l OFS Agr est amen pr senter des informations sous forme cartographique et ceci parfois dans des d lais relativement courts Pour un meilleur traitement des commandes et pour une efficacit accrue au sein de la section l int r t se porte sur des proc dures d automatisation dans l laboration des produits cartographiques C est dans ce but ultime que nous d veloppons un prototype pour l agr gation d entit s territoriales pour permettre l OFS de diffuser plus facilement ses informations En effet l laboration d un logiciel complet d passe le cadre r serv un travail de dipl me de dur e limit e Par contre il nous semble important d voquer les apports et les limites de la technologie actuelle offerte par les
46. e F L 5 Figure 2 Application de l indice de Grav lius l tude de bassins versants en hydrologie Source SSIE Institut d Am nagement des Terres et des Eaux IATE Laboratoire d Hydrologie et Am nagement HYDRAM Le N I 4 4 2 LA FRONTIERE COMMUNE La fronti re commune est un facteur simple dans sa conception et relativement efficace bien qu intuitif En effet il para t logique que l agr gation d un germe avec le voisin qui pr sente la plus grande fronti re commune aboutisse un polygone de forme plus r guli re que si les communes de base ne partagent qu une faible part de leurs limites Cet indicateur est utilis pour renforcer l action de l indice de Grav lius en minimisant leur impact respectif sur le crit re de ressemblance Si nous d sirons appliquer une r solution multicrit re nous pensons qu il est utile de normaliser cet indicateur de mani re faciliter l attribution d un score Nous proposons de rapporter la longueur de la fronti re commune au p rim tre du germe pour ne manipuler que des valeurs relatives en Pour le calcul de la fronti re commune nous utilisons deux fonctions sp cifiques de ArcView nous permettant d extraire la g om trie de ce fragment par intersection des deux p rim tres des polygones concern s et d en calculer la longueur par la suite Dipl me EPFL Bertrand Barbey Mars 2002 Page 25 Proc dures d agr gation multifactiorelle Crit res d agr gation
47. e Score d gressif e Insertion de la distance euclidienne dans la m thode multicrit re comme crit re de ressemblance e Score d gressif Tr s proche de la m thode manuelle Tr s bons r sultats peu de changements d orientation de production entre la carte initiale et la carte des agr gats Simple comprendre utiliser et programmer e Bons r sultats Bonnes possibilit s de g n ralisation d autres th mes Idem Corr lation de Spearman M thode assez proche de la r solution manuelle e Rigueur dans l attribution des scores e Possibilit s moyennes de g n ralisation Idem Multicrit re corr lation e Meilleurs r sultats avec un nombre de param tres restreints Tableau 25 Tableau comparatif des m thodes test es Dipl me EPFL Bertrand Barbey Mars 2002 Long programmer m me avec un nombre moyen de param tres programme particulier pour chaque th me cartographier indicateurs scores poids Efficacit d pendante du nombre de variables e Mons bonne sensibilit dans les situations d licates Mise l cart l esth tisme de la carte de Idem Corr lation de Spearman e Mons bonne sensibilit dans les situations d licates Idem Multicrit re corr lation Page 57 Proc dures d agr gation multifactiorelle Perspectives 12 PERSPECTIVES 12 1 OPTIMISATION DU PROTOTYPE Les r sultats obtenus dans le cadr
48. e dans le taux de changement d affectation des communes nous incite penser qu il serait probablement profitable d laborer une m thode de classification interm diaire entre la typologie tr s rigide et la sp cialisation assez g n rale et simplificatrice 9 2 M THODE DE LA CORR LATION SUR LES RANGS Comme pour les donn es du recensement 96 nous appliquons cette technique comme unique facteur d agr gation la diff rence pr s que pour chaque commune l chantillon comporte 12 montants de MBS au lieu de 8 valeurs repr sentant le nombre d exploitations par classe de production Cette variante permet de mieux consid rer la r elle structure agricole de la commune ind pendamment des particularit s de chaque exploitation La d cision d agr gation d pend de deux param tres comme pour toutes les autres m thodes un polygone voisin d un germe ne sert de commune agr geante que s il est le plus ressemblant c d le polygone pr sentant le coefficient de corr lation r le plus lev De plus afin d am liorer la qualit des agr gats du point de vue de la ressemblance nous appliquons une valeur limite du coefficient r au dessous de laquelle la r union des polygones n a pas lieu Nous r alisons diverses op rations partir de ce programme en variant le seuil de corr lation r 0 52 0 74 et 0 88 lors de la proc dure habituelle d it rations avec la valeur limite du nombre d exploitations mobile VL 2 4 8 12 et
49. e de ce travail avec les d veloppements r alis s sur le programme sont encourageants Pourtant 1l ne s agit justement que d un prototype avec toute la phase d am liorations possibles que ce terme sous entend En effet le langage de programmation Avenue n tant pas ma tris l entame du projet la proc dure labor e n est certainement pas id ale puisqu elle se base sur les fonctions les plus simples Elle n cessite d tre pur e pour am liorer la fluidit et la rapidit d ex cution probablement l aide de fonctions pr d finies ou d autres disponibles sur le site Internet d ESRI D autre part la recherche de la meilleure m thode n tant pas aboutie il est difficilement concevable de cr er un v ritable outil cartographique transmissible ou diffusable Dans l tat actuel du projet nous pouvons envisager au maximum la cr ation d une extension ArcView interne l OFS qui impliquerait l laboration d une description et d un mode d emploi d taill s de la m thode De surcro t la version 3 2 de ArcView ne b n ficiera que de tr s peu d am liorations l avenir l essentiel des d veloppements tant engag s sur le nouveau concept ArcGIS Ainsi la possibilit la plus simple de cr er un outil durable et volutif consisterait probablement transcrire le programme dans un langage plus universel comme Visual Basic Dans une perspective id aliste ces quelques travaux pourraient aboutir un logiciel ou une ex
50. e employ e sur des donn es 96 semble porter ses fruits puisque c est avec le jeu de poids 1 5 3 1 que nous obtenons les meilleurs r sultats De plus ces chiffres sont m me l g rement plus lev s que les valeurs obtenues lors des manipulations sur les donn es 96 tendant ainsi d montrer que l limination de 2 indicateurs sur 6 tait n cessaire ou tout au moins profitable En outre si l on observe galement les statistiques sur la forme des agr gats annexe XIV 1 il est manifeste que l utilisation des limites g n ralis es des communes suisses am liore consid rablement l esth tisme et la clart de la carte 9 1 2 SPECIALISATION Comme les diverses techniques suivantes cette solution propose un test de ressemblance plus fin par rapport la variante pr c dente puisqu elle s appuie partiellement sur les donn es suppl mentaires Toutefois la possibilit la plus simple de comparer les r sultats des diff rentes m thodes d velopp es consiste maintenir dans la table des communes les champs n cessaires la d termination de la typologie De ce fait cette table devient rapidement volumineuse entra nant un accroissement du temps de calcul Dans ce cas pr cis la table des communes contient en plus les MBS primaires et la sp cialisation de l entit communale L annexe XII 1 tableau 2 contient le sch ma d attribution des scores pour l unique test se d roulant dans les conditions standard poids de r f ren
51. e la table issue du recensement 96 et utilis e dans la partie pr c dente de ce travail Dipl me EPFL Bertrand Barbey Mars 2002 Page 44 Proc dures d agr gation multifactiorelle D veloppement du prototype Nous exp rimentons plusieurs jeux de poids dont nous comparons le r sultat d agr gation la repr sentation des donn es originales afin de d celer quelle solution se rapproche le plus de la r alit L annexe XII 1 tableau 1 contient le sch ma d attribution des scores Le tableau suivant pr sente les r sultats chiffr s alors que les annexes XIV 1 2 5S contiennent les d tails correspondants et la carte finale de r f rence L ordre des poids repr sente respectivement les indicateurs canton orientation de production forme et taille de l agr gat D autre part nous ex cutons le programme sur l entier de la Suisse en plusieurs it rations o seule la valeur limite du nombre d exploitations varie VL 2 4 8 12 et 12 mes CAE Ti d agr gats Communes Sur l orientation ze zo 86 9 89 5 88 7 agr g es de production inchang es Sur la typologie 50 2 51 0 52 2 53 0 Communes Sur l orientation 89 6 90 7 TR do agr geantes de production inchang es Sur la typologie 65 2 66 3 71 0 69 5 Tableau 14 M thode multicrit re sur la typologie variations des poids et d termination du jeu de r f rence Manifestement le fait de r cup rer la structure de r f renc
52. e mani re v rifier ou rejeter cette hypoth se nous ex cutons le programme avec l orientation de production comme champ discriminant lorsque deux voisins pr sentent le m me score selon la s quence suivante 1 it ration avec la valeur limite du nombre d exploitations pour le crit re de confidentialit VL 2 2 it ration avec NL 4 3 it ration avec VL 8 4 it ration avec VL 12 5 it ration avec VL 12 afin qu il ne reste qu une vingtaine de germes 1 Test A pour valuer l impact de chaque indicateur sur le r sultat final par rapport un essai sans ces indicateurs D autre part cette exp rience permet d estimer l influence de la combinaison des deux indicateurs par rapport une situation o un seul indicateur de forme prend pratiquement le m me poids que la combinaison a poids135221 jeu de r f rence b poids135301 accent sur la fronti re commune c poids135031 accent sur l indice de Grav lius d poids135001 sans indicateur de forme Dipl me EPFL Bertrand Barbey Mars 2002 Page 38 Proc dures d agr gation multifactiorelle Signification des indicateurs 2 Test B pour v rifier dans quelle mesure l indice G et la longueur de la fronti re commune LFC sont corr l s a poids000110 b poids000100 c poids000010 Pour chaque test nous observons les r sultats suivants l indice de Grav lius minimum atteint lors de l agr gation Min l indice maximum Max la pro
53. e source de motivation constante Les collaborateurs de l OFS Nadia Camilli Nadia Rognon Daniel Bohnenblust et Hans Steffen pour leur accueil leur disponibilit et la qualit de leurs interventions ayant permis une progression continue du projet Les collaborateurs de la chaire de SIRS Daniel Gnerre pour son soutien dans l apprentissage du langage de programmation Avenue et Marc Gilgen pour son int r t et sa disponibilit Dipl me EPFL Bertrand Barbey Mars 2002 Page 6 Proc dures d agr gation multifactiorelle Leer LISTE DES ABR VIATIONS AGIR CAO CEE Cst EMG EPFL SSIE ESRI FAO FAT GEOSTAT LAgr LFC LPD LSF MBS MNO3 MNA MS OCDE ODA OFAG OFEFP OFS BFS OLPD PSL SA GmbH SAR SAU SIRS SIG SIT UE USP VL Dipl me EPFL Bertrand Barbey Mars 2002 Page 7 Agence d Information Agricole Romande Conception Assist e par Ordinateur Communaut Economique Europ enne Constitution Suisse Espace M dia Groupe Ecole Polytechnique F d rale de Lausanne Section Sciences et Ing nierie de l Environnement Environmental Systems Research Incorporation Food and Agriculture Organization of the United Nations Station F d rale de recherche en conomie et technologies agricoles de T nikon SIT g r par l OFS et contenant leurs donn es statistiques Loi F d rale sur l Agriculture Longueur de la Fronti re Commune entre un germe et sa commune voisine Loi F d rale sur la Pro
54. ements sup rieurs Toutefois plus on envisage de manipuler des donn es d taill es jusqu l chelle de l exploitation par exemple plus la programmation devient complexe rallongeant par cons quent les temps de calcul de mani re non n gligeable Ce ph nom ne se trouve accentu au vu du peu d exp rience initiale de la programmation en langage Avenue et du d lai somme toute limit pour ce projet D autre part les m thodes de calcul de ressemblance par corr lation sur les rangs ou par mesure de distances sont forc ment plus g n rales et moins s lectives que le traitement au cas par cas Cette diff rence provient du fait que la similarit est valu e sur un indice englobant toutes les variables et ind pendant de la structure du vecteur caract ristique Ainsi de par la formulation quadratique de ces indicateurs des communes pr sentant des vecteurs diff rents peuvent tre consid r s gaux alors qu il en existe un manifestement plus proche du germe dans sa structure Dans la m me veine le crit re de ressemblance sur le nombre d exploitations cart pour les applications sur les donn es 2000 se retrouve implicitement dans de tels indices puisque les distances calcul es seront forc ment plus grandes si l on compare des communes de taille diff rente ou de grandeur semblable A l extr me nous pouvons concevoir un voisin dont le vecteur est un multiple de celui du germe structure identique se voir recal
55. emple des cultures v g tales galement repr sent es sous une autre forme que les cultures permanentes la majorit des classes de production retrouve une affectation relativement fid le la distribution initiale Si l on compare les r sultats sur tout le Tessin cf annexes VI 1 3 on remarque que les observations effectu es sur cet extrait de carte ne peuvent pas tre simplement g n ralis es l ensemble du territoire cantonal En effet chacune des solutions pr sente ses points forts et ses inconv nients la r solution d un probl me sur les bords du lac de Lugano est coupl e l apparition de formes irr guli res plus au Nord et l mergence d agr gats moins repr sentatifs dans d autres parties du canton Si l on juge par les quelques chiffres suivants il n y a pas de solution id ale mais plusieurs variantes repr sentant chacune un compromis favorable Inchangees Inchang es d agr gats D production Ee bologie C production a pologie 1 3 5 2 2 1 878 446 aen 628 1 0 1 1 0 5 87 4 50 3 84 9 50 3 Tableau 5 R sultats comparatifs de deux m thodes sur l ensemble du Tessin d tail en annexe VI 4 5 Dans toutes les phases de ce travail nous valuons la qualit de l agr gation sur plusieurs niveaux tout d abord nous observons le nombre total d agr gations qui doit avoisiner les 900 1000 op rations pour toute la Suisse Ensuite nous observons le taux de changement induit par
56. en premier Ci dessous nous exposons en images quelques situations o le r sultat de l agr gation telle que programm e n est pas toujours optimale Toutes les illustrations sont pr sent es avec le Nord vers le haut de la page Nous n y avons pas mentionn d chelle car elle n est pas constante d une carte l autre et n apporte aucune information suppl mentaire pour la comparaison de la forme et de la typologie des agr gats 6 1 MAUVAISE AGR GATION DU POINT DE VUE DE LA FORME DE L AGREGAT Les deux images ci dessous pr sentent quelques situations o les indicateurs de forme n ont pas t suffisamment puissants Dans les deux cas c est l indicateur du nombre d exploitations utilis comme indicateur de ressemblance qui a surpass la contrainte pos e par l indice de Grav lius et la longueur de la fronti re commune On peut d j mettre en doute la n cessit d un tel indicateur de ressemblance Figure 4 Agr gat de forme irr guli re exemple 1 Dans l exemple ci dessus il aurait t plus judicieux de r unir Donneloye et Cornay au lieu de l agr gat effectu entre Donneloye et Molondin De m me le groupement Prangin Vich de la figure 5 serait avantageusement remplac par les associations Prangin Gland et Vich Genolier Coinsins Dipl me EPFL Bertrand Barbey Mars 2002 Page 30 Proc dures d agr gation multifactiorelle Figure 5 Agr gat de forme irr guli re exemple 2 6 2 MAUVAIS
57. er les tests sur cette m thode Nous d cidons d abandonner cette voie de la m me fa on que le calcul d une distance sur la typologie non retenu cause de l chelle discontinue et des diff rences d intervalles pour chaque orientation de production 8 2 2 DISTANCE SUR LES COMPOSANTES PRINCIPALES Nous avons import dans S Plus le fichier contenant pour chaque commune le nombre d entreprises agricoles par sp cialisation soit les 8 variables servant au calcul de la typologie Nous avons r alis une analyse en composantes principales dont le premier r sultat se compose des valeurs propres de la matrice de corr lation et de leur proportion par rapport la somme de ces valeurs Ce pourcentage nous renseigne sur la part d information contenue dans chaque composante du nouveau jeu de variables Nous obtenons les r sultats suivants dont le d tail se trouve en annexe X 1 ee re repspepr pe principale 27 7 21 3 144 110 80 6 7 6 2 4 7 i EE Bif 27 7 49 0 63 4 744 D 82 4 89 1 95 3 100 cumul Tableau 12 ACP r sultats pour les variables servant au calcul de la typologie Comme mentionn au chapitre 2 1l faut que la premi re valeur propre contienne au moins 60 de l information donn e par les variables initiales ou 85 pour les trois premi res composantes Malheureusement cette exp rience ne remplit aucune de ces deux conditions Il est d s lors inutile de poursuivre les te
58. es du secteur primaire en particulier celles ayant trait l orientation technico conomique des exploitations savoir o Identification des communes o Nombre d exploitations par commune o Typologie de l orientation de production de la majorit des exploitations o Nombre d entreprises sp cialis es dans chaque sous type de production les donn es du recensement 2000 sur toutes les exploitations o Identification des exploitations o Marges brutes standard MBS cultures et surfaces animaux o Sp cialisation classe de production le contour des communes politiques sous forme de polygones simplifi s utilis s par l OFS pour la repr sentation de cartes th matiques standard les attributs essentiels de chaque entit spatiale pour l tat 2000 n et nom de la commune n du district n du canton 3 3 FORMAT DES DONN ES Description des donn es Mod le num rique d altitude wo Repr sentation des communes 1996 Shape shp Repr sentation des communes 2000 Nom identifiant n du canton et n du district d origine des communes Excel xls Projet apr Projet du prototype et scripts associ s scripts ave Nombre d exploitation par commune 96 Typologie de l orientation de production globale de la commune 96 Excel xls Nombre d exploitations par classe de production dans la commune 96 Marges brutes standard par exploitation Surfaces SAU terres ouvertes surfaces herbag res Texte structur txt Animaux t
59. ffective une p riode d termin e sans forc ment conna tre son importance dans la structure de l exploitation L entit communale s impose de suite comme le plus simple moyen de lier ces informations une unit spatiale Ce faisant il est d s lors concevable de r aliser des agr gations bas es en premier lieu sur la proximit des l ments surfaciques cartographier Dans le chapitre 12 nous d veloppons quelques id es pour modifier cette m thode de spatialisation de donn es ponctuelles 11 3 TABLEAU SYNTH TIQUE DES M THODES TEST ES Le tableau suivant pr sente une synth se des m thodes valu es sur la base des donn es du recensement 2000 en r sumant quelques avantages et inconv nients majeurs M thode Multicrit re simple Corr lation de Spearman Distance euclidienne Combinaison Multicrit re Corr lation Combinaison Multicrit re Distance Attribution de chelonn s selon diff rents crit res d importances diverses Agr gation avec la commune pr sentant le score total le plus lev Scores seul crit re pour l agr gation le coefficient de corr lation le plus lev e Pas de scores seul crit re pour l agr gation la distance euclidienne la plus faible calcul e sur les composantes du vecteur caract ristique Pas de scores Insertion du coefficient de corr lation dans la m thode multicrit re comme crit re de ressemblance
60. gricoles conomiques d mographiques etc Nous d veloppons tout de m me cette proc dure sur la base des donn es 00 8 2 CALCUL D UNE DISTANCE 8 2 1 SCORE DE PEARSON KHI CARRE Le score de Pearson correspond une mesure de distance entre deux polygones repr sent s par leur vecteur caract ristique D s lors la s lection d termine comme commune agr geante celle qui pr sente la distance la plus faible par rapport au germe Pour viter les ambigu t s dues la pr sence de nombreuses valeurs nulles nous cartons les communes adjacentes pr sentant galement une distance nulle Cette contrainte s applique au d triment des voisins identiques situation quasiment inexistante a priori Comme pour les m thodes statistiques nous effectuons un premier test consistant en une it ration avec la valeur limite du nombre d exploitations VL fix e 12 exp rience pour laquelle nous obtenons les r sultats suivants Nombre d agr gats effectu s Score gt 0 Nombre de germes cart s Score 0 Tableau 11 Score de Pearson r sultats d une it ration Dipl me EPFL Bertrand Barbey Mars 2002 Page 42 Proc dures d agr gation multifactiorelle Autres proc dures d agr gation Dans les m mes conditions 1 it ration VL 12 l application multicrit re de r f rence r alise 479 agr gats Au vu de ces quelques chiffres et de l exp rience r alis e sur la corr lation simple nous ne nous hasardons pas prolong
61. i r duit l ventail des applications possibles partir d informations aussi riches Malgr tout le fait de manipuler des donn es mon taires MBS pr sente l avantage de la continuit de l chelle par opposition aux diff rents intervalles induits par l tablissement d une typologie des orientations de production 9 1 M THODE MULTICRIT RE Pour cette proc dure diff rentes strat gies peuvent tre envisag es Tout d abord il est possible d appliquer la m me m thode que lors de la manipulation des donn es de 1996 En outre partir des MBS compil es nous pouvons calculer la sp cification de la commune et l utiliser comme indicateur de ressemblance Finalement il s av re certainement judicieux d int grer les proc dures de corr lation ou de calcul de distances dans le programme multicrit re pas comme unique facteur d agr gation mais comme remplacement de l indicateur de ressemblance Cette derni re variante fait l objet du chapitre 10 9 1 1 TYPOLOGIE Cette premi re exp rience ignore l information fournie par les MBS Elle sert principalement tablir un jeu de poids ad quat qui pourra servir de r f rence pour toutes les manipulations ult rieures La phase initiale consiste pour chaque commune sommer les exploitations selon chaque sp cialisation puis ins rer le r sultat dans la base de donn es ArcView contenant les attributs des communes 2000 de mani re obtenir une sorte de mise jour d
62. ieurs variables simultan ment dans une proc dure assez simple D autre part ce syst me parvient r unir dans un jeu d indicateurs comparables des donn es de natures tr s diverses qualitatives ou num riques d chelles et ou d unit s diff rentes etc Tr s modulable donc cette formule s adapte toutes les situations mais n cessite chaque fois la d finition particuli re des indicateurs et de leur importance au travers d un jeu de poids C est pourquoi nous avons galement test des m thodes moins souples puisqu elles n cessitent une uniformit d expression des variables analyser En effet tant la corr lation que le calcul d une distance exigent que les composantes des vecteurs caract risant les objets comparer soient exprim es dans la m me unit et sur des chelles semblables Ce type de m thode pr sente l avantage d tre r p titives une fois la structure du programme d finie la proc dure peut fonctionner ind pendamment du nombre de param tres ou de leur unit A l inverse de la variante multicrit re o l on tente d laborer un jeu d indicateurs restreint un nombre lev de variables permet ces m thodes surtout la corr lation d avoir un caract re discriminant plus fort De telles m thodes sont galement applicables dans des situations iverses m me si elles ne consid rent qu un facteur d agr gation d Il d rent qu un facteur d t Ainsi la solution consistant regrouper les diff
63. il est proche de O plus les chantillons sont ind pendants On d termine le coefficient de corr lation l aide de la formule L O Y X Y Y quation 2 calcul du coefficient de corr lation sur les observation r avec X et Y les moyennes des chantillons respectifs Cette m thode peut se r v ler utile puisqu elle quantifie le degr de similitude entre les chantillons ce qui permet de hi rarchiser les voisins adjacents au germe et d en s lectionner pour l agr gation celui qui pr sente le coefficient de corr lation le plus proche de la valeur 1 Dipl me EPFL Bertrand Barbey Mars 2002 Page 16 Proc dures d agr gation multifactiorelle Th orie EE EE 2 6 2 TESTS SUR LES RANGS 2 6 2 1 Test de Wilcoxon Pour v rifier si deux chantillons ind pendants proviennent de la m me distribution dont les caract ristiques sont inconnues on utilise ce test non param trique pour lequel on attribue chaque observation son rang sa place dans une liste ordonn e correspondant la r union des deux chantillons On calcule le score W en additionnant tous les rangs du plus petit chantillon et on le compare galement aux valeurs des tables Si min n m 2 6 on effectue un test de Student sur les rangs c d un score t comparer avec la valeur prise par la distribution normale pour n m 2 degr s de libert au seuil de confiance 1 On rejette l hypoth se nulle Ha les distributions sont identiques
64. iques rend possible une typologie volutive et dynamique mais pr sente l inconv nient d tre d pendante des fluctuations de prix En effet la sp cialisation des exploitations est calcul e sur la base des MBS primaires regroupant toutes les marges brutes estim es pour chaque type de production Celles ci sont d termin es comme le rendement financier de la production en question moins les frais directement li s D j au niveau du chiffre d affaire les variations peuvent se r v ler importantes selon les prix d achat et de vente Ensuite les frais d exploitation dont sont exclus le travail de l exploitant et les amortissements sur les b timents et les machines peuvent subir de fortes fluctuations Illustrons ces propos par un exemple factice exag r d une exploitation menant parall lement l engraissage porcin et la culture c r ali re En supposant que le prix du kilogramme de porc l exploitant baisse d environ 50 centimes d une ann e l autre A raison de 100kg par cochon et 600 animaux engraiss s durant l ann e la diff rence de revenu annuel s l ve d j Fr 30 000 en consid rant stable le prix des porcelets l arriv e dans l exploitation Dans l hypoth se o cet exploitant utilise son domaine pour des cultures qui dans la m me p riode suivent une volution de prix inverse la structure du revenu risque de changer de proportion Si de surcro t le prix de l aliment pour les animaux monte et que les frais
65. isin le plus ressemblant sur un unique facteur Les syst mes utilisant une r solution multicrit re appuient leur choix sur plusieurs indicateurs d importances diff rentes cette proc dure permettant de trouver le meilleur compromis en fonction des diverses pressions esth tisme administration fid lit la r alit etc Dans un souci de g n ralisation nous avons exp riment une m thode hybride r unissant les avantages des deux syst mes rassembl s en tentant de minimiser les inconv nients Ainsi la combinaison multicrit re calcul de distance permet d obtenir de bons r sultats d agr gation tout en offrant des possibilit s d application d autres domaines de la statistique Enfin nous avons pu estimer la marge de progression d un tel prototype pour qu il s apparente un outil int gral nous avons pu d celer quelques limites de la m thode et proposer quelques am liorations et d veloppements int ressants D autre part nous avons pu valuer dans quelle mesure une telle proc dure correspond une attente et quelles sont les applications ou domaines pouvant s appuyer sur cette exp rience Nous nous sommes content s d employer directement les donn es fournies par l OFS mais nous pensons possible et certainement profitable l utilisation de divers outils d un SIRS en guise de pr traitement En effet la combinaison de quelque statistique agricole avec d autres donn es r f rence spatiale pourrait aboutir
66. it re laiss e en suspens lors du travail pr c dent En effet ce type de cheminement s apparente beaucoup aux proc d s manuels mis en place actuellement Il s agit alors de d terminer une pond ration ad quate des diff rents param tres ce stade il s agit de d celer les cas particuliers qui peuvent entraver le d roulement de l agr gation et d y apporter les solutions ad quates C est sur de telles configurations de polygones que nous devons orienter nos recherches afin de d terminer un jeu de poids de r f rence permettant d obtenir l agr gation la plus favorable De plus dans une premi re tentative d am lioration du programme nous valuons la pertinence des indicateurs choisis en comparant diverses ex cutions de la proc dure Finalement nous effectuons une premi re approche des m thodes statistiques et de calcul de distance pouvant se r v ler utiles dans ce projet du point de vue d une ouverture possible de cette m thode d autres domaines de la statistique Pour la deuxi me phase du projet nous disposons d un jeu de donn es plus complet permettant d approfondir et d largir la probl matique en poursuivant le d veloppement des m thodes s lectionn es dans l tape pr c dente et en testant un syst me bas sur un calcul de distance a priori bien adapt ce genre de situations Nous maintenons le proc d de r solution multicrit re comme r f rence explorons les possibilit s offertes par une m thode
67. it de prendre le centre de gravit de l ensemble du domaine ou le centre d un groupe de parcelles repr sentatif de l exploitation et d appliquer ensuite les proc dures d interpolation et d agr gation d crites au paragraphe pr c dent Peut tre se r v lerait il utile de d limiter des r gions repr sentatives en se basant sur d autres sources d information Les hypoth ses conf rant un grand r le aux r gions MS de mobilit spatiale se sont rapidement effondr es ne trouvant aucun lien suffisamment significatif avec les donn es de l agriculture M Gilgen 1998 Nous pensons pourtant qu il pourrait tre int ressant de se renseigner aupr s de centres collecteurs moulin c r ales laiterie abattoirs De telles entreprises pourraient fournir soit des donn es brutes quantit de marchandises achet es transform es livr es soit des informations permettant de d limiter une sorte de bassin de producteurs Il faudrait toutefois trouver un compromis sur les diff rentes sources explor es de mani re ce que cette technique ne g n re pas des r gions trop grandes pour exprimer certaines particularit s locales Tessin Cette solution proposerait ainsi une taille interm diaire assez proche du niveau communal mais suffisamment grande pour viter des interventions ult rieures telles qu une agr gation 12 5 AUTRE TRANSFORMATION DES DONN ES DU RECENSEMENT La richesse des informations collect es par le rece
68. ite cf figure 3 a pour chaque commune enregistrer les attributs b agr ger physiquement fusion de polygones c d finir les attributs de la nouvelle commune i sommer des attributs des deux communes initiales aire nombre d exploitations par commune et par sp cification il reprendre des attributs de la commune agr geante nom canton recalculer des attributs typologie tat germe ou entit 5 Calculer le nombre de germes non encore agr g s et effectuer les it rations n cessaires 5 2 SIMULATION D AGR GATION Dans l exemple ci contre les germes sont les communes n 2 6 8 10 13 14 16 et toutes les diff rentes situations qu on peut rencontrer sont repr sent es Avant l agr gation Etape 1 La commune n 16 est cart e directement car elle ne contient aucune exploitation Etape 2 Au terme de la s lection des meilleurs voisins les couples suivants se sont form s 2 1 6 8 8 7 10 8 13 14 14 13 Etape 3 Ensuite on limine toutes sauf 1 relations o plusieurs communes veulent s agr ger la m me commune On obtient 2 1 6 8 8 7 13 14 14 13 Etape 4 On construit une liste des relations o la commune agr geante est galement agr ger dans une autre relation soit dans cet exemple les couples 6 8 13 14 14 13 Etape 5 De cette s lection on gracie un couple dans le cas o des communes veulent s agr ger mutuellement soit ici le
69. ius et la longueur de la fronti re commune 7 1 APPARTENANCE AU CANTON L exp rience des premi res op rations sur les communes nous montre que le crit re d appartenance semble induire plus de probl mes qu il n en r sout En effet le traitement des communes enclav es devient tout simplement irr alisable ayant pour cons quence le non respect des conditions sur la protection des donn es De plus ces cas particuliers repr sentent rarement des valeurs statistiques capables d influencer significativement les r sultats d analyse statistique au niveau cantonal Une liste des communes se trouvant isol es dans un autre canton est pr sent e en annexe VII et permet de se convaincre que l int gration de leurs donn es l information globale d un autre canton ne remet pas en cause la port e des chiffres cantonaux Des discussions suppl mentaires avec l OFS Agr nous confortent dans l id e d abandonner ce param tre Il s av re en effet que l agr gation de communes de cantons diff rents devient in vitable lorsque la totalit ou le fragment principal du territoire communal se situe l ext rieur des limites globales du canton d origine Nous optons pour une solution interm diaire en conservant cet indicateur mais en lui attribuant un poids faible lors de l ex cution de la m thode multicrit re En outre nous pourrons viter partiellement ce probl me dans les applications venir puisque nous disposons du contour des communes t
70. l agr gation sur l expression de la variable cartographier Nous mettons en vidence pour les communes agr geantes et agr g es celles qui ne changent pas de typologie et celles qui conservent une orientation de production coh rente si la typologie ne change pas de classe v g tale animale ou mixte selon le tableau 1 Dipl me EPFL Bertrand Barbey Mars 2002 Page 36 Proc dures d agr gation multifactiorelle Signification des indicateurs 7 SIGNIFICATION DES INDICATEURS H H Suite la programmation des diff rents indicateurs et l ex cution du programme multicrit re ainsi d termin il s est pos la question de l interd pendance des indicateurs choisis Comme nous cherchons un jeu de param tres porteurs d information n cessitant un minimum d op rations informatiques pour un r sultat satisfaisant nous nous sommes alors attard s sur la d finition des indicateurs traduisant concr tement et math matiquement les objectifs dessin s par les crit res Nous posons tout d abord la question de l importance du crit re d appartenance au canton puisqu elle est mise en doute d j lors de l tablissement initial des indicateurs Ensuite nous cherchons v rifier une id e survenue rapidement le nombre d exploitations comme indicateur de ressemblance est il superflu Finalement nous nous sommes pench s sur les indicateurs de forme pour attester ou infirmer une redondance entre l indice de compacit de Grav l
71. l on se concentre aux partenaires de la section d agriculture de l OFS on peut facilement pr tendre renforcer la collaboration avec d autres offices f d raux ou cantonaux OFAG OFEFP des organismes sp cialis s USP FAT la presse agricole Terre et Nature AgriHebdo etc La dimension p dagogique et instructive de ces cartes pourrait galement b n ficier d un d veloppement cons quent Par ailleurs il ne serait peut tre pas utopique de voir certaines branches touristiques b n ficier de quelques cartes pour leur promotion Dipl me EPFL Bertrand Barbey Mars 2002 Page 58 Proc dures d agr gation multifactiorelle Perspectives 12 3 MODIFICATIONS DE LA CLASSIFICATION La typologie tablie par l OFS Agr exprime bien pour chaque commune la proportion d exploitations agricoles sp cialis es dans chaque domaine de production animale v g tale mixte ou de cultures permanentes Pourtant nous pensons qu il serait int ressant de repr senter plus fid lement la r elle structure de la production agricole sur le territoire communal Nous avons donc labor une proposition pour la caract risation de l activit agricole communale cf annexe XXI 1 Il s agit du m me principe que le calcul de la sp cialisation des exploitations r am nag pour d terminer un nombre plus grand de cat gories Pourtant m me si l chelle de typologie est continue il n est toujours pas possible de calculer une distance directement sur la typ
72. la cr ation d une variable commune plus facile cartographier ou de signification plus vidente Dipl me EPFL Bertrand Barbey Mars 2002 Page 61 Proc dures d agr gation multifactiorelle Bibliographie 14 BIBLIOGRAPHIE Textes l gislatifs x Loi f d rale sur la protection des donn es LPD Berne juin 1992 amp Loi sur la statistique f d rale LSF Berne octobre 1992 Ordonnance relative la loi f d rale sur la protection des donn es OLPD Berne 1993 Ordonnance sur le relev et le traitement de donn es agricoles ou ordonnance sur les donn es agricoles ODA Berne d cembre 1998 Polycopi s Livres M thodes d analyse g ographique quantitative HUBERT BEGUN Librairies Techniques Paris 1979 amp ArcView GIS The Geographic Information System for Everyone Manuel d utilisateur ENVIRONMENTAL S YSTEMS RESEARCH INCORPORATION ESRI USA 1996 amp Avenue Customization and Application Development for ArcView Manuel d utilisateur ENVIRONMENTAL S YSTEMS RESEARCH INCORPORATION ESRI USA 1996 Structures des exploitations M thodologie des enqu tes communautaires EUROSTAT Th me Agriculture Sylviculture et P che Ed EUR OP Luxembourg 1996 amp Observatoire de l agriculture durable Travail de dipl me MARC GILGEN Lausanne f vrier 1998 Locational Analysis in Human Geography PETER HAGGETT ANDREW D CLIFF ALLAN FREY Second Edition Edward Arnold Editions Londres 1977
73. la m me distribution Hubert B guin 1979 s attache principalement la description d mographique mais il propose quelques tests d ajustement permettant d valuer la signification d un chantillon d informations distribu es spatialement D autre part des livres traitant de statistiques offrent des alternatives fr quemment utilis es T amp R Wonnacott 1991 S Morgenthaler 1997 Dipl me EPFL Bertrand Barbey Mars 2002 Page 15 Proc dures d agr gation multifactiorelle Th orie Pt EE EDR LEE EP PE ET Eee D EP CCE EE POI LE E EE 2 6 1 TESTS SUR LES OBSERVATIONS 2 6 1 1 Kolmogorov Smirnov Ce test compare deux chantillons ordonn s sur la base d un score refl tant la plus grande diff rence entre les deux distributions adapt es des chantillons Cependant il n est pas recommand lorsqu un chantillon contient plusieurs valeurs identiques ce qui est tr s fr quent avec les donn es sur les communes o les entreprises agricoles se regroupent en 3 ou 4 sp cialisations sur les 8 cat gories d finies d o la pr sence de plusieurs valeurs nulles 2 6 1 2 _Khi carr Pearson Ce test tablit une comparaison entre 1 chantillon observ et 1 chantillon de r f rence n variables ce dernier ayant une distribution th orique attendue ou connue Il est possible d adapter ce test notre situation en posant comme hypoth se que les donn es du germe constituent l chantillon de r f rence Un score ze prop
74. leurs 2 4 8 12 et 12 comme indicateur de s lection des germes Les r sultats sis en annexe VIIL1 d montrent qu il est utile de ne consid rer que l orientation de production comme indicateur de ressemblance Avec ces chiffres deux arguments suppl mentaires favorisent l viction du nombre d exploitations D une part la quantit d agr gats augmente l g rement 43 833 tout en maintenant lev e 88 et 93 la proportion de communes d orientation inchang e D autre part le poids ainsi accord aux indicateurs d esth tisme influence favorablement la forme des agr gats puisqu on retrouve nettement moins de polygones dont l indice de Grav lius est sup rieur 1 6 et un indice maximum de 2 92 au lieu de 3 28 Remarquons ce stade que de telles valeurs ne devait pas tre atteintes avec les contours des communes 2000 fournis par l OFS Nous d cidons d exclure cet indicateur pour les applications venir sur les donn es 2000 7 3 ESTH TISME H La plus grande partie des tests effectu s sur le programme de base s attache valuer la redondance entre l indice de Grav lius et la fronti re commune Conceptuellement nous pensons que ces deux indicateurs sont concordants c est dire qu ils m nent des solutions et des agr gats tr s semblables En effet il semble manifeste que plus la portion de fronti re partag e entre deux polygones est lev e moins la forme globale de l agr gat risque d tre alambiqu e D
75. luriannuel 1999 2003 de la statistique f d rale suite la r vision des textes l gislatifs dans le domaine agricole Nous pouvons mentionner l Ordonnance sur le relev et le traitement de Donn es Agricoles ODA 1998 et les textes l gislatifs pris en consid ration dans le cadre des n gociations bilat rales avec l Union Europ enne comme principales sources de modifications D autre part l OFS Agr d sire galement utiliser le potentiel des nouvelles technologies dans le domaine des SIRS afin d obtenir une assistance informatique l laboration de ses cartes L objectif fondamental de ce travail est de proposer une ou plusieurs solutions pour automatiser autant que possible la phase d agr gation de communes dans l optique de diffusion cartographique des informations de la statistique agricole Deux contraintes principales mettent une orientation et un cadre plus pr cis ce travail il s agit tout d abord de pr server la confidentialit des donn es en respectant un nombre minimal d exploitations dans les communes et ensuite d assurer un aspect visuel clair en s occupant de l esth tisme de la carte forme et taille des agr gats Dans un esprit plus global nous d sirons voquer ce que peuvent apporter les moyens actuels fournis par les SIT la probl matique g n rale de l OFS et donner quelques pistes quant la r alisation de ces perspectives Par exemple 1l est l gitime de vouloir utiliser les fonctionnalit s des S
76. me EPFL Bertrand Barbey Mars 2002 Page 39 Proc dures d agr gation multifactiorelle Signification des indicateurs Au vu des exp riences et r sultats pr sent s ci dessus nous d cidons que pour l ensemble des op rations r alis es sur la base des donn es 2000 il devient n cessaire de r duire fortement l importance du crit re d appartenance au canton d liminer la composante Nombre d exploitations pour le crit re de ressemblance de supprimer l indicateur sur la fronti re commune pour la forme des agr gats et de ne conserver que l indice de compacit de Grav lius En r sum nous proc dons pour les donn es 2000 l laboration d une m thode d agr gation sur la base des crit res et indicateurs pr sent s dans le tableau ci dessous Crit res Indicateurs l Canton souverain Esth tisme Forme de l agr gat Indice de Grav lius Taille de l agr gat Tableau 6 Crit res et indicateurs retenus pour les applications sur les donn es 2000 A noter que l indicateur de confidentialit n intervient pas directement dans le processus d agr gation puisqu il sert s lectionner les germes ainsi qu assurer la pertinence des agr gats Avant d entamer la manipulation des donn es 2000 nous cherchons d velopper d autres m thodes d agr gation bas es sur des indicateurs statistiques Quelques premiers tests sont compar s aux r sultats de r f rence obtenus par le programme de r solution mul
77. mmune contigu la plus appropri e pour l agr gation savoir celle qui pr sente le plus de similitudes sur la structure de production et la forme de l agr gat la plus r guli re Dans le petit exemple ci contre nous consid rons G comme la commune germe et V les communes agr geantes potentielles Imaginons deux crit res C et C2 dont les poids respectifs sont P 1 et P 3 Sur le premier crit re le score peut prendre les valeurs 2 ou 0 sur le second les valeurs 2 1 et 0 selon que le germe et le voisin en question sont tr s ou pas semblables On obtient alors le tableau r capitulatif suivant factice Voisins ll Crit re C Score Suz S21 S31 S41 a a a aa a Tiz Score S 2 P2 ee e e S Score total T Ti Tableau 2 M thode multicrit re calcul des scores Le 2 voisin a le score le plus lev il va tre retenu pour l agr gation 2 6 PR SENTATION ET VALUATION DE QUELQUES M THODES STATISTIQUES Dans le cadre de ce projet nous sommes amen s comparer des polygones repr sentant les communes sur la base de leurs attributs En particulier nous devons s lectionner parmi les communes adjacentes celle qui ressemble le plus au germe en regard de quelques attributs caract ristiques regroup s dans un vecteur Nous consid rons alors chacun de ces vecteurs comme un chantillon repr sentatif d une distribution statistique et d cidons de tester s ils proviennent de
78. n est fix 0 8 pour 5 it rations o la valeur limite du nombre d exploitations prend les valeurs 2 4 8 12 et 12 successivement Statistiques Corr lation Multicrit re Nombre total d agr gats Communes agr g es inchang es Communes agr geantes inchang es Tableau 8 Corr lation simple r sultats comparatifs avec la m thode multicrit re sur toute la Suisse Au vu des r sultats pr sent s dans le tableau ci dessus il semble vident que la m thode utilisant la corr lation sur les observations ne peut tre utilis e comme seul facteur d agr gation sur les donn es des communes Le nombre de variables est probablement ad quat mais les chantillons repr sentant les germes ne sont pas suffisamment caract ristiques ou typ s il est tr s ardu d tablir un indice de ressemblance avec une commune qui ne contient que 1 2 ou m me 5 exploitations En effet de telles communes sont d crites par un vecteur dont la majorit des 8 composantes sont nulles Ainsi de petites variations de structure du vecteur peuvent induire de forts changements du coefficient de corr lation Dipl me EPFL Bertrand Barbey Mars 2002 Page 41 Proc dures d agr gation multifactiorelle Autres proc dures d agr gation 8 1 2 CORRELATION SUR LES RANGS L avantage de manipuler les rangs par rapport aux observations est le fait de s affranchir des valeurs nulles qui faussent passablement les calculs Il est de rigueur lorsque nous avons
79. ne comparaison multicrit re des communes voisines d un noyau s lectionn les crit res tant d finis partir des attributs ou de la g om trie des polygones Parmi les deux syst mes aboutissants aux r sultats les plus concluants la proc dure int grant un calcul de distance pour le crit re de ressemblance et une r solution multicrit re globale ouvre de nouvelles perspectives et largit son champ d application d autres types de donn es statistiques D autre part ce travail expose diff rentes approches pour le choix des agr gations effectuer les limites des solutions retenues leurs avantages et inconv nients ainsi que les possibilit s d am lioration et d utilisation de telles proc dures REMERCIEMENTS J aimerais faire part de ma gratitude toutes les personnes qui de pr s ou de loin m ont permis de mener bien ce travail de dipl me Mes remerciements s adressent particuli rement aux personnes suivantes M Fran ois Golay professeur responsable de la chaire de SIRS qui m a permis de r aliser ce travail int ressant et gratifiant M R gis Caloz collaborateur et charg de cours la chaire de SIRS pour son encadrement sa disponibilit et ses conseils constructifs M Jean Fran ois Fracheboud directeur de la Section d agriculture et de sylviculture de l OFS pour sa participation active l laboration du sujet Ses informations et son attention quant l volution du projet ont t un
80. ni re m thode est appropri e dans une telle situation en appliquant galement titre comparatif la m thode de r f rence Pour chacune des proc dures nous utilisons le jeu de poids habituel 1 5 3 1 en faisant varier la valeur limite du nombre d exploitations VL Selon une convention respect e par l OFS ainsi qu au niveau international la confidentialit est respect e lorsque 4 exploitations au moins par communes remplissent le crit re sur lequel est jug e la ressemblance Nous avons donc compil les valeurs de surfaces herbag res en ne retenant par commune que les exploitations qui en d clarent La SAU est toutefois consid r e sur l ensemble du territoire communal Dans le tableau suivant se trouvent les r sultats de cette op ration d tails en annexe XIL 4 scores et XX 1 2 3 Multicrite Distance Score Echelonn D gressit d agr gats Communes Diff rence de 100 0 Be agr g es cat gorie 1 inchang es M me cat gorie 75 0 72 9 Communes Diff rence de 98 7 98 2 agr geantes cat gorie 1 inchang es M me cat gorie 91 5 83 6 Tableau 24 r sultats des deux m thodes retenues pour l agr gation de communes pour la cartographie des surfaces herbag res en rapport la SAU totale Ces premiers r sultats se r v lent prometteurs malgr la simplicit de la variable cartographier En effet m me si la ressemblance n est valu e que sur un seul param tre les remarq
81. nsement des entreprises du secteur primaire nous semble sous exploit e La transformation de certaines observations sur une chelle mon taire ouvre de grandes possibilit s d analyses Cependant comme mentionn au paragraphe 2 4 ce nouveau type de donn es est d pendant des fluctuations de prix entrant dans le processus de transformation Pour garantir la stabilit et la continuit des valeurs enregistr es il serait int ressant de d velopper un syst me pour les convertir ou les normaliser L analyse en composantes principales s est r v l e infructueuse jusqu maintenant mais 1l serait int ressant de pers v rer dans cette voie Dipl me EPFL Bertrand Barbey Mars 2002 Page 60 Proc dures d agr gation multifactiorelle Conclusion 13 CONCLUSION H L objectif principal de ce travail consistait laborer une proc dure d agr gation de communes permettant la diffusion de donn es de la statistique agricole sous la contrainte de la confidentialit Nous avons utilis les fonctionnalit s d un syst me d informations g ographiques pour la s lection des communes selon leur attribut du nombre d exploitations De plus nous avons pu d terminer les polygones adjacents aux germes et les comparer sur la base de leurs attributs et leur g om trie En outre nous avons test diff rentes m thodes que l on peut s parer en deux cat gories la corr lation sur les rangs et le calcul d une distance euclidienne d terminent le vo
82. nsiste pouvoir cr er des cartes une chelle tr s proche de celle de la commune Jusqu alors les quelques cartes publi es dans les Reflets de l agriculture suisse OFS 1997 repr sentaient les informations regroup es au niveau du district ou du canton ce qui convient parfaitement la grandeur des images illustrant cet ouvrage Cependant on peut l gitimement envisager ins rer des cartes de format sup rieur jusqu la taille d une page A4 sans alt rer la lisibilit de cette publication D sormais il est possible de se rapprocher du niveau communal pour certains th mes C est le cas pour la th matique de r f rence utilis e dans ce travail l orientation de production des entreprises agricoles En utilisant le prototype cr lors de ce projet nous avons consid r l esth tisme de la carte en plus de la confidentialit inh rente la probl matique Nous avons fix 12 le nombre minimum d exploitations par agr gat pour r duire environ 2000 le nombre de communes et pour garantir l anonymat des donn es cartographi es selon la typologie tablie l OFS Aer En effet m me pour les types Pr dominance de production animale ou v g tale 4 exploitations au minimum correspondent au type principal Nous pouvons ramener cette valeur limite 4 entreprises du secteur primaire si nous choisissons de repr senter r ellement la structure de la production agricole sp cialisation de la commune Le th me cartographi
83. nt aux entreprises agricoles ne serait pas plus significative que pour les communes Une telle solution bas e sur le g ocodage des immeubles ne semble pas favorable m me si nous proc dons d abord l agr gation entre les points sur la base de l information compl te fournie par leurs attributs avant d accomplir la spatialisation proprement dite Une alternative qui semble a priori assez lourde consisterait se baser au d part sur la position des parcelles de l exploitation Les agriculteurs appliquant les normes de la PI Dipl me EPFL Bertrand Barbey Mars 2002 Page 59 Proc dures d agr gation multifactiorelle Perspectives production int gr e entre autres doivent fournir les plans de leurs champs et la rotation des cultures mise en place Actuellement aucun r f rencement g ographique suisse n est disponible rapidement puisque les documents transmis par les agriculteurs sont des extraits sur support papier du cadastre communal mais nous pensons qu un tel produit pourrait subvenir aux besoins de nombreuses autres disciplines Dans cette configuration en parcelles l information transmise par les attributs relatifs l utilisation du sol correspondrait avec les donn es de la statistique de superficie Pourtant il est presque impensable d ex cuter une agr gation sur les parcelles mais nous pourrions nous servir de cette information pour distribuer spatialement les exploitations d une fa on plus r aliste Il suffira
84. nyme 2 Ressemblance pour que la carte repr sente le plus fid lement possible les donn es r colt es il est pr f rable de regrouper des communes ayant des caract ristiques semblables si ce n est identiques concernant le th me consid r 3 Appartenance au canton comme un grand nombre de statistiques sont galement cartographi es l chelle cantonale nous souhaitons favoriser l agr gation entre communes d un m me canton 4 Esth tisme par soucis de lisibilit de la carte nous voulons obtenir des polygones de forme r guli re Un premier d veloppement sur les donn es 96 aboutit l laboration d un prototype refl tant les orientations initiales d finies lors du travail de R Tornay Ce programme se base sur les quatre crit res et sept indicateurs suivants Crit res Indicateurs Confidentialit Nombre d exploitations agricoles Ressemblance Nombre d exploitations agricoles Typologie de l orientation de production Appartenance Canton d origine Esth tisme Indice de compacit Grav lius Proportion de la fronti re en commun Taille de l agr gat d entreprises Tableau 4 Pr sentation des crit res et indicateurs de la m thode multicrit re appliqu e aux donn es de 1996 A noter que l indicateur de confidentialit n intervient pas directement dans le processus d agr gation puisqu il sert s lectionner les germes ainsi qu assurer la pertinence des agr gats Le choix de
85. ologie Les diff rentes classes n tant pas r parties de mani re homog ne trois pour la production v g tale et deux pour les animaux il semble d finitivement impensable d utiliser uniquement la typologie pour d terminer le degr de similitude entre communes 12 4 AFFRANCHISSEMENT DES LIMITES COMMUNALES Comme amorc e au chapitre pr c dent la question de l extension spatiale des donn es du recensement met en doute l efficacit des fronti res communales pour la repr sentation des statistiques agricoles Les informations d une entreprise agricole sont attribu es la commune o se situe le centre d exploitation savoir le b timent rural principal Pourtant il arrive souvent que des paysans s occupent de terrains sis sur le territoire d une autre commune dans quelques cas extr mes plus de 70 de la surface cultiv e se situe l ext rieur de la commune d origine Ainsi les donn es collect es sont l g rement biais es puisqu elles ne repr sentent pas la v ritable production agricole de la commune De plus les diff rences de taille de communes tant au niveau de la surface que du nombre d exploitations induisent des difficult s de comparaison Ainsi nous jugeons qu il serait utile de d terminer des r gions de taille semblable poss dant une homog n it accrue qui repr senterait galement une am lioration par rapport aux donn es de certaines communes Le principal probl me r side dans la cr ation d un lien
86. ologie et la sp cialisation nous puissions trouver une alternative aux r partitions appliqu es actuellement D autre part texte complet du programme d agr gation par combinaison des m thodes multicrit re et de calcul d une distance euclidienne pour la cartographie de l orientation de production en 2000 est disponible dans un document parall le ce rapport Dipl me EPFL Bertrand Barbey Mars 2002 Page 53 4 TUCOUUI ED U us CHULLUTIL FU UU LUI CLC WULU ALHDAUUWVUII ET EE BASE D AUTRES DONNEES Pour mettre en vidence le caract re modulable de la solution retenue combinaison des m thodes multicrit re et de calcul de distance nous l exp rimentons sur un autre jeu de donn e savoir la repr sentation de la proportion communale de surfaces herbag res par rapport la Surface Agricole Utile SAU Nous avons choisi ce th me en fonction des cartes illustant les Reflets de l agriculture suisse en 1996 OFS 1997 pour montrer l utilit d une telle m thode d agr gation semi automatique Dans cet exemple la ressemblance n est valu e que sur un seul l ment le rapport Surf Herbag res SAU La classification des communes ou agr gats s effectue dans 6 cat gories NES gt 80 gt 65 gt 50 gt 35 gt 30 30 surfaces herbag res Cat gories i 2 1 3 4 1 5 6 7 Tableau 23 Cat gories pour la repr sentation des surfaces herbag res des communes suisses Nous v rifions si cette der
87. ont respect es dans la plupart des cas Quoi qu il en soit l information concernant le canton d origine est rapidement accessible dans la table des communes par le num ro du canton cf annexe IV 1 44 CRIT RE D ESTH TISME Trois indicateurs ont t retenus pour ce crit re 1 Un indice de compacit 2 La fronti re commune 3 La taille de l agr gat 44 1 L INDICE DE COMPACITE Il existe de nombreuses mani res d appr cier la forme d une entit surfacique chaque domaine d activit utilisant les indices les plus appropri s indices de compacit de circularit Nous empruntons un de ces indicateurs un domaine s appuyant r guli rement sur les technologies des SIRS comme l hydrologie par exemple de mani re v rifier si l agr gat pr sente une forme suffisamment r guli re pour garantir une vision claire de la carte Parmi les indices disposition nous avons s lectionn trois indices de compacit P Haggett 1977 et A Musy 2001 12373 5 L indice de Gibbs 1961 K SE quation 4 indice de compacit de Gibbs 4 5 SCH quation 5 indice de compacit de Cole T L indice de Cole 1964 Ko L indice de Grav lius 1914 G quation 6 indice de compacit de Grav lius P i Avec S repr sentant la surface du polygone P son p rim tre et L son grand axe distance entre les deux points les plus loign s de l unit donnant le diam tre du cercle circons
88. ortionnel la somme des carr s des diff rences doit tre compar aux tables de la loi khi carr pour n 1 degr s de libert pour v rifier si les distributions sont significativement diff rentes au seuil de confiance 1 par exemple 90 ES e GN fo 2 DH V et G valeurs du voisin respectivement du germe quation 1 calcul du score de Pearson Sous cette forme ce test n est pas tr s utile pour notre probl matique nous voulons d terminer le voisin le plus ressemblant et non carter les moins semblables En effet pour ce genre de test on pose une hypoth se H dite hypoth se nulle qu il s agit de v rifier ou d infirmer En comparant le score aux valeurs des tables on peut tirer l une des deux conclusions suivantes On rejette Hu ce qui signifie que l on est s r plus de 90 que les distributions ne sont pas semblables ou on ne peut pas rejeter H ce qui revient dire qu il y a de bonnes chances pour que les chantillons se ressemblent mais sans pouvoir pr ciser quel degr de similitude les r unit Par contre nous pouvons utiliser ce score Xo dans le cadre de notre projet comme une mesure de distance entre le germe et un voisin 2 6 1 3 _ Corr lation simple Comme pour les deux m thodes pr c dentes la corr lation calcule la ressemblance entre deux chantillons et l exprime dans une chelle allant de 1 1 Plus le score s approche des bornes plus les comportements se ressemblent plus
89. p cialisation Les deux premi res images d pr sentent la situation initiale du point de vue de la sp cialisation et de la typologie respectivement L Isle sp cialisation mixte typologie majorit animale Mauraz sp cialisation mixte Typologie typologie v g tale 65 Pampigny sp cialisation mixte typologie majorit v g tale Vis vis de ces images en dessous il y a les illustrations du r sultat de l agr gation selon chacune des m thodes et pr sent es par la typologie de l agr gat Figure 15 Conflits entre agr gation bas e sur la sp cialisation et pr sentation selon la typologie des communes Dans cet exemple l agr gat Mauraz L Isle prend une typologie mixte conform ment la sp cialisation et la structure de production de chacune des communes Cependant la statistique finale exprimera le changement de typologie des deux communes tandis que pour l agr gat Muraz Pampigny seul le changement de typologie de Muraz sera exprim De telles situations sont cependant assez rares n alt rant que faiblement la signification des Dipl me EPFL Bertrand Barbey Mars 2002 Page 46 Proc dures d agr gation multifactiorelle D veloppement du prototype r sultats chiffr s dont l ordre de grandeur est donc valable Remarquons tout de m me que 78 des communes agr g es et 91 des communes agr geantes ont conserv une typologie proche de l initiale Cette diff renc
90. p cialisation 46 INDEX DES QUATIONS quation 1 calcul du score de Pearson seseieeeeeeeeeeeesseeeeeteressttetsrreesreeessrressrressrrressrrressn 16 quation 2 calcul du coefficient de corr lation sur les Observations 16 quation 3 Calcul du coefficient de Spearman corr lation sur les rangs 17 quation 4 indice de compacit de Gibbs 24 quation 5 indice de compacit de Cole 24 quation 6 indice de compacit de Grav lius sense 24 Dipl me EPFL Bertrand Barbey Mars 2002 Page 5 Proc dures d agr gation multifactiorelle dree eege LEE EP PE Et EE D Eege LEE ER D CPE ERP OR ne EEE MEL EEE DEC EPP EL EEE LEP LORIE EE LE OL EE PES E ET E CL EPE EE PE LP TEL ee eet et R SUM Ce travail de dipl me associe l Office f d ral de la statistique au laboratoire de SIRS de l EFPL L OFS d sire trouver une solution pour la diffusion cartographique de ces statistiques agricoles respectant les contraintes fix es par la loi sur la protection des donn es Un prototype est d velopp partir des donn es d orientation de production des exploitations agricoles le but tant de modifier le moins possible la typologie des communes r unies Ce projet d veloppe l aide des technologies des SIT un programme permettant l agr gation de polygones repr sentant les communes suisses en suivant une premi re condition d adjacence Pour les solutions retenues le deuxi me facteur d agr gation consiste en u
91. portion d agr gats pr sentant un indice G lt 1 2 la proportion d agr gats pr sentant un indice G gt 1 6 la proportion de communes agr g es dont l orientation de production cult permanentes v g tale animale mixte n a pas chang F inch la proportion de communes agr geantes dont l orientation de production est conserv e To inch Comme le montrent les r sultats num riques du test A pr sent s en annexe VIIL2 un crit re de forme est tout de m me n cessaire De plus la combinaison des indicateurs constitue un compromis optimis entre les r sultats obtenus par les solutions individuelles m me si la contribution l am lioration du r sultat n est pas manifeste En comparant les applications du test A sans indicateurs de forme avec celles o un seul indicateur est utilis il n est pas vident de d celer un effet pr pond rant de l indice G ou de la fronti re commune Certes l am lioration est sensible avec l indice G sur l ensemble des agr gats et perceptible avec la LFC sur les formes d j assez r guli res mais on ne peut pas vraiment affirmer qu un indicateur soit plus adapt Il semble tout de m me que l indice G soit plus puissant tout en ne perturbant qu un minimum l action du crit re de ressemblance comme on peut le constater sur le nombre de communes dont la classe de production reste inchang e Le test B annexe VIIL3 d montre une puissance sup rieure de la part de l indice de Grav
92. que de superficie www statistik admin ch stat_ ch ber02 asch fframel htm Station f d rale de recherche en conomie et technologie agricole de T nikon FAT www sar admin ch fat f index html Comit Oui aux accords bilat raux www bilaterale ch f Bureau de l int gration BFAE BFE www europa admin ch ba expl factsheets f index htm Union Suisse des Paysans USP www bauernverband ch Dipl me EPFL Bertrand Barbey Mars 2002 Page 63
93. que la nouvelle version ArcGIS 8 1 utilise pr f rentiellement le langage Visual Basic 2 3 M THODES DE RELEV S STATISTIQUES L OFS suit les principes suivants pour l tablissement des informations statistiques Figure 1 Sch ma de relev s statistiques Source Office F d ral de la Statistique La statistique des structures agricoles se fonde sur un catalogue de variables tabli par l OFS et conforme aux exigences europ ennes Eurostat Les cantons sont charg s de la collecte des donn es et utilisent cet effet diff rents questionnaires f d raux ou cantonaux Dipl me EPFL Bertrand Barbey Mars 2002 Page 12 Proc dures d agr gation multifactiorelle Th orie DE tre et eege EE PRE EEE ED EEE EL PROD DEEP EPL O CE LE EE PE EL eebe eebe POELE EE OL POELE ett ees EE LEE ELLE LED REC POP EEE PO CO D EEE EL LEE D ILE ONCE TITI Ensuite les cantons traduisent les donn es r colt es sous forme num rique selon un sch ma pr d fini et les transmettent l OFS qui effectue plusieurs traitements sur ces informations v rification de l exhaustivit des donn es v rification de l exactitude des donn es d clar es par l exploitant et corrections n cessaires calcul des marges brutes par exploitation et par type de production d termination de la sp cification de chaque entreprise regroupement de ces donn es par exploitation dans la base de donn es OFS 1 ligne par exploitation avec toutes les caract
94. quer cette m thode dans des situations diverses moyennant un minimum de modifications 9 3 2 DISTANCE SUR LES COMPOSANTES PRINCIPALES Nous avons import dans SPlus le fichier contenant pour chaque exploitation les donn es exprimant les cinq MBS primaires Nous avons r alis une analyse en composantes principales dont le premier r sultat se compose des valeurs propres de la matrice de corr lation et de leur proportion par rapport la somme de ces valeurs Ce pourcentage nous renseigne sur la part d information contenue dans chaque composante du nouveau jeu de variables Nous obtenons les r sultats suivants cf annexe X 2 Dipl me EPFL Bertrand Barbey Mars 2002 Page 49 Proc dures d agr gation multifactiorelle D veloppement du prototype Es ECH ECH EES re principale Valeur propre Tam i 24 7 220 19 7 18 8 148 d information 24 7 46 7 664 85 2 100 cumul Tableau 19 ACP r sultats pour les marges brutes standard primaires sur les exploitations Comme mentionn au chapitre 2 1l faut que la premi re valeur propre contienne au moins 60 de l information donn e par les variables initiales ou 85 pour les trois premi res composantes Malheureusement cette exp rience ne remplit aucune de ces deux conditions Il est d s lors inutile de poursuivre les tests sur ce nouveau jeu de param tres comme nous l avons suppos au chapitre 8 d j sur la premi re ex cution de ce type d an
95. retenues pour l agr gation de communes pour la cartographie des surfaces herbag res en rapport la SAU totale 54 Tableau 25 Tableau comparatif des m thodes 1851888 iterolennneintennse 57 Dipl me EPFL Bertrand Barbey Mars 2002 Page 4 Proc dures d agr gation multifactiorelle INDEX DES FIGURES Figur 1 Sch ma d relev s statistig s n ant atiites 12 Figure 2 Application de l indice de Grav lius l hydrologjie 25 Figure 4 Agr gat de forme irr guli re exemple TL uggetekteEeegegggerktteeeDNENEEedehE gd hCgEed Eh 30 Figure 5 Agregat de forme irr guli re exemple 2 sienntrodandaanedennenantn 31 Figure 6 Situation litigieuse du point de vue de la ressemblance 31 Figure 7 Influence du crit re d appartenance au canton eseseeeeeseeeseseeesersrerresseesrrsereseeseese 32 Figure 8 Commune isol e du point de vue de la typologie exemple 1 32 Figure 9 Commune isol e du point de vue de la typologie exemple 2 33 Figure 10 Tessin cas particulier sur les bords du lac de Lugano nsesssssnnsrnrsenrrenrrerrreernneen 33 Figure 12 Tessin alternatives avec pond ration Uniforme eeseseseseseseesseessressereseresseerseees 35 Figure 13 Tessin alternatives avec un poids fort sur l indicateur de taille An 35 Figure 14 Tessin variantes avec indicateurs d esth tisme pr dominants ssssesesesseeeseee 36 Figure 15 Conflits entre agr gation bas e sur la s
96. roduction dans notre situation l ACP d finit autant de nouvelles variables ind pendantes pour l expression des particularit s de la commune Parmi ce nouveau jeu de param tres on n en conserve qu un deux ou trois de mani re simplifier le probl me et pouvoir repr senter graphiquement les caract ristiques des communes concern es g n ralement pour d duire quelles combinaisons de variables parmi les 8 classes originales comportent le maximum d informations L analyse en composante principale n cessite l approximation de la variance sk et la covariance amp entre les variables pour construire X dite matrice de variance covariance Ensuite il faut d terminer le vecteur propre v de ayant la plus grande valeur propre La combinaison lin aire des variables centr es x moy x d termin e par ce vecteur forme alors la premi re composante principale c Pourtant il faut d abord effectuer un premier test en calculant les valeurs propres de X de mani re d terminer s il est utile d appliquer une telle m thode dans notre situation Si la premi re valeur propre repr sente plus de 60 de Dipl me EPFL Bertrand Barbey Mars 2002 Page 17 Proc dures d agr gation multifactiorelle Th orie SEELEN eegene E la somme des ou les trois premi res valeurs propres plus de 85 il est envisageable de poursuivre le d veloppement pour calculer les composantes principales de chaque commune Malheureusement les fonc
97. rtrand Barbey Mars 2002 Page 43 Proc dures d agr gation multifactiorelle D veloppement du prototype 9 D VELOPPEMENT DU PROTOTYPE SUR LES DONN ES 2000 Comme mentionn au chapitre pr c dent nous d veloppons tout d abord la m thode multicrit re sur la base du jeu d indicateurs r duit pr sent ci dessous Crit res Indicateurs l Confidentialit Nombre d exploitations agricoles Orientation de production Marges brutes standard Canton souverain Esth tisme Forme de l agr gat Indice de Grav lius Taille de l agr gat nombre d exploitations Tableau 13 Donn es 2000 R capitulatif des crit res et indicateurs Ensuite nous explorons principalement deux voies pour la d termination du voisin le plus ressemblant Nous poursuivons les recherches sur la m thode de la corr lation sur les rangs et tentons de d terminer un indice de ressemblance bas sur un calcul de distance virtuelle distance euclidienne Pour l tat 2000 nous disposons du contour des communes g n ralis es limites simplifi es et pour chaque exploitation du num ro de commune des marges brutes standard MBS primaires P1 P5 et secondaires P11 P131 des surfaces importantes du domaine agricole du nombre de t tes de b tail et de la sp cialisation de l entreprise Comme nous n avons actuellement pas de rattachement spatial de l exploitation nous devons proc der l agr gation de ces donn es individuelles par commune ce qu
98. s Enfin nous avons pu entamer la phase d agr gation proprement dite en reprenant les tapes du prototype disposition concernant la r union physique et tabulaire des communes Le code d finissant la s lection des germes et la d signation du voisin le plus ressemblant a t remodel pour construire une proc dure d agr gation selon un mod le multicrit re Ainsi le processus d agr gation suit les principales tapes suivantes 1 S lectionner les germes d apr s le nombre d entreprises agricoles des communes 2 Pour chaque germe s lectionner les voisins adjacents et trouver le meilleur pour la m thode multicrit re se r f rer au paragraphe 2 5 a pour chaque voisin attribuer un score ou un indice b d terminer le voisin le plus ressemblant score maximal ventuellement d partager les candidats ex aequo sur la base d un champ discriminant choisi par l op rateur c ins rer les n identifiants du germe et du voisin dans deux listes distinctes 3 Epurer les listes cf sch ma explicatif ci dessous figure 3 a ter tous les germes sauf 1 voulant s agr ger la m me commune b 1 liminer une des deux relations o une commune se retrouve en m me temps agr geante et agr g e b 2 sauver de cette s lection les communes voulant s agr ger r ciproquement Dipl me EPFL Bertrand Barbey Mars 2002 Page 27 Proc dures d agr gation multifactiorelle Etapes d agr gation 4 Effectuer l agr gation proprement d
99. s principales le nombre d exploitations sp cialis es dans chacune des huit classes de production et le r sum sous la forme d un code la typologie cf annexe I 1 Dipl me EPFL Bertrand Barbey Mars 2002 Page 23 Proc dures d agr gation multifactiorelle Crit res d agr gation 4 3 CRIT RE D APPARTENANCE AU CANTON Lors de la premi re phase de travail sur ce sujet les parties s accordent pour tablir un crit re d appartenance avec le canton comme indicateur Il s agit de limiter l agr gation d une commune une autre du m me canton En effet de nombreuses statistiques sont rassembl es et publi es l chelle cantonale Les offices cantonaux de statistiques r coltent bon nombre de donn es dans tous les domaines de la statistique et en particulier sur la d mographie l conomie et l agriculture Ils fournissent leurs relev s l OFS qui leur en procure d autres ou leur restitue leurs informations sous d autres formes Lors de cette tape un petit doute s installe d j sur la signification et l importance de ce param tre Malgr tout une ou deux alternatives sont d ores et d j propos es savoir la possibilit d effectuer l agr gation un canton apr s l autre D autre part pour une proc dure d agr gation globale sur tout le territoire suisse une solution consiste attribuer un poids moyen ou faible au crit re d appartenance lors de la r solution multicrit re Ainsi les d limitations cantonales s
100. s certaines communes se distinguent puisqu elles sont entour es de communes ayant toutes une orientation de production antagoniste celle de la commune en question C est le cas ici pour Aarburg Oberg sgen R mikon et Zollikon Dipl me EPFL Bertrand Barbey Mars 2002 Page 32 Proc dures d agr gation multifactiorelle Figure 9 Commune isol e du point de vue de la typologie exemple 2 M me si on veut l viter au maximum l agr gation entre communes d orientations antagonistes est rendue in luctable dans de telles circonstances Pour les communes mixtes la question se pose de savoir si l on adopte une agr gation pr f rentielle avec un type de production donn En effet il pourrait tre int ressant d orienter davantage l agr gation en examinant plus la structure conjointe entre les communes mixtes et leurs voisines v g tales ou animales Pourtant au vu des biais induits par la d finition d une typologie cette perspective ne nous semble pas judicieuse dans le cas pr sent Nous pr f rons laisser ce choix libre pour favoriser l esth tisme de la carte En effet c est l agr gat pr sentant la forme la plus r guli re qui sera choisi quelle que soit l orientation technico conomique du voisin 6 3 LE CAS PARTICULIER DU TESSIN Alors que de mani re g n rale les communes de Suisse al manique engendrent peu d agr gats litigieux l endroit pr sentant le plus de cas particuliers est sans conteste le canton
101. s indicateurs et leur justification sont pr sent s ci apr s Dipl me EPFL Bertrand Barbey Mars 2002 Page 22 Proc dures d agr gation multifactiorelle Crit res d agr gation 4 1 CRIT RE DE CONFIDENTIALIT Il s agit d une des raisons principales ayant amorc le lancement de ce projet Rappelons en effet que pour diffuser des r sultats l OFS Agr se voit contraint de rassembler les donn es de plusieurs communes pour garantir l anonymat des exploitations concern es En terme de repr sentation cartographique ce regroupement correspond l agr gation des polygones symbolisant les communes consid r es Nous choisissons le nombre d exploitations pr sentes sur le territoire communal comme unique indicateur pour ce crit re De plus pour respecter les contraintes li es la protection des donn es nous utilisons le seuil de confidentialit tabli par l OFS pour les informations sur l orientation de production et fix 12 exploitations au minimum par agr gat Cette valeur est plus ou moins arbitraire et doit pouvoir tre modifi e selon les circonstances objectifs de l agr gation nature de la variable cartographier Elle est issue de l exp rience acquise l OFS pour la cartographie et r duit environ 2000 le nombre de communes suisses ce qui est raisonnable pour les manipulations et pour une vision globale et claire de la Suisse En effet selon une convention respect e par l OFS ainsi qu au niveau international
102. s r sultats de toutes les manipulations de donn es sont souvent expos s dans des tableaux et des graphiques Une grande part des statistiques agricoles ayant un lien direct avec l espace la section d Agriculture et Sylviculture de l OFS OFS Agr pr sente de nombreuses donn es sous forme de cartes Une part de la transformation des relev s en information cartographique s effectue encore manuellement mais l volution technologique permet d ouvrir de nouveaux horizons dans ce domaine Au niveau des relev s statistiques l av nement du num rique accro t la rapidit et l efficacit des op rations d enregistrement d analyse et de transfert de donn es Les Syst mes d Informations du Territoire SIT proposent une d marche et des outils adapt s pour la gestion et la pr sentation des informations rev tant un caract re spatial 1 2 LA PROBLEMATIQUE L OFS enregistre de nombreux param tres sur les exploitations du secteur primaire et il en combine parfois pour la diffusion en th mes porteurs tels que la main d uvre l orientation de production ou le b tail bovin En outre la confidentialit des informations collect es par l OFS doit tre respect e lors de leur diffusion La plus petite entit politique et administrative la commune s impose souvent pour la pr sentation des r sultats sous forme de graphiques ou de cartes Pourtant cette entit spatiale n est pas toujours appropri e pour les statistiques agricoles pas plus d
103. scosseeosonvesesssoes 59 12 4 Affranchissement des limites communales ensenesenensnseseseseseesne 59 12 5 Autre transformation des donn es du recensement 60 13 ee e RE 61 14 BIBLIOGRAPHIE eseeeseseseseesesssseeresessssserresesssssereeesssssrerreeessssseeeeess 62 Dipl me EPFL Bertrand Barbey Mars 2002 Page 3 Proc dures d agr gation multifactiorelle A 0 SG D LA A LL LE LG LEO PUERTO NEEDS LEE LEGS LTD LUEUR STD D LOS LD LG LT DU Sn M Sn ne ANNEN NNNUNN ANNEE annama INDEX DES TABLEAUX Tableau 1 D finition des orientations et classes de production sp cialisation 13 Tableau 2 M thode multicrit re calcul des SN s issnsoss sednndesssiontorsnnassensiie 15 Tableau 3 R capitulatif des donn es disposition description et format ssessses0se0s0ee 20 Tableau 4 Pr sentation des crit res et indicateurs de la m thode multicrit re appliqu e LL 22 Tableau 5 R sultats comparatifs de deux m thodes sur l ensemble du Tessin ee 36 Tableau 6 Crit res et indicateurs retenus pour les applications sur les donn es 2000 40 Tableau 7 Corr lation simple r sultats d une it ration avec seuil de corr lation variable 41 Tableau 8 Corr lation simple r sultats comparatifs avec la m thode multicrit re 2 41 Tableau 9 Corr lation sur les rangs r sultats d une it ration seuil de corr lation variable 42 Tableau 10 Corr lation sur les rangs r
104. si tol gt tn m 2 1 Q Dans ce cas galement le test n est pas tr s utile pour notre probl matique puisqu il tend liminer les voisins les moins semblables au lieu de garder le plus ressemblant 2 6 2 2 Corr lation sur les rangs Ce test mesure la corr lation sur les rangs et s exprime par le coefficient de Spearman rt comparer avec les tables correspondantes Les observations de chaque chantillon sont remplac es par leur rang dans leur propre liste Par exemple les listes 1 0 5 8 et 6 3 2 9 deviennent 2 1 3 4 et 3 2 1 4 respectivement Il est n cessaire de disposer de deux chantillons de m me taille car le calcul du score compare les valeurs par paire L hypoth se nulle de non corr lation lin aire des deux chantillons est rejet e si lr 2 r 1 0 2 e G v 2 r 1 avec G et V les rangs du germeet du voisin vin n taille de chaque chantillon quation 3 Calcul du coefficient de Spearman corr lation sur les rangs Cette m thode peut se r v ler utile puisqu elle quantifie le degr de similitude entre les chantillons ce qui permet de hi rarchiser les voisins adjacents au germe et d en s lectionner pour l agr gation celui qui pr sente le coefficient de corr lation le plus lev 2 6 3 ANALYSE EN COMPOSANTES PRINCIPALES ACP Cette m thode d finit un autre syst me de coordonn es pour caract riser les communes concern es Au lieu de d crire la commune par les 8 classes de p
105. sts sur ce nouveau jeu de param tres Pr cisons que ce r sultat tait plus ou moins pr visible puisque intuitivement les cat gories d orientation de production taient d j bien distinctes les unes des autres N anmoins nous reprenons la m me d marche avec les donn es 2000 de MBS pour chaque exploitation m me si la probabilit est assez forte pour que les conclusions soient identiques Pour les applications sur les donn es 2000 nous d cidons de pers v rer d abord dans la voie multicrit re pour les raisons suivantes a Cette m thode est tr s proche de l actuelle proc dure manuelle ce qui rend sa compr hension tr s facile et une adaptation rapide cette technologie b Cette technique est plus fine que la corr lation puisqu elle permet l op rateur de garder un contr le sur une plus grande palette de param tres d agr gation c A d veloppement gal elle permet d agr ger plus de communes avec d excellents r sultats Malgr tout l adaptation du processus d agr gation par corr lation sur les rangs semble ouverte tous les domaines de la statistique avec un nombre de modification moindre ce qui permettra probablement d effectuer quelques tests sur les donn es du recensement 2000 des structures agricoles De m me la d termination d une distance entre le germe et chacun de ses voisins permettrait a priori d largir le nombre de m thodes capables de fournir des r sultats satisfaisants Dipl me EPFL Be
106. sultats comparatifs avec la m thode multicrit re 42 Tableau 11 Scores de Pearson r sultats d une Z tratton eeerEsENeeeeKEEEESEESEEEeEERENEEDEEed eg 44 Tableau 12 ACP r sultats pour les variables servant au calcul de la typologie 43 Tableau 13 Donn es 2000 R capitulatif des crit res et indicateurs 44 Tableau 14 M thode multicrit re sur la typologie variations des poids et determination du ec ME ce ce D ise aon iiaeaa es i 45 Tableau 15 M thode multicrit re sur la sp cialisation 46 Tableau 16 Corr lation de Spearman variations du seuil de corr lation exemple 1 47 Tableau 17 Corr lation de Spearman variations du seuil de corr lation exemple 2 48 Tableau 18 Calcul de distance euclidienne selon diff rents sch mas fonctions de la typologie ou de la sp cialisation ODER Seiende tcheegdegge eenegen genge giebeengedeg 49 Tableau 19 ACP r sultats pour les marges brutes standard primaires sur les exploitations 50 Tableau 20 Combinaison de m thodes multicrit re distance ou corr lation 52 Tableau 21 Comparaison des m thodes selon le nombre moyen de communes et de types de production diff rents regroup s dans chaque agr gat e 53 Tableau 22 Nombre d agr gats indice de Grav lius et nombre d exploitations moyens par agr gat sur toute la Suisse et sur les r gions o les diff rentes m thodes n ont pas Tableau 24 r sultats des deux m thodes
107. t Finalement l information sur toutes les exploitations est rendue anonyme en d finissant une typologie g n rale sur la commune Cette typologie est un code 15 cat gories codes 1 99 exprimant d une part quelle orientation est repr sent e en majorit sur la commune et d autre part sa proportion par rapport au nombre total d entreprises agricoles Le calcul se fait sur la base du nombre d exploitations sp cialis es dans chacune des classes du tableau 1 On classe les entreprises agricoles dans l une des quatre cat gories suivantes les exploitations sp cialis es dans les cultures permanentes les autres cultures v g tales les productions animales et les exploitations mixtes Ensuite on compte combien d exploitations regroupe chaque cat gorie et on retient celle qui en contient le plus Enfin le code de la typologie est d cid selon le nombre d exploitations en du total communal appartenant la cat gorie pr dominante susmentionn e La description d taill e des typologies et sp cialisations est pr sent e en annexe II 1 Cette classification des entreprises a t introduite selon le mod le europ en qui se fonde sur la contribution des diverses branches de production la formation de la marge brute standard totale de l exploitation Cette m thode permet de comparer l orientation technico conomique des entreprises sur le plan r gional national et international La prise en consid ration d indicateurs conom
108. tablie par Romain Tornay pour l agr gation semi automatis e de communes dans le but de diffuser des donn es agricoles Les diff rents crit res de comparaison de commune ont t d termin s d un commun accord entre les repr sentants de l OFS et de l EPFL De plus un prototype d agr gation de communes est r alis au sein de la chaire de SIRS avec des hypoth ses simplificatrices et la prise en compte d un seul crit re la superficie des polygones adjacents 3 2 DONN ES DISPOSITION L EPFL en particulier la chaire de SIRS de la section SIE met disposition le mod le num rique d altitude MNA 100 sur toute la Suisse avec une r solution de 100m qui a servi tablir un masque d altitude le contour des communes et les attributs essentiels de chaque entit spatiale pour l tat 1996 n et nom de la commune n du district n du canton l annexe IV 1 contient le d tail de la correspondance entre le num ro et le nom du canton Dipl me EPFL Bertrand Barbey Mars 2002 Page 19 Proc dures d agr gation multifactiorelle Informations pr liminaires la version 3 2 du logiciel de SIG ArcView de la firme ESRI dont le langage de programmation choisi est Avenue les scripts du prototype d agr gation Concernant la programmation il est galement possible de t l charger et modifier des scripts mis disposition sur le site Internet de ESRI L OFS nous fournit les donn es du recensement 1996 des entrepris
109. tection des Donn es Loi sur la Statistique F d rale Marge Brute Standard gain potentiel normalis pour chacune des diverses productions agricoles Campagne de Mensuration Nationale entreprise sur la base de l ellipso de de Bessel refl tant le syst me universel WGS en 1903 Mod le Num rique d Altitudes Mobilit Spatiale Organisation de Coop ration et de D veloppement Economiques Ordonnance sur le relev et le traitement des Donn es Agricoles Office F d ral de l Agriculture Office F d ral pour la protection de l Environnement de la For t et du Paysage Office F d ral de la Statistique Bundesamt F r Statistik Ordonnance d application de la LPD Producteurs Suisses de Lait Schweizer Agrarmedien GmbH Swiss Agricultural Research r seau de 6 stations de recherche agricole Surface Agricole Utile Syst me d Informations R f rence Spatiale Syst me d Informations G ographiques du Territoire Union Europ enne Union Suisse des Paysans Valeur Limite du nombre d exploitations pour v rifier la contrainte de confidentialit Proc dures d agr gation multifactiorelle Introduction 1 INTRODUCTION 1 1 CONTEXTE L agriculture conna t aujourd hui des mutations consid rables Les enjeux des r orientations en cours des activit s agricoles sont importants maintien d une agriculture concurrentielle aspects paysagers peuplement d centralis du territoire etc Par ailleurs l volution est notable to
110. tension ArcView reconnue par ESRI qui offrirait la possibilit d agr ger non seulement des polygones mais galement des pixels En outre il serait envisageable de proposer diff rentes m thodes d agr gation au sein d un m me instrument 12 2 MARCH S POTENTIELS Moyennant quelques modifications le programme actuel peut tre appliqu sur de nombreuses statistiques agricoles partir du moment o les variables composant le vecteur caract ristique sont exprim es sur des chelles comparables En effet il para t illusoire de calculer un pourcentage d levage de chaque type d animal si le nombre de t tes de b tail constitue la seule information disponible comment comparer 23 vaches laiti res avec 200 poules pondeuses si ce n est en r f rence au gain qu elles peuvent rapporter l exploitant Une fois cette condition respect e nous pensons que ce prototype peut s appliquer l ensemble des statistiques relev es par l OFS Parmi quelques d bouch s potentiels offerts aux produits qu un tel programme d agr gation permettrait de r aliser nous pouvons imaginer d une part renforcer la diffusion de telles cartes dans les organes d cisionnels des administrations f d rales cantonales ou r gionales Au niveau du district il serait possible de diversifier les th mes cartographi s mais pas de proposer des r sultats l chelle communale car il existe probablement des agr gats chevauchant les fronti res pr fectorales Si
111. ticrit re Dipl me EPFL Bertrand Barbey Mars 2002 Page 40 Proc dures d agr gation multifactiorelle Autres proc dures d agr gation 8 AUTRES PROC DURES D AGR GATION 8 1 M THODES STATISTIQUES Une premi re s lection des m thodes statistiques applicables dans le cadre de ce projet est d crite dans le chapitre 2 Nous avons alors retenu deux types de corr lation mis en uvre sur les observations et sur les rangs respectivement Nous proposons de r aliser quelques exp riences pour d terminer la qualit d agr gation de ces m thodes Nous comparons les r sultats de ces processus avec ceux de la r solution multicrit re Pour ces syst mes bas s sur la corr lation le principe d agr gation est simple le voisin qui obtient le coefficient le plus lev devient la commune agr geante qui annexe le germe et ses attributs 8 1 1 CORRELATION SIMPLE SUR LES OBSERVATIONS En premi re it ration avec une valeur limite du nombre d exploitations fix directement 12 nous obtenons les r sultats suivants Seuil de Nombre Corr lation d agr gations Tableau 7 Corr lation simple r sultats d une it ration avec seuil de corr lation variable A titre de comparaison dans les m mes conditions la m thode multicrit re effectue 479 agr gations Dans une autre approche nous ex cutons un programme avec le coefficient de corr lation comme unique facteur d agr gation Le seuil pour le coefficient de corr latio
112. tions avec les poids de r f rence Dans les deux cas la diff rence avec la solution initiale correspondant l application de r f rence n est pas marquante L alternative consistant garder un seuil fixe pour la contrainte de confidentialit peut d s lors tre d finitivement cart e les agglom rats sont trop volumineux et peu esth tiques Dans le second exemple le lissage induit par la multiplication des it rations nous pousse galement ne pas retenir cette option par la suite Ensuite nous testons une alternative caract ris e par une pond ration uniforme 1 1 1 1 1 1 une premi re application avec la valeur limite du nombre d exploitation variable VL 2 4 8 et 12 successivement image de gauche et une seconde manipulation en gardant VL 12 constante image de droite Dipl me EPFL Bertrand Barbey Mars 2002 Page 34 Proc dures d agr gation multifactiorelle Figure 12 Tessin alternatives avec pond ration uniforme Les r sultats repr sent s par ces deux situations ne sont gu re favorables les agr gats sont trop grands en surface et en nombre d exploitations En outre l information originale se retrouve compl tement liss e sur les bords du lac puisque des classes de production distinctes sont englob es dans un seul agr gat sans orientation v ritablement marqu e D autre part nous avons effectu deux exp riences en attribuant un poids plus fort l indicateur de taille poids 1 2 4
113. tions offertes par le langage Avenue ne permettent pas de r soudre une quation du 8 degr 8 classes de production servant au calcul des valeurs propres et sa programmation d passe all grement nos capacit s ainsi que le cadre de ce travail de dipl me Pourtant nous pensons utiliser diff remment les r sultats de cette m thode Celle ci ne nous offre pas r ellement une alternative pour la proc dure d agr gation Elle propose un changement de r f rentiel mettant peut tre profit l une ou l autre m thode vinc e ne donnant pas les r sultats esp r s partir des informations initiales Nous r alisons imm diatement cette transformation sur les variables caract risant les communes savoir le nombre d entreprises de chaque sp cialisation De m me nous appliquons ce proc d sur les donn es 2000 de MBS primaires conversion de variables que nous utilisons dans le chapitre 9 si elle se r v le efficace Dipl me EPFL Bertrand Barbey Mars 2002 Page 18 Proc dures d agr gation multifactiorelle Informations pr liminaires 3 INFORMATIONS PR LIMINAIRES 3 1 OFFICE F D RAL DE LA STATISTIQUE 3 1 1 FONCTIONNEMENT GENERAL La statistique agricole se base sur plusieurs textes l gislatifs Constitution f d rale Cst avril 1999 article 65 Lo f d rale de l Agriculture LAgr avril 1998 article 185 Loi sur la Statistique F d rale LSF octobre 1992 et ses 4 ordonnances d application de juin 1993
114. uables taux de conservation de la cat gorie prouvent que la m thode combin e peut s appliquer en de nombreuses situations Ces propos confortent la position privil gi e de ce syst me dans l optique d un d veloppement plus pouss du prototype vers un cercle largi de variables cartographier et donc vers un nombre d utilisateurs potentiellement plus lev Dipl me EPFL Bertrand Barbey Mars 2002 Page 54 Proc dures d agr gation multifactiorelle Synth se 11 SYNTH SE 11 1 LES AVANTAGES D UN PROGRAMME D AGR GATION D UNITES TERRITORIALES Nous pouvons ressortir deux avantages importants pour la section d agriculture et de sylviculture de l OFS En premier lieu un tel programme permet de rendre accessibles bon nombre de cartes qui impliquaient un d lai de livraison presque r dhibitoire vu le temps qu il fallait consacrer leur laboration par voie humaine Moyennant quelques ajustages un tel syst me d agr gation semi automatique permet de raccourcir consid rablement le temps d dition de la carte De plus cette m thode pr sente l avantage de beaucoup r duire la part de subjectivit li e in vitablement la nature humaine ce qui rend cette proc dure coh rente et r guli re dans toute sa p riode de travail Du fait de sa rapidit d ex cution ce syst me permet galement d largir l ventail de produits cartographiques de l OFS tout en conservant le strict anonymat des donn es La principale innovation co
115. uer la valeur de l indicateur mais correspond l ordre d croissant des Dipl me EPFL Bertrand Barbey Mars 2002 Page 51 Proc dures d agr gation multifactiorelle G n ralisation r sultats de chaque commune sur cet indicateur D autre part le fait d utiliser un indice de ressemblance corr lation ou distance permet de s affranchir du traitement au cas par cas et de d crire le degr de similitude sur la base des valeurs r elles caract risant la communes Nous utilisons nouveau les param tres de r f rence pour cette application savoir les poids 1 5 3 1 et une valeur limite du nombre d exploitations variable VL 2 4 8 12 et 12 Le coefficient de corr lation se d termine comme pr c demment selon la formule de Spearman De m me nous calculons la distance euclidienne sur toutes les composantes du vecteur caract ristique des communes Le tableau suivant r sume les r sultats obtenus d taill s en annexe XVI 2 3 carte Type de Combinaison Combinaison R t multicrit re corr lation multicrit re distance erence ee d agr gats Communes Se pts 78 2 77 8 80 8 79 5 89 5 agr g es e production inchang es Sur la typologie 44 6 43 2 45 1 45 9 52 2 Communes SE 85 7 86 6 85 5 88 6 93 8 agr geantes S Proauction inchang es Sur la typologie 64 3 64 3 61 5 67 9 71 0 Tableau 20 Combinaison de m thodes multicrit re distance ou corr lation Comme nous pouvions no
116. us les niveaux de la soci t actuelle L Office F d ral de la Statistique OFS dans son int gralit doit alors tenir compte de nouveaux param tres contraignants lors de chaque tape du relev du traitement et de la diffusion de l information Par exemple l OFS est soumis la loi 1992 et l ordonnance 1993 sur la protection des donn es selon lesquelles les r sultats du traitement sont publi s sous une forme ne permettant pas d identifier les personnes concern es LPD art 22 De m me les n gociations bilat rales entre l Union Europ enne et la Suisse en mati re d agriculture induisent des ajustements dans l approche des recensements des structures agricoles par exemple Les donn es statistiques alors relev es sur les exploitations agricoles refl tent un tat une situation fig e de l conomie du fonctionnement et de la structure des entreprises du secteur primaire En rassemblant les informations de plusieurs recensements on dispose de donn es de dimensions spatiale et temporelle permettant toutes sortes d analyses pour juger de l efficacit des actions entreprises pour comprendre des processus de changements naturels ou pour d cider des mesures prendre dans le cadre de nouveaux projets Toutes ces r flexions doivent permettre l agriculture de remplir au mieux ses diff rentes fonctions et de maintenir son importance dans l conomie contemporaine Les informations saisies lors des enqu tes ainsi que le
117. us y attendre cette derni re modification ne r volutionne pas la m thode d agr gation ni son r sultat Dans l ensemble les r sultats sont bons malgr une l g re baisse de puissance par rapport la solution de r f rence La combinaison des proc dures n am liore pas l efficacit de l agr gation mais retient les avantages de chaque composante surtout lorsque le crit re de ressemblance est caract ris par de nombreuses variables Dans de tels cas en effet tant la corr lation que la distance vitent de r gler une une toutes les alternatives et la partie multicrit re du programme permet de consid rer galement d autres facteurs esth tiques arbitraires etc Si au contraire on ne dispose que de peu d l ments descriptifs on atteint les limites de la m thode de la corr lation et la d termination d une distance s apparente beaucoup l attribution discr te d un score C est pourquoi nous proposons de conserver cette combinaison multicrit re distance pour un prochain test bas sur d autres donn es de la statistique agricole Auparavant pour d montrer que les m thodes pr sent es dans ce travail sont finalement assez proches et que la m thode retenue offre le meilleur compromis entre g n ralisation de la proc dure et application multifactorielle nous effectuons quelques comparaisons suppl mentaires Tout d abord nous nous int ressons conna tre la taille moyenne des agr gats selon deux composantes
118. valeurs th oriques sur la main d uvre n cessaire au fonctionnement d une exploitation agricole selon l orientation de production et en consid rant uniquement le travail de l exploitant et de sa famille Cette valeur contribue distinguer les entreprises exploit es titre principal ou accessoire Les donn es de 1996 transmises par l OFS sont le fruit d une tape d agr gation suppl mentaire Toutes les donn es du recensement des structures agricoles traduites en terme mon taire MBS sont regroup es dans les codes DOI J18 dont le d tail est pr sent en annexe I 1 Ensuite une premi re simplification synth tise ces donn es en 5 cat gories principales P1 P5 et 7 secondaires P11 P131 cf annexe I 1 A partir des 5 th mes primordiaux est d termin e la sp cialisation de chaque exploitation en 3 orientations et 8 classes Production v g tale 1 Grandes cultures 2 Cultures horticoles 3 Cultures permanentes Production animale 4 Herbivores 5 Granivores Elevage hors sol Exploitation mixte 6 Polyculture 7 Poly levage 8 Mixte Tableau 1 D finition des orientations et classes de production sp cialisation 2 4 ETABLISSEMENT D UNE TYPOLOGIE DES ENTREPRISES AGRICOLES Dipl me EPFL Bertrand Barbey Mars 2002 Page 13 Proc dures d agr gation multifactiorelle Th orie PRET PE PET CEE ENEE CE LE PE D E EL PES TO D EE LED EE EEE ee steet r selen geet ere ge DOC ECO REC aT eegen EE LEE OIL EE LEO ti

Download Pdf Manuals

image

Related Search

Related Contents

Rubbermaid FG3H8900TITNM Instructions / Assembly  フ~リア・  取扱説明書 - 測定器レンタル 株式会社メジャー  Philips 34PW981799 User's Manual    Vosstronics VTG-OT21CSG  DC733 man cdls drills Euro 111108.indd  

Copyright © All rights reserved.
Failed to retrieve file