Home

Au-delà de la critique big data

image

Contents

1. Obama 2008 Source Issuecrawler net Govcom org Foundation 2008 mentionn 2 Figure 4 Graphique produit par Issuecramler sur les interconnections entre les diff rents sites Internet consacr s dans Krippendorff 2012 Les mesures alternatives d impact ou altmetrics diff rent de celles issues de la scientom trie traditionnelle dans le sens elles comptabilisent les citations des ouvrages universitaires publi s non dans des revues mais sur les blogs Twitter ou tout autre r seau social universitaire ou plate forme de citation de type http 28 Traces num riques et territoires academia edu ou Mendeley La comptabilisation et l interpr tation de r f rences bibliographiques sur les r seaux sociaux participe d une approche analytique plus large de la mati re substantielle et des responsabilit s de la soutce sur une question d actualit ou un r seau id ologique observ par exemple sur Facebook ou Twitter On peut prendre comme exemple les contenus les plus r f renc s sur Twitter dans cas pr cis ceux qui renvoient le plus des pages Web par les fonctionnaires hollandais rattach s des minist res Il s av re que ces fonctionnaires tendent naturellement suivre les actualit s les hommes ou femmes politiques ainsi que les observateurs des nouveaux m dias et de la vie politique plut t que de simples citoyens voir
2. ou gestion de version le ahyare ou logiciel malveillant le codage la plate forme le profil etc Des tudes telles que celles de Lawrence Lessig et Eben Moglen ont express ment soulign l utilisation dans le discours juridique des nouveaux m dias des mots form s partir du pr fixe re des termes tels que le remix le reuse ou t utilisation la redistribution la r vision et le recyclage redistribute revise et recycle qui apparaissent comme autant de d fis lanc s par les m dias num riques aux lois et m urs existantes De facon similaire l tude des natifs num riques ou ses enjeux qui est mise en avant dans la notion m me de m thodes num riques propose de r orienter la m thodologie du m dium et des concepts qui lui sont associ s et de les appliquer la recherche en sciences sociales et politiques Cette variante du tournant num rique invite en effet tudier non seulement ce qui est num ris mais galement le num rique natif en se servant des donn es et en suivant un raisonnement qui reprenne les m thodes du m dium Comment faire pour r orienter dans le cadre de la recherche en sciences politiques et sociales les techniques et notions num riques vers une utilisation en ligne Pour r pondre cette question je vais m int resser un nouvel espace dexpression politique Facebook et d velopper une approche analytique la fois qualitative et quantitative ou quali
3. Foot et Schneider 2006 Foot A et Schneider S M 2006 Web Campaigning Cambridge MIT Press Graves et Kelly 2010 Graves L et Kelly J 2010 Confusion Online Faulty Metrics and the Future of Digital Journalism Tow Center for Digital Journalism New York Columbia University Graduation School of Journalism Hansell 2006 Hansell S 2006 8 ao t AOL removes search data on vast group of web users New York Times Krippendorff 2012 Krippendorff H 2012 Content Analysis An Introduction to its Methodology London Sage Lazer e al 2014 Lazer D Kennedy R King et Vespignani A 2014 Parable of Google Flu Traps in Big data Analysis Science 343 6176 1203 1205 Lazer e al 2009 Lazer D Pentland A Adamic L Aral S Barab si A L Brewer D Christakis N Contractor N Fowler J Gutmann M Jebara T King G Macy M Roy D et Van Alstyne M 2009 Computational social science Science 323 5915 721 3 Latour 1991 Latour B 1991 Technology is society made durable In Law J d A Sociology of Monsters Essays on Power Technology and Domination London Routledge pp 103 131 Latour 2004 Latour B 2004 Paris Invisible City http www bruno latour fr virtual EN index html Manovich 2011 Manovich L 2011 Trending The Promises and the Challenges of Big Social Data http www manovich net DOCS
4. Manovich 2011 Michel ef 2010 Priem e al 2010 Rogers 2013 Je m int resserai particuli rement ce que l on a appel les m thodes et techniques quali et quanti du tournant num rique ainsi qu aux m thodes de recherche utilis es lors d un data sprint en les envisageant s par ment du ph nom ne bzg dara En premier lieu on peut diff rencier l ensemble des m thodes utilis es en sciences num riques les unes des auttes selon qu elle utilise un type de document plut t qu un autre ou une m thode bien pr cise ceci revient distinguer les tudes qui utilisent des documents et des m thodes issus de la num risation les natifs num riques ou une combinaison des deux Sur la question des documents les chercheurs en humanit s num riques tout particuli rement se voient de plus en plus offrir de nouveaux corpus de recherche alors que les biblioth ques nationales les archives et les mus es livrent r guli rement des fourn es fra ches de mati re num ris e et index e On parle m me de crise dans certains domaines de recherche en humanit s num riques car l accueil r serv par les chercheurs ces nouveaux documents n a pas t la hauteur de cette ru e vers la num risation Par exemple les archives Web sont encore rarement utilis es des fins scientifiques si l on en juge le nombre de publications citant des collections archiv es de donn es Web Dougherty e al 2010 Thomas ef al 20
5. galement Rogers 2009 Au del de la critique big data 19 que Twitter et dans quels cas ou jusqu o est il possible d tudier gr ce Twitter des ph nom nes soci taux l tat naturel A l occasion d un concours organis en 2013 par le Centre am ricain pour le contr le et la pr vention des maladies US Centers for Disease Control une s rie d tudes avait t publi e qui avait montr comment l volution de la grippe pouvait tre suivie sur Internet non seulement gr ce au moteur de recherche de Google mais galement par le type de pages vues sur Wikip dia et de tweets g otagg s sur Twitter On pourrait qualifier cette m thode qui consiste obtenir des r sultats partir de donn es disponibles en ligne d inf rence en ligne les r sultats sont souvent accessibles sur des interfaces type tableaux de botd avec des cartes montrant les zones d activit comme l a fait par exemple le laur at du concours du CDC Pr dire la prochaine saison de grippe un site de pr vision des maladies infectieuses grippe de l Universit de Columbia CPID 2015 Si l algorithme de pr vision s appuie sut la combinaison de donn es de surveillance compil es par le CDC avec l aide d un Google Flu Trends r vis et r habilit l authenticit des r sultats n en repose pas moins sur les r gimes de surveillance traditionnels tels que les admissions l h pital ce qui leur donne davantage de cr dibili
6. son endurance Sur les r seaux sociaux et sut tout autre environnement num rique personnel quantifi par exemple les logiciels d valuation d un programme fitness les m triques comptabilisent et communiquent l intensit de l activit les J aime sur Facebook par exemple et ont t notamment critiqu es pour leur incitation vouloir toujours plus poussant les gens vouloir toujours plus de J aime plus de commentaires et plus d amis Grosser 2014 L utilisation du suffixe nomique est moins directement li e la question des relations entre l industrie du Web et les sciences il renvoie la loi dans le sens des lois de la nature et fait donc allusion aux fondamentaux de la vie et la recherche fondamentale Il partage avec le terme m thodes une approche pist mologique illimit e Quelle que soit notre progression dans le travail et quelle que soit la d marche adopt e les m thodes soulignent la construction par tapes d une proc dure ou d un protocole de recherche Si l on applique cette description aux m thodes num riques celles ci pourraient embrasser l ensemble des proc dures utilis es pour l tude des documents num riques m me si le terme d signe plus sp cifiquement les m thodes utilis es en ligne pour l tude des donn es du Web Je reviendrai cette question apr s un bref examen de l analytique culturelle de la culturomique de la cyberm trie et des m triques apr
7. Figure 5 De plus le sujet le plus r f renc est l utilisation par les fonctionnaires des nouveaux m dias et les actions et campagnes innovantes sur le Web ce qui signifie que le contenu partag est avant toute chose auto r f rentiel et centr sur les m dias putet qu un sujet d actualit A Tm ajboekestjBracRObamg mer statstekci mam us Sopa nre wMNaglieroesEU s JCE TEE gt tin aximeVerhagerltRiiSbuijink Qa argnpypeeevscherrenb Kram d pain 2 AlexanderNL wamoaandre Pp mat legraat SIN Era aste andre gt Caoa lMderspw 7 11560 da JaapJand ii fritswester Laradi TheTwestOfGos JoaniaeHennis p PS panting Domiipiquatieydo UTI nmm RPlasterk Jw Giederiksamsom WasslaHachchi hgroenusa Tr Sid annesgar nes Gbhoelomar APechtold e Tong nomen Borisham T ur Jutchcowboys u Gender t onina 4 Koningin Dostevanhetweb N U n Frank e Mina ZK Figure 5 R seau largi des follow followers des fonctionnaires minist riels hollandais mars 2013 Donn es recueillies bar TCAT DMI Amsterdam et repr sentation graphique avec Gephi Source Baetens et al 2013 Comme nou
8. Manovich trending paper pdf Manovich 2015 Manovich L 2015 Analyzing Cultural Data https docs google com document d 1DsAQUQ7paWimVQMNwXDO5Qgm7xnpeqv9HQdpn9E Pwsg Michel e a 2011 Michel B Shen Y K Aiden Veres A Gray M K Pickett J P Hoiberg D Clancy D Norvig P Orwant J Pinker S Nowak et Aiden E L 2011 Quantitative Analysis of Culture Using Millions of Digitized Books Science 331 176 182 Moretti 2005 Moretti 2005 Graphs Maps Trees London Verso Moretti 2000 Moretti F 2000 Conjectures on World Literature New Left Review 1 54 68 32 Traces num riques et territoires Ohm 2010 Ohm P 2010 Broken Promises of Privacy Responding to the Surprising Failure of Anonymization UCLA Law Review 57 1701 Parks 2005 Parks L 2005 Cultures in Orbit Durham Duke University Press Piper 2013 Piper A 2013 Reading s Refrain From Bibliography to Topology ELH 80 2 373 99 Priem e a 2010 Priem J Taraborelli D Groth P et Neylon C 2010 Alt metrics a manifesto http altmetrics org manifesto Puschmann et Burgess 2013 Puschmann C et Burgess J 2013 Politics of Twitter Data Discussion Paper Series 2013 01 http sstn com abstract 2206225 Richmond 2011 Richmond R 2011 27 septembre As Like Buttons Spread So Do Facebook Tentacles New York
9. leaning containing obama Ordered by left leaning Ordered by center leaning Ordered by right leaning 1 obama accomplishments W E 1 obama pois W 1 1 cost of trip to india w 2 accomplishments W una 2 w m 2 Wh 2 2 2 y 3 obama trip 10 cost W forgiveness 7 4 obama numbers W c m 4 obama press coference gt obama rumors 5 barack refigion Y ra 5 don w 5 of obama chema collective save 2 aocompluhments W 00 Insights by Yahoo Labs depays the proportion of times a search query resuis in Cick rough on blog of a partcutar leaning Blue stands for left ieaning biogs grey for center and for nighteaning blogs For more information see the pace Copyright 2011 Yahoo Inc Al rights reserved Halo Privacy Terms of Service Figure 3 Political Insights Yahoo Labs montrant les recherches des sympathisants de gauche et de droite ayant pour sujet Obama 2011 Source Borra et Weber 2012 En sciences sociales num riques la cyberm trie consiste appliquer des m thodes d analyse de citations en utilisant des liens Internet principalement de la m me mani re que s ils taient des citations extraites d ouvrages universitaires et en traitant le lien Internet comme un gage de cr dibilit ou de mesure d impact Thelwall ef 200
10. manifestations et recueillis sur des m dias en ligne et pour lesquels on pouvait reconstituer une chronologie des v nements cela avait t notamment le cas avec des images prises au parc Gezi Istanbul durant les manifestations de mai juin 2013 utilisant la technologie ImagePlot on assiste la transformation qui a travers cette r volution des arbres en Turquie comme le dit un t moin la transformation de l espace public en espace priv montre pourquoi le but de l occupation du parc Gezi n tait pas seulement de sauver des arbres mais de sauver la d mocratie turque voir Figure 2 Turkey EJOLT team 2013 La couleur verte dominante d cline progressivement et c de la place aux images de manifestants asperg s de gaz lacrymog nes puis plus g n ralement la lutte pour les droits La culturomique galement pratiqu e par les humanit s num riques est une discipline qui interroge partir de Google Ngram Viewer la base de livres num ris s de Google sur des mots pr cis faisant ainsi ressortir des tendances culturelles ou soci tales elle se concentre essentiellement sur les ouvrages en anglais parus entre 1800 et 2000 bien que l on trouve aussi des livres dans d autres langues Michel ef al 2011 On obtient sous forme de graphiques la variation de fr quence d utilisation de mots cl s travers la p riode mentionn e ces graphiques rappellent la fois m thodologiquement et visuellement les
11. objets du m dium et ceux qui en d rivent Latour 2004 La distinction entre natifs num riques et documents num ris s peut galement s appliquer la m thode employ e dans les sciences humaines et sociales On trouve d un c t des m thodes qui ont effectu une migration vers le Web les enqu tes en ligne par exemple et de l autre des m thodes sp cialement cr es pour une utilisation en ligne comme le PageRank de Google un classement 20 Traces num riques et territoires qui privil gie un site Web plut t qu un autre ou l EdgeRank mis en place par Facebook qui privil gie un ami plut t qu un autre selon votre affinit avec lui On peut donc placer les diff rentes approches en recherche num rique sur une matrice binaire ou si l on pr f re les disposer sur un graphique en ventail ou bien les faire d filer horizontalement l aide d un curseur o l on verrait appara tre quels types de documents sont davantage sollicit s pour les donn es num ris s ou natifs et quelles m thodes sont imit es ou natives voir Tableau 1 Enfin en lieu de la num risation des concepts comme cela a t voqu plus haut existe un discours sp cifique l usage du Web que l on entend aussi bien dans la presse professionnelle que dans l utilisation des logiciels critiques un langage dont on pourrait tirer une utilisation analytique le spa7 les creative commons la wikification le versioning
12. s les avoir pr sent es j offrirai quelques pistes pour les adapter la recherche en sciences politiques et sociales La premi re de ces approches en humanit s num riques l analytique culturelle a souvent comme objet d tude des collections num ris es par exemple l ensemble des couvertures historiques de Time Magazine toutes les peintures de Rothko ou de Mondrian etc et s int resse leurs propri t s formelles et la mani re dont elles changent avec le temps Son logiciel attitr est ImagePlot qui regroupe des images selon leurs propri t s formelles telles que la luminosit et la saturation voir Figure 1 On appelle le produit de cette analyse un espace de style les images visuellement similaires sont dites proches celles qui sont diff rentes se retrouvent loign es les unes des autres Manovich 2011 Ce terme s inspire de la notion de styles utilis e en histoire de l art qui permet de regrouper et de r unir en cat gories des uvres d art 24 Traces num riques et territoires MONDRIAN ROTHKO Figure 1 Rothko contre Mondrian Produit par le logiciel ImagePlot et Cultural Analytics Comparaison des espaces de style L axe des abscisses montre la luminosit l axe des ordonn es la saturation Source Software Studies Initiative 2011 Photo ef he 2013 protesi Terry mmr Figure 2 Caract risation d image sur les premi res images apparues sur Google Images lors
13. top of the search enpne marshall org 8 cimatearkog 4 E Mes A realclimate org 35 sourcewatch org 21 Product o the Digital Methods dimi oes cl Analysis Figure 6 Pr sence des climato sceptiques sur les principaux sites consacr s aux changements climatiques selon bttp google com juillet 2007 Source analyse distance par Google Scraper dit L ppmannian Device dispositif Lippmanian Digital Methods Initiative Amsterdam 2007 CONCLUSION On ne peut pas consid rer les m thodes num riques dans leur application g n rale ou dans celle plus sp cifique de r orientation de dispositifs comme de simples bo tes outils ou comme le mode d emploi d une s rie de logiciels les m thodes num riques questionnent plus largement la mani re de faire de la recherche en ligne Elles invitent consid rer ou imaginer d un point de vue sociologique les opportunit s de recherche qu offre la culture en ligne en se laissant guider par le m dium au lieu de le faire r pondre des ordres disciplinaires conceptuels Prenons l exemple en guise de conclusion de l activisme politique On pourrait observer d un il critique la mont e du slacktivisme ou du clicktivisme cette activit en ligne qui requiert par un simple clic un engagement minimum mais donne pour autant l impression d avoir t utile une cause On pourrait l inverse tudier dans quelle mesure aimer part
14. 10 De plus certaines interrogations subsistent quant l quipement et la formation des enseignants chercheurs et des tudiants l l enjeu essentiel porte la fois sur la pertinence et la mani re d enseigner la programmation ou le codage Manovich 2015 Pour les chercheurs en sciences sociales num riques les donn es num riques natives issues du Web pourraient pr senter un plus grand int r t que les objets patrimoniaux num ris s dans la mesure o les donn es sont utilis es pour tudier les tendances les opinions les rumeurs les prises de position etc ainsi que l avait signal en 2009 un groupe de chercheurs en sciences sociales qui s tait pench sur le tournant computationnel dans sa discipline Lazer e al 2009 Reste savoir si vraiment comme certains se le sont demand on peut valuer l opinion publique en tudiant les tendances partir par exemple de donn es recueillies sur Twitter Existe t il une corr lation entre l humeur d tect e sur Twitter et le comportement des esprits animaux sur le march boursier Bollena ef 41 2011 Peut on inf rer l incidence de maladies et de troubles m dicaux des tweets touchant la sant Mitchell et Hitlin 2013 Le probl me se pose dans les m mes termes que pour le Google Flu Trends tudie t on ici une tendance soci tale ou le fonctionnement des r seaux sociaux Dans quels cas l tude de donn es Twitter ne concerne t elle 1 Voir
15. 5 Ackland 2013 On retrouve l approche cyberm trique dans des logiciels tels que Issuecrawler ou VOSON qui fouillent m ticuleusement ou crawl les sites Web identifient des liens et repr sentent ces relations sous la forme de graphes de r seaux ils en montrent ainsi les caract ristiques y compris la centralit ou la p riph ralit d un ou plusieurs acteurs Elle peut galement mettre en vidence une strat gie en ligne comme l ont montr les graphes de r seaux publi s par Issuecrawler suite la campagne en ligne d Obama en 2008 Le caract re exceptionnel de la forme toil e du r seau s explique par la strat gie de mise en relation par laquelle s est illustr e la campagne d Obama en 2008 voir Figure 4 Le c ur du r seau est form par le site http barackobama com et ses sous sites tels que http latinos barackobama com http faith barackobama com et http students barackobama com La p riph rie est constitu e en majeure partie par des sites de r seaux sociaux consacr s Obama ainsi que par les pages du candidat 2 Voir galement Foot and Schneider 2006 Krippendorff 2012 27 Au del de la critique big data te par ailleurs d autres sites et ne 2 sut LinkedIn Facebook Flickr etc Le t fait donc pas tat des campagnes Web populaires influenc es par les nouveaux m dias comme celle de Howard Dean en 2004 qui avait permis aux utilisat
16. Apr s d importantes mises jour de certains de ses algorithmes par Google Panda en 2011 par exemple des sites internet ont vu leur classement baisser notamment ceux qui pr sentaient liens spammy fermes de spam ou r p titeurs de contenus content repeaters en nombre trop important Singhal et Cutts 2011 Il y a fort parier que si l on tudiait l volution dans le temps des classements des r sultats des moteurs de recherche on verrait quel point des algorithmes instables produisent des positionnements fluctuants METHOD NATIVELY DIGITAL DIGITISED DIGITISED FOR gt Altmetrics 4 7 e cs Cultural Analytics ix DATA NATIVELY Webometrics Digital Methods DIGITAL Tableau 1 Cinq mani res d tudier les bumanit s num riques et les sciences sociales num riques repr sent es selon les types de donn es et m thodes privil gi s LES TUDES NUM RIQUES Ces dix derni res ann es les m thodes et techniques d ploy es dans le cadre de la recherche num rique qui utilise la fois des donn es num ris es et des donn es en ligne ont t nonc es selon une large gamme de desctipteurs notamment l analytique les indicateurs les sciences nomiques ou toutes m thodes connexes projetant ainsi tout un panel de nuances sur l objet mesur En recherche num rique on associe naturellement l utilisation de l analytique l industrie de surveillance des nouveaux m dias qui est d
17. Times http bits blogs nytimes com 2011 09 27 as like buttons spread so do facebooks tentacles Rochlin 1997 Rochlin G 1997 Trapped in the Net Princeton Princeton University Press Rogers 2013 Rogers R 2013 Digital Methods Cambridge MA MIT Press Rogers 2009 Rogers R 2009 The End of tbe Virtual Amsterdam Amsterdam University Press Rogers 2005 Rogers R 2005 Old and New Media Competition and Political Space Theory and Event 8 2 Savage et Burrows 2007 Savage M et Burrows R 2007 The Coming Crisis of Empirical Sociology Sociology 41 885 899 Sullivan 2010 Sullivan D 2010 Why Google Can t Count Results Properly Search Engine Land http searchengineland com why google cant count results properly 53559 de Solla Price 1963 de Solla Price D J 1963 Little Science Big Science and Beyond New York Columbia University Press Singhal et Cutts 2011 Singhal A et Cutts M 2011 Finding more high quality sites in search http googleblog blogspot nl 2011 02 finding more high quality sites in html Thelwall e a l 2005 Thelwall M Vaughan L Bj rneborn L 2005 Webometrics In Cronin B d Annual Review of Information Science and Technology 39 Medford NJ Information Today 81 135 Turkey EJOLT Team 2013 Turkey EJOLT Team 2013 Turkey s Tree Revolution part 2 Everyday I m chapulling EJOLT Mapping Envir
18. Traces num riques et territoires Marta Severo Alberto Romele 24 ParisTech Partie 1 La trace les m thodes et les donn es Au del de la critique big data La recherche sociale et politique l re num rique Richard Rogers INTRODUCTION BIG DATA ET LE TOURNANT COMPUTATIONNEL Parmi les d bats actuels se pose la question de l harmonisation de la recherche en sciences politiques et sociales avec du num rique Comment faire face aux d fis que posent Internet et le num rique notamment les donn es d sormais accessibles en ligne la recherche Alors que le terme big data connait un succ s grandissant il semble que la recherche tout comme l ensemble de ce que l on pourrait appeler le calendrier programmatique num ros sp ciaux des revues appels financement titres des conf rences s minaires etc soit guid e par des m thodes et des outils bien sp cifiques Pour certains ce ph nom ne a pris le nom de tournant computationnel qui d signe l int gration des techniques informatiques et des big data en plein essor aux pratiques appliqu es la recherche en sciences sociales Berry 2011 Dans un premier temps je propose d examiner le tournant computationnel les big data et les multiples critiques qui leur ont t adress es pour ensuite les tudier ind pendamment de ce que l on pourrait appeler le tournant num rique Ce dernier offre en effet certaines opportunit s de re
19. UES DE LA TRACE NUM RIQUE 211 DE LA TRACE LA CARTE ET DE LA CARTE LA TRACE 112 213 Matthieu Noucher DIMENSIONS SPATIALES DE L ACTUALIT 225 Laurent Beauguitte Marta Severo RECONFIGURATION DES PRATIQUES PARTICIPATIVES 239 Nicolas Douay Maryvonne Pr vot REMERCIEMENTS 5559 ve p ie Os Ere Ex e REPE dS 259 261
20. ager et commenter un contenu est une preuve d engagement et par l m me tudier par exemple autour de quelles vid os et quelles photos se rassemblent aujourd hui les groupes et pages anti islamiques sur Facebook voir Figure 7 L tude de l engagement s inspire d un cadre analytique qui capte aussi bien les clics que les commentaires et qui 30 Traces num riques et territoires identifie le contenu qui rassemble ouvrant ainsi la porte d autres interpr tations Il s agit ici d s la phase pr liminaire de s appuyer sur les mesures d activit du m dium et de se demander ensuite quels enseignements peuvent tre tir s Most engaged with image Most commented image Cultural differences Getting stoned LES Taking shots gt Fe 3 Gay guys hanging out LE ESA LI 79 Figure 7 Contenus les plus suivis sur les r seaux Facebook europ ens anti djibadistes janvier 2013 Tir de W hat does tbe Internet add Studying extremism and counter jibadism online International Workshop and Data Sprint Digital Methods Initiative Amsterdam 2013 R F RENCES BIBLIOGRAPHIQUES Adobe 2014 Adobe 2014 Adobe Analytics http www adobe com solutions digital analytics html Ackland 2013 Ackland R 2013 Web Social Science Concepts Data and Tools for Social Scientists in the Digital Age London Sage Baetens amp al 2013 Baetens T Juetten T Maessen J B
21. ante et l enjeu des d bats sur les modes de production de la connaissance partir des big data et des techniques de lecture distance appara t ici pleinement Schulz 2011 Allison e a4 2011 Non seulement faut il tre si l on peut dire proche des donn es pour pouvoir les lire distance il faut encore obtenir le droit de les approcher et d y acc der physiquement Il faut encore ajouter cela le temps pass travailler sur les donn es une mission tr s longue surtout lorsque l on doit rester sur place avec les donn es Comme il a t mentionn plus haut lorsqu ont t voqu s les ph nom nes de pseudonymisation et de d personnalisation des donn es avant m me l analyse des donn es il faut parfois entreprendre des d marches nouvelles en terme de pr vention des d marches r cemment apparues qui r pondent aux actes de d sanonymisation initi s par des tiers Journalistes et d fenseurs de la vie priv e notamment Il est important de se pr parer la mont e de ce que l on appelle la science de la r identification Au del de la critique big data 17 ou l ensemble des techniques qui permettent de r tablir l identit de personnes d lib r ment brouill e Ohm 2010 On a par cons quent ajout au nettoyage des donn es une tape pr paratoire suppl mentaire Pour r sumer la critique des big data a des points d ancrage pist mologiques esth tiques et thiques commencer par une rup
22. ce des v ritables noms Une autre mani re de r pondre aux questions thiques qui mergent de l analyse des big data personnelles est de les agr ger et de les d personnaliser c est le cas par exemple lorsque l on recueille les listes des int r ts post s sur leur page Facebook par les amis des candidats la pr sidence am ricaine ou de n importe quelle autre personnalit publique qui poss de une page officielle dans le but de les observet et d en d duire certains rapports de cause effet comme pat exemple l influence des guerres entre cultures ou les pr f rences m diatiques des amis selon leur orientation politique gauche ou droite 16 Traces num riques et territoires Aujourd hui les critiques des big data pointent une tendance davantage se fier des flux et des signaux de donn es disponibles par exemple les APIs des r seaux sociaux plut t qu appliquer la m thode usuelle qui consiste en chercher de nouveaux mais qui demande davantage d efforts Vis 2013 Dans les fondamentaux de la recherche les donn es auraient elles remplac une vision qui privil giait les probl mes r soudre Par exemple quelqu un qui voudrait g olocaliser des poches de haine ou d intol rance doit il s engager sur la piste potentiellement prometteuse des tweets g otagg s ou doit il prendre en compte des donn es nouvelles et les moyens de les recueillir Dans ce cas c est la disponibilit imm diate des donn es
23. cherche s appuyant sur l analyse mais selon une approche diff rente de ce que l on a pu observer dans le tournant computationnel et les big data Le d bat consiste en partie estimer l troitesse des liens qui unissent le tournant computationnel l influence croissante des big data une notion qui dans le hype cycle du cabinet Gartner a volu du stade des attentes exag r es en juillet 2013 celui du gouffre des d sillusions un an plus tard Gartner 2014 Cette descente coincidait avec le probl me de surestimation dont fut victime le site Google Flu Trends un projet novateur de big data en recherche m dicale et sociale gr ce auquel les recherches sur les sympt mes de grippes ou associ s effectu es sur le moteur de recherche sont g olocalis es et utilis es pour mesurer l activit r elle de la grippe et sa localisation Ce service avait sur valu l importance de la grippe par un coefficient de deux par rapport aux chiffres publi s par les syst mes habituels de surveillance de l Institut national de la Sant am ricain et ses quivalents ceci avait amen les chercheurs s interroger sur les m thodes de mesure pratiqu es sur le Web et si celles ci ne se limitaient pas identifier des effets m diatiques plut t que des r alit s sur le terrain Lazer ef al 2014 A l annonce d une nouvelle vague de grippe constate t on plus d activit sur le moteur de recherche sachant que la personne qui effectue
24. d une recherche sur le terme Gezi selon save the trees sauver les arbres en vert ou bring down the government faire chuter le gouvernement en rouge juin 2013 Digital Methods Initiative Amsterdam 2013 Au del de la critique big data 25 Cette notion d espace de style a t utilis e dans l analyse des selfies ces autoportraits photographi s l aide d un smartphone et post s ensuite sur Instagram par des utilisateurs dans plusieurs villes Le projet avait pour but d analyser les propri t s formelles des portraits afin de les regrouper et d en extraire certaines constantes comme la pose inclinaison de la t te le sexe l ge et l expression du visage dans les villes de Berlin Moscou Sao Paolo Bangkok et New York parmi les conclusions on peut mentionner le fait qu il y ait nettement plus de femmes que d hommes qui prennent des selfies qu Sao Paulo on pose avec beaucoup de s rieux avec un angle d inclinaison de la t te environ 17 degr s Certaines villes Sao Paulo et New York affichent plus de bonne humeur que d autres Berlin et Moscou o les auteurs de selfies sont plus g s L tude ne va pas jusqu mesurer la teinte et la saturation pour en inf rer des conclusions sur la culture de l exposition en ligne chez les jeunes Comment appliquer l analytique culturelle la recherche en sciences politiques On peut citer en exemple une tude qui portait sur des clich s pris lors de
25. e plus en plus impliqu e dans la surveillance des r seaux sociaux et l coute sociale comptabilisant et transformant en indicateurs l activit des utilisateurs On capture et on analyse les mentions puis on en d duit une signification afin d obtenir une vision op rationnelle pour reprendre les termes d un fournisseur de logiciels Adobe 2014 Dans la plupart des cas la recherche de la signification concerne l impact et la mesure du sentiment Un nom un mot cl une marque ou un autre terme s est il elle propag e S est il elle diffus e au del d un public captif par exemple les followers d un r seau social trouvant ainsi Au del de la critique big data 23 un cho en dehors de cette bulle Cette diffusion a t elle t bienveillante On peut galement mettre en place une veille sur la comp tition entre des noms des mots cl s des marques et autres termes et voir dans quelle mesure une campagne ou un programme trouve davantage d cho parmi les prescripteurs que sa contre campagne ou contre programme Latour 1991 Les m triques metrics sont des normes de mesure leur nomenclature provient des techniques de comptage utilis es notamment en biblioth que et en sciences de l information telles que la bibliom trie et la scientom trie Ils s int ressent au facteur d impact la pertinence et l influence en d autres termes non pas uniquement la force brute mais la force relative et
26. e sur le Web comme l a r v l un cas bien connu la requ te associ e un terme g n rique comme voitures cars produit moins de r sultats que celle plus cibl e de voitures d occasion cars used Sullivan 2010 En effet les donn es num riques natives ne partagent pas n cessairement les m mes propri t s que les good data car le Web de mani re g n rale et les plates formes de r seaux sociaux en particulier sont des m dias instables c est dire ph m res et en perp tuel mouvement Constamment de nouvelles caract ristiques et par cons quent des types de donn es sont ajout es ou rendues obsol tes La question de la fiabilit des m thodes de mesure du Web dans une tude longitudinale pose donc probl me Le bouton J aime de Facebook en est un tr s bon exemple sa date de cr ation remonte 2010 et par cons quent toute mesure ant rieure de l activit de Facebook ne pourra prendre en compte cette caract ristique qui est l une des plus populaires du site De plus de sa cr ation la fin de l ann e 2011 l utilisation du bouton a augment de mani re progressive si bien que les analyses sur cette p riode risquent d entra ner une sous valuation 22 Traces num riques et territoires des donn es underreporting m me en cas de pic d activit Richmond 2011 De la m me mani re les r sultats de recherche sur Google font preuve d une certaine volatilit dans le temps
27. eqoyoeieq uioo 1 GL uio eueqooeJeq 2 92 OT 51 uio sjasseBunpiowkquoriejsta 6 GT uo eureqoxoeJeq eJ0 s 8 GT euieqoxoejeq uio 61 lt 9 91 uroyopeureqoyoejeq sojoud uoo HI 5 91 eueqoyoereq uoo aqninof y 9T tuo euieqoyotieq LT fu Z 81 eureqoyoejeq uio2 eaeds ui T aeudiued pue a0 zuno uiui s3upquey iepiansuy uonepunod coron fa ME DENSS 3uno9 2 2 aded yo 00 40 8002 4e TT 60 8002 JEN IT aerus dew AUrT 09 jenuopisaJd woo soy jiep e 30 nus euieqoyoeJeq aqninof lo euleqoyoejeq siuopms euieqoyoe1eq uioo aoedsKui eueqo yoeJeq uoo eneui 1109 9409 u8Uq I ewegoyseseg wo0 nuana Wov eweqoyoeseg 20 apud Woo 8 109 uo eweqoyoeieg e 9 yoe1eq ui09 088 euieqoyoeJeq ui02 400q929J qsoud corre ge ere e EET e qoxoeJeq uio2 xooqooeJ Kq o2 eujeqoyoeeq UM 8 18 eureqoyoeieq
28. eurs de leurs propres histoires lors des rencontres il s efforce davantage de montrer une approche centralis e concentr e sur le message d livrer Rogers 2005 cr et siuueq uoneysi8e1 1930 910A oct 4 jeu 30N uospieuons iig 124819 YIN quepiseudjojuospieuoL duu 8109 5 eor G E 8 uo soxfiiep ze LT YT soqui DE wor eureqowoeeq apud 62 8 782 l0 euieqoyoejeq 72 Vl 92 PL ulo euueqoyoereq squapngs 62 PL Wwov eweqoyoeseq pz uo eujeqoyoereq 500112 z ST 8 22 GI euleqo Z GT eureqoyoeieq uiooxooqeoej fqsaid 02 GI yoeJeq uo esequje ET GT gr GL suoa 21 GT 791 ST eBuejegfu GT ST woe1eq uoo ajuaiIU T GT uio a ouBuq ST ulo onooyuBuq 721 GT euu
29. incarnent notamment ces ordinateurs portables d autocollants et les Hacking Workshop pourrait tre le tournant num rique l tude et les m thodes de la culture num rique influencent la recherche d s lors qu elle utilise les donn es en ligne les logiciels d analyse et la visualisation infographique Faire la distinction entre le tournant computationnel des big data et le tournant num rique permet de ne pas c der une compr hension monolithique ou unitaire de l volution des besoins en recherche politique et sociale l re du num rique Lovink 2014 Au sein m me du tournant num rique il existe tout un panel d approches qui englobent les humanit s num riques les sciences sociales num riques et celles des m dias num riques qui forment toutes les tudes num riques ou digital studies et dont les engagements et positionnements ontologiques et pist mologiques se distinguent premi re vue nettement les uns des autres Je vais t cher ici de 18 Traces num riques et territoires contextualiser et d examiner certaines pratiques de la recherche num rique observ es en humanit s num riques analytique culturelle et culturomique en sciences sociales cyberm trie et mesures alternatives d impact ou a Zzerrics et dans des tudes crois es m thodes num riques et de montrer travers quelques exemples en quoi elles peuvent contribuer la recherche en sciences politiques et sociales
30. iper 2013 Franco Moretti qui a th oris la lecture distance a montr que la lecture de pr s produit un canon qui a pour cons quence de limiter la port e de ce qui est lu et encourage l inverse apprendre ne pas lire Moretti 2005 En utilisant ces techniques il serait possible de soumettre l analyse une plus grande production et non plus seulement des ceuvres canoniques Dans le domaine des big data l infrastructure computationnelle et les moyens de la pr server deviennent des obstacles la saisie scientifique On pourrait d une certaine mani re comparer l investissement fournir celui d un grand moteur de recherche ou d une chaine d information Il faut pouvoir faire preuve d quipes d di es de techniciens chercheurs et de programmeurs scientifiques capables d entreprendre une telle t che ce qui implique une expertise dans le traitement de donn es et une certaine habilet dans l utilisation de logiciels d analyse et de leurs nombreux param tres En d autres mots il n est plus possible d exploiter des ensembles de donn es au moyen d un tableur ou la main Ceci a des cons quences directes sur les syst mes r putationnels appliqu s au domaine scientifique En basculant vers des infrastructures d envergure avec leurs quipes d analystes et de techniciens l cart entre supra science et petite science se creuse nouveau au sein cette fois ci des sciences humaines et des scie
31. les recherches est 14 Traces num riques et territoires susceptible de ne ressentir aucun sympt me Parmi les principales critiques adress es aux big data est le fait que l on peut tr s bien voir un mod le l o il n en existe pas ce que boyd et Crawford dans leur contribution au d bat d signent par apoph nie boyd et Crawford 2012 BIG DATA POINTS DE VUE CRITIQUES L av nement des g data est cens avoir entra n une rupture notamment cause du remplacement de l interpr tation par la recherche de mod les Savage et Burrows 2007 Watts 2007 Lazer e 2009 Cela signifie que dans une d marche type de recherche le pr l vement d un chantillon en sciences sociales ou l identification d une collection en sciences humaines serait remplac par une collecte de donn es par quadrillage syst matique dont la finalit n est pas simplement la constitution exhaustive d un mais plut t de plusieurs ensembles de donn es de grande taille et collect s selon plusieurs m thodes notamment la capture en temps r el L apprentissage automatique et l analyse des r seaux formeraient les points de d part de telles d marches analytiques On pratiquerait en effet l analyse non pas par une lecture de pr s mais par une lecture distance ou topologique qui l verait en points de mire des r sultats la cooccurrence de mots les tendances du moment les prescripteurs ainsi que l anomalie et le hors norme P
32. nces sociales Price 1963 Avec l av nement du tournant computationnel et de sa vision orient e vers les supra sciences la valeur d une tude se mesure travers le prisme Au del de la critique big data 15 des dispositifs de capture de donn es employ s ainsi que par la taille et la complexit de ces donn es L application d une m thode et d un proc d la combinaison de la force brute de l quipement la finesse des param tres choisis sont ici capitales Les r sultats des analyses produisent par ailleurs des modes de connaissance distance savoir des comp tences particuli res dans la compr hension de clusters graphiques et autres complexit s visuelles On peut comparer ces nouvelles connaissances chez les scientifiques celles que poss dent des gestionnaires de syst mes d exploitation comme les contr leurs a riens ou les analystes d images satellites Rochlin 1997 Parks 2005 En collectant en continu des donn es en temps r el faire de la recherche reviendrait observer une sorte de veille m diatique l aide d un dispositif de capture en back end mais aussi d un tableau de bord en front end L interface de tableau de bord partir duquel on peut g rer la fois la r ception des donn es et les r sultats d analyses offre de nombreux modes de visualisations par exemple les graphiques cartes et arbres de Moretti mais galement des cartes g ographiques qui pourraient nous re
33. nseigner sur les points de densit de l attention La courbe d apprentissage pourrait alors inclure des informations comme les dimensions des tuiles et les noms des fournisseurs de tuiles qui produisent les carr s utilis s pour la composition de la carte Lorsque l on s int resse aux big data certaines questions connexes peuvent se r v ler tr s importantes En tout premier lieu on ne peut ignorer le vaste d bat sur la pertinence ou non d analyser les donn es personnelles l aide des big data sachant qu on a peu de chance d obtenir une autorisation d utilisation des donn es et qu il est tout fait d licat de se substituer cette autorisation en s appuyant sur les conditions d utilisation de l entreprise Si un cas d thique est jug acceptable il faut alors mettre en place des strat gies qui tout en n exigeant pas d autorisation ne soient pas pr judiciables La solution de l anonymat ne convient pas forc ment cela tient en partie la situation laquelle furent confront s les chercheurs en donn es d AOL lorsque des journalistes et des d fenseurs du droit la vie priv e ont pu identifier certains utilisateurs du moteur de recherche apr s que leurs recherches des six derniers mois ont t rendues publiques Sweeney 2000 Hansell 2006 On peut galement citer la technique du ou de dissimulation plus commun ment appel e pseudonymisation par laquelle des identifiants artificiels sont ins r s la pla
34. onmental Justice http www ejolt org 2013 06 turkeys tree revolution part 2 everyday im chapulling Venturini 2012 Venturini T 2012 Building on Faults How to Represent Controversies with Digital Methods Public Understanding of Science 21 796 812 Watts 2007 Watts D J 2007 A Twenty first Century Science Narure 445 489 Table des mati res INTROBUC TION d vetus chro iode aer ae lt a ee dui 7 Marta Severo Alberto Romele PARTIE 1 LA TRACE LES M THODES ET LES DONN ES 11 AU DEL DE LA CRITIQUE BIG DATA 13 Richard Rogers LES M THODES D INTERFACE 1 1 1 1 1 n nnn nnn nnn nans nane na esa esas esas edis 33 Noortje Marres Carolin Gerlitz SOFT DATA quU 6l Marta Severo Alberto Romele L IDENTIT COMME BASE DE ener enne en nennen 87 Jos de Mul PARTIE 2 RENCONTRE ENTRE TRACES NUM RIQUES T TERRITOIRES VER ED hid atia ERRER 109 L CUME NUM RIQUE DES TERRITOIRES serres 111 Dominique Boullier SPATIAEIT S ALGORITHMIQUES noce rele eoo n tree pe ERE tes UE Fla Bret 133 Boris Beaude L BYPBRVIEDE ee ita camere a hn Heredes 161 Franck Cormerais DSRS DE DATA 2122 177 Maryse Carmes Jean Max Noyer 268 Traces num riques et territoires PARTIE 3 LES PRATIQ
35. orra E et Rogers R 2013 De Uitzondering de Regel Over Ambtenaren in de Openbaarheid Hague Ministry of Internal Affairs Emma Communicatie Berry 2011 Berry D M 2011 The Computational Turn Thinking About the Digital Humanities Culture Machine 12 1 22 Blood 2002 Blood R 2002 Introduction Rodzvilla d Weve Got Blog How Weblogs Are Changing Our Culture Cambridge MA Perseus ix xiii Bollena ef al 2011 Bollena J Maoa H et Zengb Z 2011 Twitter mood predicts the stock matket Journal of Computational Science 2 1 1 8 Au del de la critique big data 31 Borgman 2009 Borgman C 2009 The Digital Future is Now A Call to Action for the Humanities Digital Humanities Quarterly 3 4 http digitalhumanities org dhq vol 3 4 000077 000077 html Borra et Weber 2012 Borra E et Weber 1 2012 Political Insights Exploring Partisanship in Web Search Queries First Monday 17 http irstmonday org ojs index php fm article view 4070 3272 boyd et Crawford 2012 boyd D et Crawford K 2012 Critical Questions for Big data Provocations for a Cultural Technological and Scholarly Phenomenon Information Communication amp Society 15 662 679 CPID 2015 Columbia Prediction of Infectious Disease CPID 2015 Infermational Research Institute for Climate and Society New York Columbia University http cpid iri columbia edu
36. premi res versions du dispositif Google Insights qui montrait les statistiques associ es des recherches d utilisateurs par mots cl s sur les moteurs de recherche Ces recherches peuvent rev tir une nature politique et certaines peuvent diriger les utilisateurs vers des sites se situant plut t gauche ou plut t droite Ainsi dans la course aux lections pr sidentielles am ricaines en 2012 ceux qui rentraient le terme obamacare taient orient s en majorit vers des sites identifi s droite alors qu une recherche contenant les mots cl s obama student loan forgiveness obama emprunt tudiant dispense vous amenait vers des sites identifi s gauche voir Figure 3 Borra et Weber 2012 La recherche sur Internet comme sujet de recherche ce qui est une facon de d crire la culturomique ou l analyse 26 Traces num riques et territoires des termes de recherche peut galement comprendre la g olocalisation des utilisateurs et donc mener un travail sur l utilisation des mots selon la localisation de leurs utilisateurs Sur le m me mode que ce qui a t fait pour l valuation et la localisation de la grippe sur Google Flu Trends on pourrait tr s bien g olocaliser les discours de haine partir d une recherche de termes linguistiques pr cis et ainsi observer de mani re longitudinale ses constantes ou ses fluctuations politicalinsights eor Search Top political queries grouped by
37. quanti qui utilisera les donn es recueillies sur Facebook mentions J aime partages commentaires mentions J aime sur les commentaires afin d tudier l enpagement politique une pr occupation fr quente en sciences politiques mais galement un terme utilis par les analystes sp cialis s en m dias Cette m thode num rique se fonde sur un mode op ratoire appel analyse des contenus en r seau networked content analysis qui associe le comptage l interpr tation du contenu le plus sollicit au sein d un r seau d utilisateurs Disons le d embl e les m thodes num riques fonctionnent que ce soit pour l analyse des contenus en r seau ou d autres protocoles de recherche et on voit de plus en plus se d velopper un nouveau format de recherche appel data sprint Les data sprints qui partagent quelques similarit s avec les hackathons les barcamps et autres formes exp rimentales de workshops reposant sur le partage Au del de la critique big data 21 de comp tences op rent sur un format court en concentrant l ex cution pratique du travail de recherche sur une dur e courte par exemple une semaine Des quipes compos es d experts en la mati re analystes programmeurs et designers d information travaillent ensemble la production d un projet d tudes sous la forme d un court rapport et d une s rie de graphiques Il arrive souvent que plusieurs projets soient conduits en parall le et chacun des projet
38. qui d clenche le questionnement scientifique et la recherche qui en d coule et non une question soci tale en soi Souvent lorsque les big data sont impliqu es on se tourne vers les grandes compagnies de m dias et de communications pour r cup rer des groupes de donn es donn es qui r orientent ensuite vers d autres int r ts bien pr cis par exemple l utilisation des donn es mises disposition par les compagnies de t l phone mobile pour retracer les diff rents types de trajets emprunt s quotidiennement Une autre mani re de s assurer un acc s facile des donn es exploitables est de s asseoir litt ralement l un des postes de travail d un laboratoire d une grande compagnie en tant qu invit ou collaborateur chercheur On peut alors mener la recherche sur place mais il est impossible de quitter le b timent avec les donn es ou de les sauvegarder sur un serveur distance Ainsi les modalit s d acc s aux big data deviennent elles m mes sujets d tudes y compris pour celles qui b n ficient d un acc s public comme les archives Web des biblioth ques nationales et bient t l archive Twitter du Congr s am ricain Sur un mode comparable au laboratoire d une grande compagnie le chercheur doit souvent se trouver au sein m me de la biblioth que pour pouvoir acc der aux donn es qu il ne peut emprunter comme il le ferait avec des livres La diff rence entre nouveaux m dias et m dias traditionnels est ici flagr
39. s est pr sent tous les autres groupes la fin de cette semaine de sprint C est une forme de science rapide ou fast science qui n est ni de la supra science ni de la petite science mais qui fait partie des pratiques apparues avec le tournant num rique DONN ES NUM RISEES ET DONN ES NUM RIQUES NATIVES Lorsque l on entreprend de cr er un corpus de documents num ris s on peut appliquer les m mes principes que ceux utilis s pour la constitution de bonnes donn es ou donn es fiables good data savoir la num risation de donn es propres et enti res couvrant toute la dur e de vie de leur production Borgman 2009 Dans le domaine des humanit s num riques la collection compl te des ceuvres connues d un artiste ou celle de toutes les couvertures d un magazine prescripteur tels que le Time Magazine repr sentent des donn es fiables et font l objet d tudes en analytique culturelle comme je le montrerai plus loin Dans le domaine des sciences sociales les mesures m diatiques telles que les taux d audience mesur s par Nielsen et les tirages des journaux estim s par le BPA Business Publications ont recours d autres principes de fiabilit des donn es comme l chantillonnage d une population donn e Toutefois on observe que le Web ne dispose pas d une telle instance de comptabilisation Graves et Kelly 2010 Prenons Google et le nombre de r sultats estim s lors d une recherch
40. s l avons d j mentionn pour certains le terme m thodes num riques couvre l ensemble des technologies du tournant num rique que nous avons d crites plus haut ou des techniques de recherche consid r es de plus en plus comme classiques Venturini 2010 Plus pr cis ment le terme fait r f rence l adaptation inimaginable dans un autre contexte de dispositifs et plates formes r serv s au Web par exemple le moteur de recherche Google Facebook et Wikip dia la recherche en sciences politiques et sociales Parmi ces outils figure le d veloppement du Lippmannian Device un Google Scraper qui d tecte les pr f rences ou les penchants d un acteur en se fondant sur le type Au del de la critique big data 29 de mot cl mentionn voir Figure 6 On peut alors en parcourant plusieurs sites Web sur les changements climatiques effectuer une recherche par nom de climato sceptiques et ainsi trouver des acteurs qui soient acquis la cause sans oublier les sites de veille qui les suivent ou les mentionnent Dans ce cas on a pr f r r orienter Google en v ritable module destin la recherche plut t que de l utiliser plus traditionnellement en appareil concu pour informer des clients Climate Change Sceptics on the Web Frederick Seitz Research Question To what extent are c mate change skeptics present a the climate change spaces on the Web Findings Theve is distance betamen the skecbics aed the
41. t En termes de m thode on pourrait consid rer que les sciences sociales et humanit s num riques num risent la m thode dans le sens elles d placent leurs instruments sur le Web enqu tes sondages etc ou les int grent des logiciels en mesurant et ditant les propri t s formelles des objets d art comme dans le cas du logiciel ImagePlot On pourrait pousser le raisonnement un peu plus loin et envisager la num risation des concepts ou des projets de recherche adaptant ainsi au Web les m thodes de recherche pratiqu es en sciences politiques et sociales pat exemple en tudiant l expression de la sph re publique dans les forums en s attaquant aux espaces r serv s aux commentaires pour y trouver des traces de d bat public ou en tudiant Twitter comme source de l opinion publique Faire la distinction entre des documents num ris s et des documents num riques natifs entre m thode et concept revient imposer des distinctions ontologiques entre ceux qui appartiennent au m dium et ceux qui l ont int gr la suite d une migration Blood 2002 Les blogs que l on consid re comme appartenant au Web sont dans ce cas des num riques natifs tandis qu un livre num ris disponible sur Google Books est un nouvel arrivant num rique soit un document num ris Les pages Web qui ne peuvent tre imprim es mais seulement captur es l cran sont une autre mani re de conceptualiser la distinction entre
42. ture conceptuelle en faveur de la reconnaissance de mod les un mode analytique de l apprentissage automatique des pr f rences en termes de graphiques cartes et arbres et tout ce qui touche la mani re de g rer les donn es de sujets humains Les bzg data divisent aussi en cr ant des structures r putationnelles par l intervention chaque tape de la recherche d une perspicacit ou c cit computationnelle collecter acc der traiter analyset produire et pr senter les donn es Les big data peuvent tre commercialis es De nouveaux march s de donn es se d veloppent ce qui implique qu il faille parfois payer pour mener des recherches sur les donn es Puschmann et Burgess 2013 Pour acc der aux donn es historiques de Twitter fournies par Gnip lui m me d tenu par Twitter on peut souscrire un abonnement ou d poser des demandes ponctuelles sur des collections de tweets ce qui dans les deux cas s pare les bases de donn es riches des bases de donn es pauvres Sifter l interface de Texifter qui propose l acc s des donn es historiques de Twitter offre une estimation du co t de la transaction par exemple fin 2014 une demande portant sur l acc s toutes les donn es historiques des tweets contenant un hashtag encore actif depuis 2007 revenait 20 000 USD DU TOURNANT COMPUTATIONNEL AU TOURNANT NUMERIQUE Une autre mani re plus subtile de caract riser l invasion des ordinateurs qu

Download Pdf Manuals

image

Related Search

Related Contents

Trak-CutTM Circular Saw With Miter  VM-10A - セコニック  Modelo serie 37245  Weider HABR60 User's Manual  DUALHIGH SPEED RS232 ISOLATION TRANSCEIVER  Bedienungsanleitung  Mode d`emploi Leak Controller 2000 Appareil de  Horizon Fitness AFG T6 User's Manual  Rapoo 8900P    

Copyright © All rights reserved.
Failed to retrieve file