Archives quotidiennes :

Cartographier le Data Journalism Handbook

cover DJHMouvement émergent, le datajournalisme possède déjà sa vulgate. Le Data Journalism Handbook a vocation a décrire et instituer toute une série de « bonnes pratiques » en recueillant les témoignages et conseils de 71 auteurs.

Pour quiconque s’intéresse au datajournalisme, cette expérience éditoriale a valeur de raccourci. Elle fige un champ social jusqu’alors indistinct autour d’une communauté spécifique (la communauté écrivante). Sans dissiper complètement le flou de la notion datajournalisme, elle en explicite à tout le moins les principales implications.

Le Data Journalism Handbook constitue donc un détour assez commode. Tout-le-monde peut se réclamer du titre de datajournaliste ou de journaliste de données : il n’existe pas encore de brevets de professionnalisation, comparable à la carte de presse, qui permettrait de séparer les « purs » des « impurs ». Toute étude sociologique de ce genre de déclaration d’intention se heurte inévitablement à des incohérences.

Inversement, la participation à l’écriture du livre a valeur d’engagement. Elle signale en soi une acceptation du label « datajournalisme » et une volonté de s’inscrire dans son mouvement de promotion. Étudier la communauté écrivant du Data Journalism Handbook revient à étudier un corpus auto-représentatif : par le simple geste de l’auctorialité et de l’accréditation collective, les auteurs se qualifient comme « exemplaires ». Ils établissent un référent désormais inévitable. On peut le contester, mais on ne saurait l’éviter.

Recueillir des données sur les datajournalistes

Le Data Journalism Handbook nous dit peu de choses sur ses auteurs. Deux sections fournissent des indices assez maigres. L’introduction évoque brièvement le processus de rédaction de l’ouvrage : tout est parti d’un atelier étalé sur deux jours à l’occasion du Mozilla Festival de novembre 2011. Une liste spécifie l’identité de 71 contributeurs et leurs principales affiliations.

Tout ceci ne donne qu’une image imprécise de cette communauté écrivante. Afin d’y remédier, j’ai mis en place une compilation de données biographiques essentiellement recueillies sur des sites personnels, lorsqu’ils existaient ou sur le réseau social professionnel LinkedIn. Pourquoi Linkedin et pas Facebook ? Il y a une part de ruse dans ce choix. Comme toute interface professionnelle, LinkedIn suscite de fortes contraintes techniques (les données sont très cadrées) et sociales (il est toujours possible de mentir à un employeur potentiel, mais cela reste peu probable).

Vu la relative faiblesse de l’échantillon concerné, cela reste un projet de small data : je me suis contenté de reporter les données une à une sans mettre en place un procédé de recueil automatique. Cette appréciation qualitative permet également de combler les éventuels trous et/ou d’opérer certaines déducations (la nationalité n’est pas toujours explicitée sur les fiches LinkedIn mais l’affiliation nationale reste assez aisée à cerner).

Au terme de ce travail de recueil, l’on aboutit au tableau suivant.

Prénom
Nationalité
Statut
Formation
Affiliation(s)
Gregor AischAllemagneDéveloppeurUniversität Magdeburg (Computer Visualistics)Die Zeit, Open Knowledge Foundation
Brigitte AlfterDanemarkJournalisteDanish School of JournalismJournalismfund.eu / Wobbing.eu (co-fondatrice)
Caelainn BarrRoyaume-UniJournalisteCity College JournalismBBC / Financial Times / The Guardian / Al-Jazeera / Citywire
Mariana BerruezoArgentineEntrepreneurUniversitad de Buenos AiresHacks/hackers (Buenos Aires)
Michael BlastlandRoyaume-UniJournaliste / Essayiste?BBC
Mariano BlejmanArgentineDéveloppeurUniversidad Nacional de CuyoHacks/Hackers (Buenos Aires)
John BonesNorvègeJournalisteNorges teknisk-naturvitenskapelige universitet (NTNU)Verdens Gang
Marianne BouchartFrance/Royaume-UniJournalisteESJ Lille / City University LondonBloomberg News
Paul BradshawRoyaume-UniConsultantBirmingham City UniversityDataDrivenJournalism.net, City University London, Brimingham City University
Wendy CarlisleAustralieJournalisteUniversity of New South WalesAustralian Broadcasting Corporation
Sarah CohenUSAUniversitaireUniversity of MinnesotaUniversity of North Carolina Press, Duke University
Alastair DantRoyaume-UniDéveloppeurUniversity of LondonThe Guardian
Helen DarbishireRoyaume-Uni / EspagneMilitant associatifUniversity of Durham (Philosophy of science)Access Info Europe
Chase DavisUSAJournalisteCenter for Investigative reporting
Lisa EvansRoyaume-UniDéveloppeurUniversity of Leeds (Physiotherapy)Open Knowledge Foundation / The Guardian
Duncan GeereSuèdeJournalisteGöteborgs universitetConde Nast / Pocket-lint / Shiny Media / Wired UK
Bella HurrellRoyaume-UniJournalisteThe University of Manchester (American Studies), University of Leeds (Journalism)BBC
John KeefeUSAJournalisteUniversity of Wisconsin-MadisonWNYC
Scott KleinUSAJournalisteClark UniversityThe Nation / Pro Publica / DocumentCloud
Andrew LeimdorferRoyaume-UniJournaliste?BBC
Friedrich LindenbergAllemagneDéveloppeur?Spiegel Online, Open Knowledge Foundation
Mike LinksvayerUSADéveloppeurUniversity of Illinois (Economics)Creative Commons (vice-président), Wikipedia
Mirko LorenzAllemagneUniversitaire / JournalisteUniversität zu Köln (Histoire)Deutsche Welle, Journalism++
Esa MäkinenFinlandeJournaliste?Helsingen Sanomat, OKFN
Pedro MarkunBrésilJournalisteUniversidade do Vale do Rio dos SinosTransparência Hacker, Hacks Hackers
Lorenz MatzatAllemagneJournalisteUniversität BremenZeit / Open Data City
Claire MillerRoyaume-UniJournalisteLambeth CollegeWalesOnline
Oluseun OnigbindeNigériaMilitant associatifUniversity of LondonBudgIT
Djordje PadejskiSerbieJournaliste / UniversitaireStanford UniversityStanford University
Jane ParkUSAProject ManagerUniversity of CaliforniaCreative Commons / Peer2Peer University
Cheryl PhillipsUSAJournalisteGeorgetown University / Seattle UniversityThe Seattle Times
Aron PilhoferUSAJournalisteUniversity of Minnesota-Twin CitiesThe New York Times / Hacks/Hackers / DocumentCloud / Center for Public Integrity
Lulu PinneyRoyaume-UniDesignerUniversity of CambridgeBBC News Online
Paul RaduRoumanieUniversitaire / Journaliste / EntrepreneurStanford UniversityRomanian Center for Investigative Journalism / World Economic Forum / Organised Crime and Corruption Reporting Project
Martin RosenbaumRoyaume-UniJournaliste?BBC News
Amanda RossiBrésilMilitant associatif?Friends of Januária
Martin SarsaleArgentineDéveloppeurCPELHacks/Hackers (Buenos Aires)
Fabriozio ScrolliniRoyaume-UniUniversitaireVictoria University of Wellington / Universidad Católica del UruguayLondon School of Economics and Political Science
Sarah SlobinUSADesignerNew York UniversityNew York Times / Fortune / Wall Street Journal
Sergio SorinArgentineDirecteur des ressources humainesFacultad Latinoamericana de Ciencia SocialesLa Nación / Hacks/Hackers (Buenos Aires)
Brian SudaUSA / IcelandDéveloppeurUniversity of Saint-Louis / University of Edinburgh(optional.is)
Jeremy ThorpUSADéveloppeur / DesignerVancouver Film SchoolThe Office for Creative Research / The New York Times
Andy TowArgentineUniversitaire?Hacks/Hackers (Buenos Aires)
Sascha VenohrAllemagneJournaliste?Die Zeit
Jerry VermanenPays-BasJournalisteLeiden UniversityNU.nl / Sanoma Media Netherlands
Farida VisRoyaume-UniUniversitaireManchester Metropolitan UniversityUniversity of Leicester / Open Data Manchester
Pete WardenUSADéveloppeur / StatisticienUniversity of ManchesterO'Reilly Media / OpenHeatMap / Jetpac
Chrys WuÉtats-UnisJournaliste?Knight News Challenge / Los Angeles Times / New York Times / WNYC
Brian BoyerUSAJournaliste / DéveloppeurUniversity of Illinois (Computer Science), Northwestern University (Journalism)Chicago Tribune
Stephen DoigUSAJournaliste / UniversitaireDarthmouth College (Bachelor of art)Miami Herald / Walter Cronkite School of Journalism
Nicolas Kayser-BrilFranceJournalisteScience po Lille / University of East AngliaOWNI / Journalism ++
Cynthia O'MurchuRoyaume-UniJournaliste?Financial Times, Centre for Investigative Journalism
Angélica Peralta RamosArgentineJournalisteUniversidad de Buenos AiresLa Nacion
Simon RogersRoyaume-UniJournalisteCity UniversityThe Guardian
David AndertonRoyaume-UniManagerUniversity of London (Oriental and African Studies)Financial Times / Apple / European Investment Bank / Flashbay Ltd.
Tim Berners-LeeRoyaume-UniDéveloppeurUniversity of Oxford (physique)Cern, W3C
Tom FriesUSAEntrepreneurUniversity of Virginia / Georgetown University (MBA)Bertelsmann Stiftung / The Arctic Institute
Alex HowardUSAJournalisteCoby CollegeForbes / Huffington Post / O'Reilly Media
Isao MatsunamiJaponJournaliste?Tokyo Shimbun
Philip MeyerUSAUniversitaireKansas State University (technical journalism), University of North Carolina (thesis in political science)Miami Herald / University of North Carolina
Chris TaggartRoyaume-UniEntrepreneur?OpenCorporates
César VianaBrésilUniversitaire?University of Goiás
David BanisarRoyaume-UniMilitant associatif / UniversitaireColumbus School fo LawArticle 19
Heather BrookeÉtats-Unis / Royaume-UniJournalisteUniversity of Washington / University of WarwickJournalist and FOI Campaigner, The Guardian
Rich GordonÉtats-UnisUniversitaireUniversity of Pennsylvania (History)Northwestern University
Francis IrvingRoyaume-UniEntrepreneurOxford University (mathématiques)Scraperwiki
Anthony ReubenRoyaume-UniJournalisteThe Queen's College OxfordBBC News
Jack GillumUSAJournalisteColumbia University (Journalism)USA Today / Arizona Daily Star / Associated Press
Alexandre LéchenetFranceJournalisteParis-VIIIOWNI / Le Monde, Hacks Hackers
Geoff McGheeUSAUniversitaireColumbia Graduate School of JournalismLe Monde / New-York Times / Stanford University
Jonathan StrayUSAJournaliste / EntrepreneurThe University Hong KongColumbia School of Journalism / CNN / Associated Press / The Overview Project
Liliana BounegruPays-Bas / RoumanieUniversitaireMaastricht School of Communication / University of AmsterdamEuropean Journalism Centre
Lucy ChambersRoyaume-UniCommunity ManagerCambridgeOKFN
Jonathan GrayRoyaume-UniUniversitaireCambridge / Open University / University of LondonOKFN
James BallRoyaume-UniJournaliste?Wikileaks / Bureau for Investigative Journalism / The Guardian
Mark Lee HunterUSA / FranceJournaliste / UniversitaireInstitut Français de PresseINSEAD
Luk Van WassenhoveBelgiqueUniversitaire?INSEAD

 

Par rapport à mon premier fichier, j’ai effectué plusieurs uniformisations, notamment en substituant les intitulés de poste les plus spécifiques par des appellations plus génériques. Certains contributeurs privilégient des titulature à la limite du néologisme, ce qui n’autorise pas vraiment les comparaisons et rapprochements : Data Artist, Information Architect, Thinking Designer

Une représentation internationale en trompe-l’œil

Le Datajournalism Handbook insiste sur sa portée universelle. Dans son introduction, l’ouvrage se met en scène comme une impulsion initiale qui s’est répandue dans le monde entier (« spilled over into an international, collaborative effort »). L’affiliation nationale est en grande partie refoulée : ce qui importe c’est la qualité du contributeur (« dozens of data journalism’s leading advocates and best practitioners. »).

Force est pourtant de constater que la géographie des contributeurs n’est pas neutre. La carte ci-dessous, réalisée avec Google Fusion Tables, est assez évocatrice. De larges pans de la planète sont plongés dans le rouge : Afrique, Asie, Europe de l’est, Russie… Comme pour toute activité de pointe, le sous-développement économique reste un facteur déterminant, mais ce n’est pas le seul. Si il explique la sous-représentation de l’Afrique et du Moyen-Orient, il ne justifie pas l’absence du Canada ou de l’extrême-orient.

Pour comprendre les ressorts de cette cartographie, il est nécessaire de revenir sur la nature du projet éditorial. Bien qu’il se présente en partie comme tel, le Data Journalism Handbook n’est pas une création spontanée. Il s’agit de l’émanation directe de deux associations, l’Open Knowledge Foundation et l’European Journalism Center et d’une liste de diffusion, Data-Driven Journalism. La nature de ces institutions a, en quelque sorte, balisé par avance la composition de la communauté écrivante. Elles sont largement ancrées en Europe de l’ouest. Les non-européens viennent surtout s’ajouter par surcroît, à l’exception notable des américains.

L’OFKN a ainsi publié une carte de ses principales émanations locales. Il convient de noter qu’elles ne sont pas toutes au même niveau d’organisation. Il existe une sorte de hiérarchie spontanée allant du chapter (association très structurée) à l’ambassadeur (simple présence) en passant par l’initiative (groupe en voie de structuration). Tous les chapters sont en Europe.

Cette géographie induite n’est pas entièrement décalquée. C’est que la thématique du datajournalisme est plus ou moins porteuse d’un pays à l’autre. Lieu de naissance de la notion et des premières expériences estampillés comme tel, les États-Unis sont bien représentés.

Le processus de rédaction reflète ces dynamiques nationales complexes et parfois aléatoires. La participation significative de l’Argentine découle d’un mail envoyé par la bonne personne au bon moment. Membre de la délégation de Hacks/Hackers à Buenos Aires, Angelica Peralta Ramos se manifeste dès le 6 novembre 2011 pour participer à l’écriture de l’ouvrage. Par elle transiteront la quasi-totalité des collaborateurs argentins.

Géographie réelle et imaginaire

La représentation nationale suggérée par le Data Journalism Handbook reproduit-elle avec une certaine acuité la diffusion du datajournalisme ?

Là n’est peut-être pas l’essentiel. En raison de son statut de vulgate, l’ouvrage modifie fatalement les phénomènes qu’il prétend observé. Il confère une légitimité internationale à des projets et des initiatives relativement marginaux. La géographie imaginaire qu’il dessine contribue fatalement à altérer une hypothétique géographie réelle du datajournalisme.

Vers une vulgate data-visuelle ? Le cas d’Highcharts

Le développement d’outils informatiques simplifiés et mieux adaptés aux besoins spécifiques de la médiation journalistique a joué un rôle crucial dans l’avènement et la légitimation du datajournalisme. Depuis une dizaine d’années, il est possible de gérer des grands jeux de données ou de créer des applications en ligne inventives sans être un programmeur confirmé. Des applications comme Google Fusion Tables ou des langages intuitifs comme JQuery entraînent une certaine démocratisation des compétences. Ces nouveaux supports rendent possible l’avènement de profils ambidextres, situés à mi-chemin entre l’univers professionnel du journalisme et celui de l’informatique. Dans une section du Data Journalism Handbook, Chase Davis évoque l’implication croissante des reporters dans le travail de programmation « ce qui libère les développeurs pour des projets plus difficiles ».

Nom
Création
Type de logiciel
Éditeur
Type de visualisation
Utilisation
VIDI?Application webJefferson InstituteGraphiques
Many Eyes2007Application webIBMGraphiques
Infovis2008Bibliothèque javascriptCommunauté open sourceGraphiques animés
Gephi2008Application bureauCommunauté open sourceRéseaux sociaux
R1993Code spécifiqueCommunauté open sourceGraphiques
Highcharts2009Application WebHighcharts solution ASGraphiques animésOWNI
Google Maps2004Application WebGoogleCartographieOWNI, AFP, Rue89…
Kartograph2011Framework Python et JavascriptGregor AischCartographieJournalism++

Une telle démocratisation a cependant son revers. En proposant du prêt-à-publier, les outils « intermédiaires » suscitent de puissants effets de rection.

Highcharts constitue un bon exemple de cette tendance à l’uniformisation. Il s’agit d’une « bibliothèque » javascript. La métaphore de la bibliothèque est ici à prendre au sens propre. Highcharts propose un jeu de fonctions prédéfinies, qui fonctionnent un peu comme des « livres » : ils forment une totalité achevée à laquelle il suffit de faire référence pour en convoquer le savoir. En témoigne cette élégante présentation interactive, dite bubble :

Elle est générée avec un code très bref :

code Highcharts

Aucune indication supplémentaire n’est nécessaire. C’est que l’essentiel se passe ailleurs : dans des fichiers pré-remplis, beaucoup plus bavards. En voici une illustration évocatrice. Il s’agit d’un extrait du fichier Highcharts.js qui gère les interactions fondamentales de toutes les visualisations Highcharts :

Code Highcharts Java

En somme le data-journaliste qui manipule la visualisation n’a pas grand chose à faire : il insère ses données, fait appel à la mise en forme de la bibliothèque highcharts et le tour est joué… Inversement, la marge laissée à la personnalisation est assez étroite. Il est possible de modifier en profondeur la bibliothèque, mais comprendre de quoi il en ressort demande un investissement temporel déraisonnable. Il est plus confortable de laisser les choses telles qu’elles sont.

Cette incitation à la facilité entraîne une uniformisation sémiotique assez peu surprenante. Les mises en forme de Highcharts se retrouvent telles quelles dans plusieurs articles de datajournalisme. En témoigne le camembert-type :

On le retrouve quasiment inchangé dans une application d’OWNI sur le chômage des jeunes (aujourd’hui disparue : l’archive hébergée sur Wayback Machine en donne une très vague idée…).

Utilisation du camembert Highcharts dans le cadre d'un sondage sur le chômage des jeunes.

Utilisation du camembert Highcharts dans le cadre d’un sondage sur le chômage des jeunes.

Le même phénomène se répète pour Gazette.fr. Cela concerne cette fois le graphique standard :

Il se retrouve, identique, dans une modélisation des salaires dans la fonction publique :

HC Gazette

Les modélisations d’Highcharts sont également utilisées de manière plus furtive. Le Monde.fr propose une sorte de collage datavisuel en accolant un camembert sophistiqué élaboré avec Jit (au centre) et un petit camembert plus basique d’Highcharts (en haut à gauche).

Les 500 membres de la galaxie Ayrault-Hollande (Le Monde.fr)

Il est intéressant de noter que les codes pré-remplis ne diffèrent pas tant que cela des outils classiques de bureautique. Sur le papier, ils autorisent des manipulation très poussées, qu’on ne pourrait jamais réaliser sur Excel. Cependant, l’impératif d’une facilité d’usage et les contraintes médiatiques d’une conception accélérée encouragent clairement le copier-coller. La maîtrise du code ne constitue pas à elle seule une garantie d’originalité et d’indépendance.