Archives pour la catégorie datajournalisme et démocratie

Les datajournalistes français

Les jeux de données du projet jourdain ont à plusieurs reprises évoqué cette difficulté : il n’existe pas de critère définitif pour identifier un « datajournaliste ».

Cette activité n’est pas forcément plus floue que celle de journaliste au sens large. Néanmoins, depuis près d’un siècle, les journalistes disposent de lieux et de formes de reconnaissances structurés : associations syndicales, cartes de presse, cursus universitaires… Ces instances normalisatrices ne constituent pas tout le journalisme mais elles permettent de circonscrire objectivement une population professionnalisée.

Il n’existe rien de comparable pour le datajournalisme en France. Quelques formations commencent à être dispensées, mais elles ne sont pas sanctifiées par un diplôme spécifique. A fortiori, les quelques datajournalistes revendiqués se sont formés seuls ou en associant plusieurs formations a priori distinctes (parfois un cursus de développeur et un cursus de journaliste).

En l’absence d’intermédiaires institués, les datajournalistes se croisent et échangent leur savoir-faire par le biais d’interfaces plus ou moins formalisées. Ces interfaces peuvent prendre la forme d’une organisation professionnelle, d’une association bénévole, d’une série de conférences ou même d’un manuel collaboratif.

Une distinction souvent employée en sociologie du journalisme permet de classer a minima ces différents lieux de rencontre et d’échanges : la distinction entre structures « locales » et structures « cosmopolite ». Les premières s’apparentent à un projet ou à une entreprise fédérant plusieurs métiers, par-delà les différences de formations. La conception du journal Le Monde nécessite ainsi de nombreux de profils distincts qui sont amenés à cohabiter quotidiennement. Les secondes constituent plutôt des organisations de niveau supérieur, s’attachant à renforcer la cohésion d’un groupe ou d’un sous-groupe professionnel : c’est le cas des syndicats de journalisme.

La dynamique définitionnelle du datajournalisme à la française dépend des interrelations entre ces deux types de structures. Les structures locales permettent d’importer des compétences issues d’autres champ professionnels (notamment auprès des développeurs). Les structures cosmopolite contribueraient éventuellement à stabiliser la doctrine émergente du datajournalisme.

Les structures locales

Tous les grands titres de la presse française relèvent potentiellement de cette catégorie.

Le datajournalisme n’est que l’une des manifestations d’une mutation plus générale : les rapports entre les journalistes et les développeurs sont de plus en plus étroits. La numérisation de l’activité journalistique favorise les collaborations durables et les échanges de savoir-faire. On assiste ainsi à l’émergence de figures hybrides. Des journalistes se forment à des outils de programmation de plus en plus poussés. Des développeurs s’initient aux usages propres à l’écriture de l’actualité.

Ces multiples croisements favorisent des modes de productions journalistiques demeurés jusqu’alors marginaux, à défaut d’être complètement inédits. La BBC commence à faire du « datajournalisme » dès 1999, soit sept ans avant que le terme ne soit formalisé par Adrian Holovaty.

En France, ce renouvellement se matérialise avec l’arrivée de nouveaux acteurs. La vogue des pure player entre 2006 et 2009 (Rue89, Backchich, Streetpress, OWNI…) crée les conditions nécessaires à une véritable symbiose entre les différentes professions impliquées dans la chaîne de production de l’information en ligne. Le datajournalisme n’est ainsi que l’une des multiples tentative de résolution d’un questionnement plus global sur l’avenir de la profession journalistique.

Jusqu’en 2012, l’introduction du datajournalisme a été essentiellement portée par un seul acteur : le site OWNi.

En trois ans, ce nouveau média souhaitant « augmenter » le journalisme parvient à renouveler certains référents professionnels à défaut de définir un modèle économique pérenne. Un taux élevé de turnover garantit la formation d’une trentaine de journalistes dont six portent le titre de datajournaliste. Ce réseau purement local, essaime dans le monde médiatique français et assure la perpétuation de l’esprit d’OWNI. Plusieurs acteurs historiques sont touchés par cette dissémination : Le Monde, Télérama, France 2.

Certains anciens d’OWNI profitent de l’expérience acquise pour participer à la création de nouvelles structures locales. Nicolas Kayser-Bril lance Journalism++ avec l’appoint de plusieurs développeurs, dont un autre ex-OWNI, Pierre Romera. Marie Coussin rejoint une agence d’infographie, AskMedia. Dans les deux cas, le positionnement de l’organisation se situe délibérément aux marges du journalisme. Journalism++ se rapproche du monde associatif. Askmedia se réfère apparemment au modèle des agences de communication ou de consulting.

Le jeu de données ci-dessous répertorie la quasi-totalité des datajournalistes français (en l’absence de toute organisation structurée, des lacunes sont toujours possibles). Sur les 16 profils recensés, 9 sont passés par OWNI.

Nom
Employeur
Membre d’OWNI
Statut
Paul-Antoine ChevalierAskmediaNonStatisticien
Mathilde BoireauAskmediaNonDatajournaliste
Marie CoussinAskmediaOuiDatajournaliste
Julien GoetzIndépendantOuiDatajournaliste
Nicolas PatteIndépendantOuiDatajournaliste
Sylvain LapoixIndépendantOuiDatajournaliste
Jean-Marc ManachIndépendantOuiDatajournaliste
Jean AbbiateciIndépendantnonDatajournaliste
Gurvan KristanadjajaIndépendantNonDatajournaliste
Nicolas Kayser-BrilJournalism ++OuiDatajournaliste
Pierre RomeraJournalism ++OuiDéveloppeur
Alexandre LéchenetLe MondeOuiDatajournaliste
Samuel LaurentLe MondeNonJounaliste multimédia
Rémi VincentRéunion des musées nationauxOuiDatajournaliste
Florent MauvinThe Pixel HuntNonJournaliste multimédia

Une modélisation en réseau des liens professionnels entre ces datajournalistes souligne, encore davantage, le rôle structurant d’OWNI. La notion de lien professionnel renvoie ici au fait d’avoir effectivement collaboré en tant que datajournaliste au sein de la même organisation, au même moment. Ainsi bien que Nicolas Kayser-Bril et Sylvain Lapoix soient tout deux passés par OWNI, aucun lien professionnel n’est représenté ici : Kayser-Bril a en effet quitté l’organisation quelques mois avant l’arrivée de Lapoix.

Il est possible de changer l’orientation du réseau en cliquant sur l’un des datajournalistes. La partie la plus touffue correspond aux liens entre les anciens d’OWNI. Toutes les autres affiliations paraissent subsidiaires par contraste avec ce gros nœud central. Askmedia, Le Monde ou Journalism++ ne figurent que des modélisations périphériques.

Trois datajournalistes se situent complètement hors du réseau. Cet isolement paraît confirmer l’une de nos premières suppositions : en l’absence de tout cursus universitaire dédié le datajournalisme est souvent le produit d’une formation en autodidacte.

Légende

Askmedia

Journalism++

Le Monde

Réunion des musées nationaux

Streetpress

Regards sur le numérique

journaliste indépendant

Les structures cosmopolites

À ce jour, il n’existe aucune structure cosmopolite française expressément dédié au datajournalisme. Ce rôle est, par défaut, dévolu à des organisations internationales, que ce soit directement ou via leur « succursale » française.

Le réseau Hacks/Hackers joue ainsi un rôle de premier plan. Créé l’année dernière, il organise des réunion en moyenne deux à trois fois par trimestre, sur des thèmes spécifiquement datajournalistiques telles que la récupération automatisée des données en ligne (ou scraping) ou la data-visualisation. Journaliste au Monde et ancien d’OWNI, Alexandre Lechenet est l’un des principaux animateur de ce réseau en formation.

Bien que la section parisienne de Hacks/Hackers se focalise sur le datajournalisme, son audience s’étend bien au-delà du petit cercle de datajournalistes ou d’aspirants datajournalistes. Plus de 400 personnes ont fréquenté l’une de ses manifestations et disposent d’un statut de membre au sens large. Parmi elles, on compte beaucoup de professionnels du numériques ou de militants de l’Open Data. Le réseau apparaît ainsi surtout comme un lieu d’initiation aux nouvelles pratiques d’analyse et de mises en formes statistiques.

L’Open Knowledge Foundation est encore plus éloignée des milieux du journalisme. Ce mouvement international créé par un universitaire anglo-allemand à Cambridge en 2004, vise à la « libération » du savoir sous toutes ses formes : scientifique, économique, utilitaire… Le journalisme de données est l’un des enjeux de cette libération. Cette activité porte la promesse d’une vulgarisation et d’une diffusion accrue des ressources issus de l’ouverture des données publiques et institutionnelles, par le biais de formalisations appropriées à un lectorat généraliste.

En 2012, l’Open Knowledge Foundation a coordonné l’édition d’un manuel collaboratif en ligne, le Data Journalism Handbook (pour plus d’information, on peut se référer à notre précédente analyse consacrée à ce manuel). Sa traduction française vient de paraître. Elle ne se contente pas de transcrire l’original en anglais, mais ajoute un contenu spécifique rédigé par des « experts » francophones du datajournalisme.

On retrouve logiquement quelques uns des 15 datajournalistes français identifiés : Kayser-Bril, Marie Coussin, Alexandre Lechenet… Et aussi, quelques intervenants plus occasionnels, tels que Fanny Hardy du Dauphiné Libéré.

Nom
Section
Employeur
Version originelle
Marie CoussinLe VéritomètreAskmediaNon
Yann GuéganCréation d'applis à Rue89Rue89Non
Fanny HardyCrowdsourcing : l'accès à la TNT dans le Sud-est de la FranceLe Dauphiné LibéréNon
Karen BastienLe desing d'informations au service du datajournalismeWeDoDataNon
Regards CitoyensComment Regards citoyens a créé NosDéputés.frRegards CitoyensNon
Jean AbbiateciUne pige de « scraping olympique »IndépendantNon
Nicolas Kayser-BrilCrowdsourcing du prix de l'eauJournalism ++Oui
Alexandre LéchenetAspirer les données d’AmeliLe MondeNon

Le datajournalisme au futur antérieur ?

Cette cartographie rapide du datajournalisme en France met nettement en évidence la tendance dispersive de cette activité. Paradoxalement, le datajournalisme ne parvient à solidifier son modèle économique et à se populariser qu’en s’émancipant du journalisme stricto sensu.

À l’exception d’Alexandre Lechenet, peu de datajournalistes ont fait le choix de s’affilier durablement avec un acteur historique de la presse française. Les emplois ne durent souvent que le temps d’un projet. La participation à la création d’une nouvelle organisation, généralement sise aux marges, voire au-delà, du journalisme apparaît comme une issue plus fréquente. Après la disparition d’OWNI, le maillage des structures locales paraît ainsi trop divers et éclaté pour porter une acception unique du datajournalisme.

Par contraste avec la plupart des « idéologies professionnelles », le datajournalisme diffuse plus facilement ses pratiques et ses usages en dehors de la profession à laquelle il prétend s’adresser. Cette ouverture pourrait s’avérer problématique. À trop se confondre avec les initiatives entrepreneuriales et associatives en faveur de l’accessibilité des données institutionnelles, le datajournalisme risque de perdre sa spécificité définitionnelle pour n’être plus que l’une des implications d’un mouvement social.

Séminaire n°4 : les enjeux démocratiques du datajournalisme

A l’occasion de cette quatrième séance, le séminaire Jourdain a reçu deux intervenants : Benjamin Gans, ingénieur Recherche et Développement et responsable Communication et Marketing chez Data Publica, société spécialisée dans le développement de « jeux de données » et Fabrice Rochelandet, économiste à l’université Paris III Sorbonne Nouvelle dont les travaux portent notamment sur « l’économie des données personnelles ».

L’objectif de cette rencontre consistait à explorer et questionner les enjeux démocratiques soulevés par le « datajournalisme » : quelle représentation du rôle des journalistes en démocratie se dessine derrière la promotion des « données » ? Comment s’exprime, à travers un imaginaire du journalisme, une réflexion sur la représentation politique ?

Les données personnelles en question

Fabrice Rochelandet est intervenu dans un premier temps. Auteur d’un ouvrage intitulé « Économie des données personnelles et de la vie privée », il étudie ce qu’il nomme le « fétichisme de la donnée ».

Il a rappelé que la liberté d’informer est à penser en lien avec la liberté des données personnelles. Il propose d’envisager, dans la longue durée, le travail de la presse (et du numérique) comme travail des données personnelles.

Il a donné pour exemple la peopolisation en soulignant qu’il ne s’agit nullement d’un phénomène récent mais bien plus d’une « vieille question » qui remonte à l’invention de la photographie de presse et qui a pu s’incarner aussi, ensuite, dans la pratique d’investigation consistant à aller chercher des « données » dans les poubelles par exemple.

Poussant plus loin la démarche, il propose d’analyser l’implication des données dans la « peopolisation de la vie ordinaire », les données sont alors envisagées comme « traces laissées derrière soi ». Elles peuvent être mobilisées comme outils dans le cadre d’étude des comportements individuels dans le sens où elles peuvent permettre de comprendre des comportements paradoxaux. Ce qui implique aussi de poser la question de la distinction entre ce qu’on dévoile de soi (données ex-ante) et ce qui est dévoilé par les autres (opérateurs – publicité ciblée) (données ex-post).

Investigation des données personnelles dans le monde par les programmes de surveillance américain (NSA)

Cette démarche met en lumière le rôle des données (et du médiatique) dans la construction des catégories désignant les personnalités comme people / publiques / politiques, dont les frontières sont loin d’être étanches.

Rochelandet pose la question de la construction de l’identité numérique. A son sens, celle-ci a à voir avec un processus de « décloisonnement des espaces sociaux de l’individu », phénomène qui conduit à la perte du monopole de la connaissance de soi et à une « illusion de contrôle ». Il propose, pour qualifier ce phénomène, la notion de « vie privée informationnelle » qui repose aussi la question de la distinction entre secret/privé et des frontières de l’intimité.

Système de récupération des données personnelles par le projet PRISM

Système de récupération des données personnelles par le projet PRISM

Son intervention s’est achevée sur une réflexion autour du flou entourant la définition de ce que sont les « données publiques » avec l’ambivalence du terme public qui peut désigner à la fois ce qui est rendu public comme ce qui est connu de tous car publié. Ainsi, les médias ne cessent d’en redéfinir les frontières.

Un exemple d’intermédiaire : Data Publica

Benjamin Gans est intervenu dans un second temps pour présenter l’agence Data Publica.
L’origine de celle-ci remonte à 2010, elle s’inscrivait alors dans le cadre d’un projet de recherche financé par le Ministère de l’Économie et données publiques en 2010. Il s’agissait de procéder au référencement des données publiques à partir des différents fichiers rendus disponibles par l’administration publique (2500 fichiers alors pour plus de 15 000 aujourd’hui). Elle avait alors pour concurrent direct le site datagouv.fr.

Au départ, l’équipe envisageait l’agence comme un « data-store » dans lequel les éditeurs privés seraient venus piocher. Comme le projet tel quel n’a pas fonctionné, un service de données « sur mesure » a été mis en place. Data Publica est alors partie du postulat que « les sociétés ont besoin de données » mais n’ont pas connaissance de ce qui existe en Open Data.

Le credo de datapublica : les entreprises ont besoin de données

Le credo de datapublica : les entreprises ont besoin de données

Aussi, eux proposent une automatisation de l’extraction pour les éditeurs qui produisent et publient des données (« qui font de l’Open Data sans le savoir »), développent des tableaux de bord à leur attention et mettent en place des outils de visualisation « à partager » (cartes, courbes, histogrammes, tableaux…). Leurs clients sont notamment des cabinets de conseil, il donne l’exemple de la réalisation d’un tableau de bord des zones d’emploi en France ou d’une carte du patrimoine immobilier de l’Etat.

En parallèle leur visée a aussi été, dans un « moment expérimental » de l’agence, de montrer que les données « ont de la valeur » en produisant des articles et en faisant connaître, à travers le travail des datajournalistes, la manière dont la donnée peut être « mise en scène ». Ils se placent ainsi en position de double intermédiaire : entre l’État et le citoyen, entre les journalistes et leurs lecteurs (médiateur de la médiation journalistique).

Une datavisualisation du réseau RATP reprise ensuite par la presse française.

Une datavisualisation du réseau RATP reprise ensuite par la presse française.

Concernant l’exposé de la méthode employée dans une démarche datajournalistique, Benjamin Gans expose qu’il existe des données disponibles, à nettoyer et à manipuler pour « faire sortir l’information ». Il souligne qu’il s’agit d’un « travail d’équipe » (développeur, journaliste, informaticien, statisticien) : « Il est possible d’en faire seul mais souvent les journalistes n’ont pas la maîtrise parfaite des outils. »

A ses yeux, il existe deux cas de figure majeurs impliquant une démarche de ce type : soit un fichier inédit à interpréter, soit la fouille de fichiers très volumineux. Ce qui implique aussi de faire la différence entre « Data » et « Big Data » : cette seconde dénomination désigne des volumes d’information exponentiels et incommensurables, qui ne peuvent être seulement traités par l’humain. A celui-ci revient toutefois de résoudre la question de comment on les gère et comment on les utilise. En effet, il rappelle que « Big Data » est évolutif et pose à ce titre des problèmes de stockage.

Plus largement, il parle du phénomène de l’Open data comme d’une « révolution » pour les données. Avec le basculement de données dans le domaine public, on est face à un gisement à exploiter, qui repose question de la transparence. En écho aux propos de Fabrice Rochelandet, il explique qu’à leur niveau on retrouve la déclinaison privé/public sous la forme business/État.

Les autres tournants identifiés par lui sont notamment OWNI, les productions d’Alexandre Léchenet pour lemonde.fr), et l’entreprise collective de Wikileaks. C’est à ce moment là, dit-il, qu’on redécouvert la possibilité de l’investigation avec les chiffres.

Benjamin Gans a clôturé son intervention en revenant sur le contenu de son activité d’enseignement au CELSA. Il a détaillé ce qu’il apprend aux étudiants et qu’il voit comme des prérequis à toute bonne activité datajournalistique : la manipulation de la donnée via Excel et les outils de visualisation (Google Charts, Many Eyes, Datawraper etc.). Ceux-ci permettent une visualisation très simple et « ça c’est du datajournalisme ». Mais, il ne s’agit pas non plus d’être uniquement dans la visualisation : la contextualisation est nécessaire en plus de la dimension esthétique et du « storytelling par l’image ».

Nom
Création
Type de logiciel
Éditeur
Type de visualisation
Utilisation
VIDI?Application webJefferson InstituteGraphiques
Many Eyes2007Application webIBMGraphiques
Infovis2008Bibliothèque javascriptCommunauté open sourceGraphiques animés
Gephi2008Application bureauCommunauté open sourceRéseaux sociaux
R1993Code spécifiqueCommunauté open sourceGraphiques
Highcharts2009Application WebHighcharts solution ASGraphiques animésOWNI
Google Maps2004Application WebGoogleCartographieOWNI, AFP, Rue89…
Kartograph2011Framework Python et JavascriptGregor AischCartographieJournalism++

Sélection des outils de visualisation par le projet jourdain

Il apprend également aux étudiants à identifier des « sources de données », à acquérir des réflexes en la matière — aller consulter opendataparis en est un exemple, à réfléchir sur nouveaux modes de lecture. Il souligne à ce propos l’aspect plus interactif des productions « data » et tisse un lien entre mobilité et nouvelles lectures, par la dimension tactile des nouveaux supports « on va pouvoir entrer dans la donnée », dans les différentes strates, avec, en prime, un effet ludique.