Archives pour la catégorie visualiser

Séminaire n°3 : Approches sémiotiques du « journalisme de données »

Le troisième séminaire jourdain s’ouvre là où le second s’était arrêté. Ce dernier était consacré aux processus de construction des données informatiques.

Au terme de ce travail de recueillement et d’explicitation, on dispose d’un ensemble de significations à exposer : corrélations, causalités, similitudes, affinités. Comment les mettre en scène ? Comment les donner à voir sans exiger du public la mise en œuvre de procédures statistiques élaborées ? En recourant à des visualisations (ou « dataviz » pour reprendre une terminologie assez circulante aujourd’hui).

Anne Beyaert-Geslin est professeur en sémiotique à l’université de Bordeaux III et directrice du CeRes (Centre de Recherches sémiotiques de Limoges). Pour ce séminaire dédiée à la visualisation des données, elle est revenue sur un projet ANR auquel elle a participé entre 2008-2010 : Idivis (Images et dispositifs de visualisation scientifique). Indivis interrogeait les modalités de visualisation de données à partir d’une question liminaire simple : qu’est-ce qu’une image scientifique ?

Définir l’image scientifique

L’image scientifique vise à faire connaître ce dont elle est la représentation. À ce titre, elle est prédictive, didactique et dynamique car elle permet aux scientifiques de mettre à l’épreuve la réflexion sur l’agencement de données. L’image est modifiable, déclinable et améliorable. Elle ne prétend pas proposer une représentation définitive et éternellement fixée.

Système solaire représenté par Andreas Cellarius dans Harmonica Macroscomica (1660). Le recours à l’allégorie contribue à rendre l’image plus familière.

L’image scientifique vise un référent qui est hors du visible, soit qu’il se trouve hors de portée soit qu’il est dissimulé par une autre couche ou enveloppe (ainsi en est-il des images de l’intérieur du corps humain). Dès lors s’impose la nécessité d’un visuel traduisant cet aspect « hors du visible ». L’image va créer le référent permettant cette lecture en même temps qu’elle façonne l’objet.

Comme l’objet qu’elle représente n’est pas visible, l’image scientifique est envisagée comme prothèse à deux titres :

  • pragmatique en ce que son enjeu est de dépasser l’obstacle entre exposition/obstruction et accessibilité/inaccessibilité
  • cognitive car il s’agit, pour assurer ce dépassement, de choisir un mode de visualisation qui renvoie à quelque chose de familier, qui compose un raccourci aisé à assimilé.

Bayaert-Geslin souligne que ce nous jugeons réaliste renvoie à une accoutumance à certains systèmes de représentation. Il existe de fait une dynamique de familiarisation et d’inculcation : les images que nous contemplons le plus souvent nous paraissent plus ordinaires et, donc, plus vraisemblable. D’où l’importance de l’iconisation : la stabilisation dans une forme familière assurera en retour la reconnaissance et l’impression de réalisme.

Le choix du modèle de visualisation par l’image s’effectue ainsi à partir de modèles familiers, dans une gamme de modes en usage. La visualisation est un dispositif pragmatique et cognitif qui vise à donner à comprendre.

Donner à voir et à croire

Au critère de familiarité s’ajoute un critère esthétique. Entre deux hypothèses, la préférence va toujours à la plus esthétique, en fonction de deux critères : symétrie et simplicité. Il s’agit, là encore, d’assurer l’effet réaliste, de faire croire, la beauté est envisagée comme force de conviction. La belle symétrie de la structure en double hélice de l’ADN a ainsi beaucoup contribué à sa rapide diffusion.

Un exemple de circulation de l’image scientifique : reproduction de la structure classique de l’ADN avec des briques légo

En effet, il s’agit avec l’image scientifique de construire le donner à lire d’une évidence. Est évident ce qui paraît immédiatement visible et saisissable. Comment se construit cet effet d’évidence ?

  • Par le traitement différent des formes et des couleurs. Si la forme est intrinsèque à l’objet, la couleur, elle, est autonome et va être utilisée pour cela en tant que discriminant signifiant (notamment en cartographie).
  • Par la standardisation du cadrage des photographies scientifiques : les marques de subjectivité sont effacées pour créer un effet d’impersonnalité, considéré comme critère d’appréciation de valeur.
    Choix du point d’ancrage ou à quoi « accrocher » l’image? : lorsque l’échelle humaine n’est pas envisageable, on choisit souvent l’échelon national, autre forme du familier.

Construire des images formelles

Les images formelles cherchent à rendre visibles des objets situés hors du visible. On retrouve un peu cette préoccupation dans le journalisme de donnée : il s’agit là aussi de mettre à jour une signification cachée, voire volontairement dissimulée, au terme d’un travail d’investigation.

Cette injonction devient tout particulièrement prégnante lorsque les quantités de données recueillies sont incommensurables en termes quantitatifs : comment leur rendre une présence sensible?

Si les données sont situées en deçà de l’information, il s’agit de leur construire une présence sensible (correspond au plan de l’expression de la sémiosis). La visualisation passe alors par une opération de réduction sémiotique. Dans son Anthropologie structurale Lévi-Strauss souligne que : « toute représentation passe par une réduction ». Il s’agit d’une conversion vers le sensible : elle suppose la commensurabilité des données pour assurer la compréhension. De même, le journaliste cherche, autant que possible, à ramener son sujet à une dimension humaine, en recourant notamment à la comparaison à des objets ou attitudes du quotidien.

La forme du diagramme est commune à l’imagerie scientifique traditionnelle et à la visualisation de données. Elle intervient comme réponse privilégiée à cette injonction de réduction.

Le diagramme scientifique est ici radicalement distinct de l’image artistique. IL n’admet aucune ambiguïté. Sa signification ne peut pas être indéfiniment distendue, ni servir de point de départ à des réceptions sociales élaborées (le scandale esthétique, par exemple). Pour Peirce, la dimension iconique du diagramme ne vise qu’à résoudre les problèmes cognitifs. Le diagramme est une conception explicative a posteriori, une pré-forme. Comme pour les stéréotypes de l’écriture journalistique, la structure élémentaire étant déjà connue et maîtrisée, on pourra mettre plus aisément l’accent sur le nouveau, sur le fait scientifique informel que l’on cherche à domestiquer.

Cette forme de visualisation possède, en somme, un caractère performatif. Elle est dotée d’une opérativité symbolique qui donne vie à un concept ou une représentation située par-delà la compréhension humaine immédiate.

Conclusion

Anne Beyaert-Geslin revient sur la dimension processuelle : collecte-visualisation – utilisation. Au long du processus de construction de visualisation(s) se pose toujours la question du « à quoi cela va servir ? ». Il ya une protension de l’ensemble vers le projet.

La visualisation s’adresse toujours à un certain public. Elle s’inscrit dans une pratique et dans une politique éditoriale. Il s’agit d’un principe interactif qui dynamise le système. On quitte avec elle la sémiotique du texte pour aller vers une sémiotique des pratiques, en envisageant une chaîne de la processualité, une traçabilité.

Vers une vulgate data-visuelle ? Le cas d’Highcharts

Le développement d’outils informatiques simplifiés et mieux adaptés aux besoins spécifiques de la médiation journalistique a joué un rôle crucial dans l’avènement et la légitimation du datajournalisme. Depuis une dizaine d’années, il est possible de gérer des grands jeux de données ou de créer des applications en ligne inventives sans être un programmeur confirmé. Des applications comme Google Fusion Tables ou des langages intuitifs comme JQuery entraînent une certaine démocratisation des compétences. Ces nouveaux supports rendent possible l’avènement de profils ambidextres, situés à mi-chemin entre l’univers professionnel du journalisme et celui de l’informatique. Dans une section du Data Journalism Handbook, Chase Davis évoque l’implication croissante des reporters dans le travail de programmation « ce qui libère les développeurs pour des projets plus difficiles ».

Nom
Création
Type de logiciel
Éditeur
Type de visualisation
Utilisation
VIDI?Application webJefferson InstituteGraphiques
Many Eyes2007Application webIBMGraphiques
Infovis2008Bibliothèque javascriptCommunauté open sourceGraphiques animés
Gephi2008Application bureauCommunauté open sourceRéseaux sociaux
R1993Code spécifiqueCommunauté open sourceGraphiques
Highcharts2009Application WebHighcharts solution ASGraphiques animésOWNI
Google Maps2004Application WebGoogleCartographieOWNI, AFP, Rue89…
Kartograph2011Framework Python et JavascriptGregor AischCartographieJournalism++

Une telle démocratisation a cependant son revers. En proposant du prêt-à-publier, les outils « intermédiaires » suscitent de puissants effets de rection.

Highcharts constitue un bon exemple de cette tendance à l’uniformisation. Il s’agit d’une « bibliothèque » javascript. La métaphore de la bibliothèque est ici à prendre au sens propre. Highcharts propose un jeu de fonctions prédéfinies, qui fonctionnent un peu comme des « livres » : ils forment une totalité achevée à laquelle il suffit de faire référence pour en convoquer le savoir. En témoigne cette élégante présentation interactive, dite bubble :

Elle est générée avec un code très bref :

code Highcharts

Aucune indication supplémentaire n’est nécessaire. C’est que l’essentiel se passe ailleurs : dans des fichiers pré-remplis, beaucoup plus bavards. En voici une illustration évocatrice. Il s’agit d’un extrait du fichier Highcharts.js qui gère les interactions fondamentales de toutes les visualisations Highcharts :

Code Highcharts Java

En somme le data-journaliste qui manipule la visualisation n’a pas grand chose à faire : il insère ses données, fait appel à la mise en forme de la bibliothèque highcharts et le tour est joué… Inversement, la marge laissée à la personnalisation est assez étroite. Il est possible de modifier en profondeur la bibliothèque, mais comprendre de quoi il en ressort demande un investissement temporel déraisonnable. Il est plus confortable de laisser les choses telles qu’elles sont.

Cette incitation à la facilité entraîne une uniformisation sémiotique assez peu surprenante. Les mises en forme de Highcharts se retrouvent telles quelles dans plusieurs articles de datajournalisme. En témoigne le camembert-type :

On le retrouve quasiment inchangé dans une application d’OWNI sur le chômage des jeunes (aujourd’hui disparue : l’archive hébergée sur Wayback Machine en donne une très vague idée…).

Utilisation du camembert Highcharts dans le cadre d'un sondage sur le chômage des jeunes.

Utilisation du camembert Highcharts dans le cadre d’un sondage sur le chômage des jeunes.

Le même phénomène se répète pour Gazette.fr. Cela concerne cette fois le graphique standard :

Il se retrouve, identique, dans une modélisation des salaires dans la fonction publique :

HC Gazette

Les modélisations d’Highcharts sont également utilisées de manière plus furtive. Le Monde.fr propose une sorte de collage datavisuel en accolant un camembert sophistiqué élaboré avec Jit (au centre) et un petit camembert plus basique d’Highcharts (en haut à gauche).

Les 500 membres de la galaxie Ayrault-Hollande (Le Monde.fr)

Il est intéressant de noter que les codes pré-remplis ne diffèrent pas tant que cela des outils classiques de bureautique. Sur le papier, ils autorisent des manipulation très poussées, qu’on ne pourrait jamais réaliser sur Excel. Cependant, l’impératif d’une facilité d’usage et les contraintes médiatiques d’une conception accélérée encouragent clairement le copier-coller. La maîtrise du code ne constitue pas à elle seule une garantie d’originalité et d’indépendance.