Le traitement des données constituent l’une des missions premières des sciences informatiques. De fait, le datajournaliste a bien souvent l’embarras du choix : la plupart des langages de programmation permettent de traiter de larges échantillons de données. A ces outils spécialisés, nécessitant une véritable expertise, s’ajoutent depuis une vingtaine d’années de nombreux outils intermédiaires. Ils couvrent toutes les étapes d’un projet de datajournalisme : recueil des données, traitement, visualisation, publication…
Il est possible de se faire une idée de cette offre technique importante en consultant les jeux de données suivants : les bases de données, les outils de recueil (on parle aussi de scrapping), les outils de traitement et d’analyse, les outils de mise en forme visuelles et les interfaces de publication.
Bases de données
Nom | Création | Licence | Éditeur | Utilisations notables |
---|---|---|---|---|
MySQL | 1995 | Libre | IBM | |
PostGreSQL | 1995 | Libre | Communauté open source | |
Oracle | 1977 | Propriétaire | IBM | |
SQLite | 2000 | Libre | Communauté open source | |
MariaDB | 2009 | Libre | Communauté open source | |
Firebird | 2002 | Libre | Communauté open source |
Recueil et Scrapping
Nom | Création | Type de logiciel | Éditeur | Fonction | Utilisations notables |
---|---|---|---|---|---|
R | 1993 | Code spécifique | Communauté open source | Tout type d’extraction | |
Python | 1991 | Code spécifique | Communauté open source | Tout type d’extraction | |
Ruby | 1995 | Code spécifique | Communauté open source | Tout type d’extraction | |
Scraper Wiki | 2009 | Application Web (à partir de Python) | ScraperWiki | Tout type d’extraction | |
Readability | 2010 | Application Firefox | Readability | Amélioration de la consultation des pages | |
Dowthemall | 2004 | Application Firefox | Federico Parodi & Stefano Verna | Extraction d’image ou de liens | |
Scrapy | 2009 | Bibliothèque Python | ? (sous Licence propriétaire) | Extraction web. | |
Nokogiri | 2008 | Bibliothèque Ruby | Aaron Patterson & co. (Licence propriétaire) | Extraction web. |
Traitement et analyse
Nom | Création | Type de logiciel | Licence | Éditeur | Utilisations notables | Fonction |
---|---|---|---|---|---|---|
Datawrangler | 2011 | Application web | ? | Stanford | Nettoyage des données | |
Google Refine | 2010 | Application web | Libre | Nettoyage des données | ||
Google Fusion Tables | 2009 | Application web | ? | Nettoyage de petits jeux de données | ||
Impure | 2010 | Application web | ? | Bestario | Recueil, traitement et visualisation | |
Tableau Public | ? | Application web | Libre | Tableau Software | La Nacion | Recueil, traitement et visualisation |
Excel | 1985 | Application bureau | Propriétaire | Microsoft | Tout-le-monde… | Traitement simple |
R | 1993 | Code spécifique | Libre | Communauté open source | Pro Publica | Tout type de traitement |
Ruby | 1995 | Code spécifique | Libre | Communauté open source | Gregor Aisch, Chicago Tribune | Tout type de traitement |
Python | 1991 | Code spécifique | Libre | Communauté open source | Gregor Aisch | Tout type de traitement |
SPSS | 1968 | Code spécifique | Propriétaire | IBM | ProPublica, Seattle Times | Tout type de traitement |
Num.Py | 1995 | Bibliothèque Python | Libre | Communauté open source | Chicago Tribune | Tout type de traitement |
NitroPDF | 2005 | Application bureau | Propriétaire | Nitro | La Nacion | Conversion des PDF |
Panda | 2008 | Bibliothèque Python | Libre | Communauté open source | Tout type de traitement |
Visualisations
Nom | Création | Type de logiciel | Éditeur | Type de visualisation | Utilisation |
---|---|---|---|---|---|
VIDI | ? | Application web | Jefferson Institute | Graphiques | |
Many Eyes | 2007 | Application web | IBM | Graphiques | |
Infovis | 2008 | Bibliothèque javascript | Communauté open source | Graphiques animés | |
Gephi | 2008 | Application bureau | Communauté open source | Réseaux sociaux | |
R | 1993 | Code spécifique | Communauté open source | Graphiques | |
Highcharts | 2009 | Application Web | Highcharts solution AS | Graphiques animés | OWNI |
Google Maps | 2004 | Application Web | Cartographie | OWNI, AFP, Rue89… | |
Kartograph | 2011 | Framework Python et Javascript | Gregor Aisch | Cartographie | Journalism++ |
Publication
Nom | Création | Type de logiciel | Éditeur | Utilisation |
---|---|---|---|---|
Google Spreadsheets | 2006 | Application web | Tout-le-monde… | |
Exhibit | 2006 | Bibliothèque javascript | MIT | |
Django | 2005 | Framework (Python) | Adrian Holovaty | Pro Publica |
Ruby on rails | 2004 | Framework (Ruby) | David H. Hansson | Pro Publica |
Junar | 2009 | Framework | Junar | La Nacion |