La Data Visualisation : histoire et évolution

DATA VISUALISATION | 19 décembre, 2018
La Data Visualisation évolue depuis 10 siècles | Reeport.io

La Data Visualisation, une longue histoire.

A l’origine, c'est une simple limite humaine qui a engendré l’approche de la Data Visualisation : notre cerveau est tout simplement incapable de traiter facilement de grands volumes de données brutes pour en extraire des informations utiles. Peut-être pouvons-nous y parvenir à l’occasion, mais certainement pas à chaque fois, et encore moins de nombreuses fois chaque jour.

La Data Visualisation est un besoin naturel

Nous avons besoin de faciliter la compréhension des données en les représentant sous forme visuelle, et ce besoin ne date bien évidemment pas d’hier.

Prenons l’exemple d’un très vaste volume d’informations que la population a dû assimiler pour en extraire sporadiquement des informations qu’elle jugeait utile : la Bible.

 

Data Visualisation Bible

 

Pour faciliter l’assimilation des informations très éclatées qui s’y trouvent, un support visuel assez singulier a été produit en 1086. Il s’agit de l’Arbre de Jessé qui est une représentation de la généalogie présumée de Jésus de Nazareth et qui synthétise l’ensemble des informations relatives à ses ascendants - informations très clairsemées au fil de l’ouvrage.

On estime que cette aide visuelle constitue le premier exemple significatif de Data Visualisation.

De fait, l’Arbre de Jessé est une représentation visuelle de données spécifiques qui sont noyées dans un volume important de données brutes. Mais surtout cette représentation rend les données lisibles : elle permet d’accéder intuitivement à tout ou à une partie de l’information.

 

Arbre de Jesse Data VisualisationL'Arbre de Jessé

 

La lente maturation de la Data Visualisation

Bien entendu un long processus de maturation a été nécessaire avant d’arriver aux premiers histogrammes, diagrammes circulaires ou encore séries temporelles qui sont, quant à elles, apparues à la fin du XVIIIe siècle grâce aux travaux de l’écossais William Playfair.

En inventant ces représentations graphiques simples – encore utilisées de nos jours - cet économiste et ingénieur a lancé l’approche moderne de la visualisation des données.

 

William Playfair data VisualisationReprésentation graphique de W.Playfair

 

Cependant la Data Visualisation n’est pas qu’une histoire de représentation graphiques de données. Elle est aussi une histoire qui se raconte à l’aide de ces représentations.

La première expression aboutie de cette démarche est une carte de flux qui raconte l’histoire de la campagne de Russie conduite par Napoléon. On la doit à l’ingénieur Charles Joseph Minard qui y représente, au début du XIXe siècle, l’histoire des pertes humaines colossales de la campagne de Russie durant laquelle l’armée napoléonienne est arrivée à Moscou avec moins d'un quart de son effectif de départ.

 

Joseph Minard data VisualisationCarte Figurative de Charles Joseph Minard

 

Peu de temps après, l’infirmière Florence Nightingale a eu l’idée d’utiliser la représentation graphique pour permettre à son lecteur de comparer des faits aux corrélations complexes.

 

Reeport580x100mars2019-1

 

Elle y a présenté, à l’attention de à la Reine Victoria, les principales causes de mortalité des soldats britanniques engagés dans la guerre de Crimée. Son support graphique, daté de 1858, lui a permis de mettre en évidence d’une manière éloquente que les épidémies ont été bien plus dévastatrices sur les effectifs que les blessures subies au combat.

Florence Nightingale a donc utilisé un support graphique de données pour communiquer des informations, certes, mais également pour convaincre, c’est-à-dire orienter la conclusion que l’on en retire.

 

florence Nightingale data VisualisationDigramme par Florence Nightingale

 

Data Visualisation : avènement d’une discipline

Jusqu’au XIXe siècle la Data Visualisation a donc évolué à travers des tentatives isolées, indépendantes, qui ont exploré tant les champs d’application possibles que les approches graphiques envisageables. Autrement dit, la discipline se forgeait un vocabulaire mais il lui manquait encore des règles communes – c’est-à-dire une grammaire.

Cette grammaire a été posée par Jacques Bertin qui a élaboré en 1967 les véritables bases du langage graphique.

Jacques Bertin a défini la sémiologie graphique, c’est à dire les éléments que l’on peut modifier dans une Data Visualisation pour représenter l’information. Identifier et définir clairement ces variables graphiques (couleur, taille, surface) a tout simplement constitué la grammaire qui manquait au langage graphique.

Jacques Bertin Data Visualisation

C’est en appliquant ces règles nouvelles – mais communes – que l’on est parvenu peu à peu à supprimer des éléments graphiques superflus et définir ce qui caractérise une Data Visualisation pertinente. Cette distinction entre bonne et mauvaise Data Visualisation a notamment été formalisée Edward Tufte dans son ouvrage "The Visual Display of Quantitative Information".

Enfin on ne peut pas évoquer les penseurs contemporains de la Data Visualisation sans citer Ben Shneiderman et Stephen Few.

Ben Shneiderman est l'inventeur du Treemap, ou carte proportionnelle. Cette approche Dataviz permet une représentation hiérarchisée des données dans un espace défini. Quant à Stephen Few son ouvrage "Information Dashboard Design" est encore une référence dans la conception des tableaux de bord.

 

TREEMAP Data Visualisation

Exemple de Treemap

 

Data Visualisation : et aujourd’hui alors ?

Tous les exemples de Data Visualisation que nous avons vu ont en commun d’être des supports statiques, c’est-à-dire non-interactifs. Or, aujourd’hui, les avancées de la Data Visualisation se font en parallèle de l’explosion d’un besoin d’interactivité croissant des utilisateurs.

Tout d'abord les utilisateurs attendent de l'interactivité avec le support graphique. Ils veulent pouvoir observer la Dataviz avec différentes vues, donc pouvoir manipuler la Data Visualisation.

Mais les utilisateurs sont également en attente d'interactivité avec la data en elle-même. Ils souhaitent avoir la possibilité de manipuler les données directement dans la Data Visualisation. 

La Data Visualisation est donc un outil d’information et de compréhension appelé a être de plus en plus exploratoire et de plus en plus interactif avec ses utilisateurs. Il est cependant évident que les utilisateurs souhaiteront que cette interactivité soit la plus intuitive possible.

C'est l'une des principales raisons qui poussent aujourd'hui les technologies d’analyse à développer des outils "naturels". Explorer la donnée, oui, mais sans saisir une seule ligne de code, sans utiliser de langage informatique, sans taper de requêtes, sans même utiliser son clavier ... simplement en utilisant sa voix et en exprimant son besoin en langage naturel.

Pour en savoir plus :

 

Banner-V8-1  

 

Écrit par Tomasz Stachorko le 19 December 2018.

A propos de l'auteur

Data Visualisation, KPI, Dashboard, Data Driven... Aucun autre animal n'a été maltraité ou blessé durant la rédaction de mes articles.

Articles que vous pourriez aimer