Qu’est-ce que la Data Viz ou visualisation des données ?

qu-est-ce-que-dataviz-visualisation-des-donnees
Image élaborée par Freepik

La visualisation des données, ou Data Viz de son abbréviation anglaise, consiste à traduire des données et des informations dans un support visuel tel qu’une carte ou un graphique, afin de faciliter leur compréhension par l’être humain et lui être utile.  

La Data Viz permet également d’identifier des relations complexes entre les données et de faire émerger des tendances ou des modèles. C’est ainsi que les scientifiques des données utilisent la visualisation par exemple. 

Mais la Data Viz n’est pas réservée qu’aux experts. Comme vous allez le voir, nous pouvons tous utiliser la visualisation des données et en bénéficier pour comprendre et communiquer des informations de plus en plus nombreuses et complexes.

À quoi sert la visualisation des données

Dans un article datant de 2016, la prestigieuse Harvard Business Review proposait un classement de la visualisation de données selon quatre catégories : la génération d’idées, l’illustration d’idées, la découverte visuelle et la visualisation de données standard. Découvrons brièvement chacun de ces types d’utilisation de la Data Viz

Génération d’idéesLa visualisation des données est couramment utilisée lors de séances de brainstorming ou de Design Thinking au début d’un projet, car elle permet de recueillir différents points de vue et de mettre en évidence les préoccupations communes d’un groupe. Eh oui, le collage de post-it sur un mur, c’est aussi le début d’une démarche de Data Viz !

Ilustration d’idées : La Data Viz est aussi utile pour communiquer une idée, une structure ou un processus. Elle est couramment utilisée dans les contextes d’apprentissage, notamment en entreprise, pour faciliter la communication autour d’organigramme, de flux de travail et de tâches spécifiques. C’est notamment le rôle des fameux diagrammes de Gantt et des diagrammes en cascade.

Découverte visuelle : La Data Viz est un outil précieux pour les analystes de données, les scientifiques des données et les autres professionnels du secteur pour identifier des modèles et des tendances dans un ensemble de données. La perception d’un nuage de point et d’une fonction peut ainsi mettre en évidence des résultats atypiques ou des variables aberrantes.  

Visualisation des données standard : Dans les entreprises, les équipes chargées de la performance utilisent généralement des modèles visuels pour contrôler des indicateurs et les représenter sous forme synthétique. Cependant, la visualisation des données standards ne se limite pas aux tableaux de bord de performance. Par exemple, lors de l’exploration de textes, une analyste peut utiliser un nuage de mots pour capturer les concepts clés, les tendances et les relations cachées dans des données non structurées. Elle peut également utiliser une structure graphique pour illustrer les relations entre les entités dans un graphe de connaissances. 

Les exemples de visualisation des données

exemples-de-visualisation des données
Source de l'image : <a href="Image élaborée par ppcexpo.com

Aux premiers temps de l’informatique, la technique de visualisation la plus courante consistait à utiliser une feuille de calcul Excel pour transformer les informations en un tableau, un diagramme à barres ou un diagramme circulaire. Bien que ces méthodes de visualisation soient encore couramment utilisées, des techniques plus complexes sont désormais disponibles, notamment :

  • les infographies
  • les nuages de points
  • les graphiques à puces
  • les cartes thermiques
  • les fever charts
  • les graphiques de séries temporelles

Voici d’autres techniques populaires :

Graphiques linéaires : Il s’agit de l’une des techniques les plus élémentaires et les plus courantes. Les graphiques linéaires montrent comment les variables peuvent évoluer dans le temps.

Graphiques en aires : Cette méthode de visualisation est une variante du graphique linéaire ; elle affiche plusieurs valeurs dans une série chronologique – ou une séquence de données collectées à des moments consécutifs et également espacés dans le temps.

Diagrammes de dispersion :  Cette technique permet de visualiser la relation entre deux variables. Un diagramme de dispersion se présente sous la forme d’un axe des abscisses et d’un axe des ordonnées avec des points représentant chaque donnée.

Cartes arborescentes : Cette méthode permet de présenter des données hiérarchiques dans un format imbriqué. La taille des rectangles utilisés pour chaque catégorie est proportionnelle à son pourcentage dans l’ensemble. 

Pyramides des âges : Cette technique utilise un graphique à barres empilées pour présenter le récit complexe d’une population. Elle est particulièrement utile lorsqu’il s’agit de représenter la distribution d’une population.

Les outils open source de la visualisation des données

L’accès aux outils de visualisation des données n’a jamais été aussi facile. Les bibliothèques open source, telles que D3.js, permettent aux analystes de présenter les données de manière interactive, ce qui leur permet d’intéresser un public plus large aux information disponibles. Voici quelques-unes des bibliothèques de visualisation open source les plus populaires :

POUR LES INITIÉS : 

D3.js : il s’agit d’une bibliothèque JavaScript frontale permettant de produire des visualisations de données dynamiques et interactives dans les navigateurs web. D3.js (le lien se trouve à l’extérieur d’IBM) utilise HTML, CSS et SVG pour créer des représentations visuelles de données qui peuvent être visualisées sur n’importe quel navigateur. Il offre également des fonctions d’interaction et d’animation.

ECharts : Une puissante bibliothèque de graphiques et de visualisation qui permet d’ajouter facilement des graphiques intuitifs, interactifs et hautement personnalisables à des produits, des documents de recherche, des présentations, etc. Echarts (le lien se trouve à l’extérieur d’IBM) est basé sur JavaScript et ZRender, une bibliothèque de canevas légère.

Vega : Vega (lien externe à IBM) se définit comme une « grammaire de la visualisation », qui permet de personnaliser les visualisations à partir de grands ensembles de données accessibles sur le web.

deck.gl : il fait partie de la suite de cadres de visualisation open source d’Uber. deck.gl (le lien se trouve en dehors d’IBM) est un cadre utilisé pour l’analyse exploratoire des données sur les grandes données. Il permet de créer sur le web des visualisations performantes alimentées par le GPU.

POUR LES DÉBUTANTS : 

Tableau public

Flourish studio

Infogram 

Datawrapper

Alors, prêt à se lancer dans la visualisation des données ?

Facebook
Twitter
LinkedIn
Email

Dernières publications

Obrigado por entrar em contato conosco! Em breve entraremos em contato.

Um erro aconteceu

Usamos apenas suas informações pra entrar em contato contigo e nada mais.