Dans cet article de blog, l’équipe de Valkuren explique les bases de la data visualisation, comment analyser des données propres à un site web, et comment fonctionne la visualisation de données.

Table des matières

Une définition de la Data Visualisation

Qu’est-ce que la data visualisation / dataviz ?

La data visualisation (ou dataviz) désigne la représentation graphique d’informations et de données.

Par le biais d’éléments visuels tels que des diagrammes, graphiques et cartes, un dashboard de data visualisation offre aux entreprises un moyen intelligible d’analyser et de comprendre les tendances, les saisonnalités, les schémas et les valeurs aberrantes au sein d’un ensemble de données.

Pour le dire autrement : cela consiste à faire de la visualisation de données

Aujourd’hui, la prise de décisions repose de plus en plus sur les données, qui nous parviennent à une vitesse et dans un volume tels que nous ne pouvons pas les comprendre sans un certain niveau d’abstraction, par exemple visuel.

La data visualisation des données (ou dataviz) permet au cerveau humain de les comprendre plus facilement.

Les outils et technologies de data visualisation et en intelligence artificielle sont donc essentiels et offrent une solution efficace pour le traitement et la représentation graphique d’un volume important de données. Lorsque la quantité de données est importante, l’automatisation de la création de représentations visuelles, facilite considérablement le travail et leur lecture.

Cette visualisation des données peut ensuite être utilisée comme guide par les entreprises à des fins diverses :

  • tableaux de bord,
  • rapports annuels,
  • documents de vente et de marketing,
  • rapport d’investissements. 

Que doit contenir un bon outil de data visualisation ?

Lorsque l’on recherche un outil de visualisation de données, il faut toujours s’assurer qu’il remplit certains critères et propose divers éléments. 

Il faut que cet outil vous offre une bonne expérience utilisateur.

Le premier critère est la facilité d’utilisation. Il est important que ces outils soient intuitifs pour l’utilisateur, et disposent de documentation et de tutoriels sur leur utilisation. Les meilleurs outils doivent également permettre de traiter de grandes quantités de données, ainsi que de manipuler plusieurs types de données entrantes arrivant de multiples sources.

De plus ils doivent également proposer un large éventail de différents types de diagrammes, de graphiques et de cartes, ainsi qu’offrir la possibilité d’interagir avec les visualisations et d’appliquer divers filtres pour ajuster les résultats.

Enfin, un bon outil de dataviz doit offrir la possibilité de collaboration aux utilisateurs et la publication de rapports de manière publique.

Les logiciels de Data Visualisation

Compte tenu de ces critères, nous avons établi un top 5 des outils de data visualisation présent aujourd’hui sur le marché.

POWER BI

Fort de sa popularité, Power BI est une suite d’outils de visualisation développé par Microsoft permettant aux entreprises d’agréger et d’analyser des données provenant de plusieurs sources tel que des fichiers Excel, base de données, fichiers CSV, logiciels, ERP et services tiers.

Power BI est une solution de visualisation / dataviz et d’intelligence décisionnelle basé sur le web et permet de partager de façon sécurisée les informations dégagées par le biais de ces analyses sous forme de tableaux de bord ou de rapports.

De plus, Power BI permet une interactivité entre ses tableaux de bords. Par le biais de liens entre les tables de données, l’interaction entre les graphiques est possible et la dataviz plus efficace. 

Avantages : 

  • Facilité de l’intégration de l’infrastructure Microsoft.
  • Prix à la licence.
  • Communauté en croissance.

Inconvénients : 

  • Coûts cachés :  la vente de consulting et formation.
  • Dépendance à une infrastructure Microsoft (non-compatible avec Mac OS X).
  • Manque de flexibilité avec DAX Studio.

Exemple : 

Visualisations des contributions financières des Etats membre de l’OMS pour le combat contre la COVID-19, ainsi que la répartition des fonds par régions/pays. 

TABLEAU

Considéré comme le leader des outils de visualisation, Tableau est intuitif et facile d’utilisation. Grâce à sa fonctionnalité glisser-déposer, aucune programmation n’est nécessaire afin d’analyser ses données et faire de la dataviz.

En se basant sur des connecteurs de données comme OLAP, Hadoop et NoSQL, il est possible d’analyser et joindre des données provenant de sources multiples. A partir de ces données naissent des graphiques, des infographies, des cartes et des visualisations simples et efficaces pour faciliter la compréhension des données chiffrées, sous forme visuelle.

Via cet outil, il est possible de partager les informations en interne dans l’organisation ou en externe avec les partenaires ce qui permet aux acteurs d’être proactifs avec une prise de décision rapide et efficace.

Avantages :

  • Interface drag&drop intuitive.
  • Grande communauté passionnée. 
  • Performance.
  • Roadmap clair.

Inconvénients : 

  • Formation/consulting indispensable pour les analyses les plus complexes. 
  • Solution qui coute cher à mettre en place.

Exemple :

Analyse du marché aéronautique de Boeing. Ce rapport analyse les prévisions de ventes d’avion jusqu’en 2036, ainsi que la contribution régionale à la taille et à la part de la flotte mondiale. 

QLIKVIEW

Pionnier d’une nouvelle génération de logiciel de BI, qui repose principalement sur la recherche associative (Associative Difference). Pour faciliter cette recherche associative instantanée et l’analyse en temps réel, cette technologie est fondée sur une architecture in-memory, c’est-à-dire que le logiciel charge toutes les données en mémoire.

Grâce à sa technologie “Associative Difference”, QlikView permet d’effectuer des requêtes sans avoir besoin de recourir à des structures et hiérarchies complexes contrairement à la plupart des outils concurrents. 

Il s’agit d’une solution BI complète. Elle évite notamment aux développeurs d’avoir à utiliser plusieurs outils BI séparés pour leurs tableaux de bord, leurs analyses et leurs rapports.

Avantages : 

  • Chargement des données rapide.
  • Possibilité de publier un rapport sur le web.
  • Bonne capacité de stockage des données.

Inconvénients : 

  • Soutien d’un programmeur nécessaire pour la création de graphiques.
  • Très cher à l’utilisation.
  • Difficulté d’usage et technicité.

Exemple :

Un exemple de rapport d’analyse de ventes, avec une vue sur la quantité vendue par type de produits et la moyenne de ventes par jours. 

GOOGLE DATA STUDIO

Appelé aussi GDS 360, Google Data Studio est un outil gratuit de reporting et de data visualisation développé par Google.

Data Studio permet de regrouper sur un Dashboard des données provenant de sources diverses tel que Google Analytics, Google BigQuery, Google AdWords, YouTube Analytics, MySQL, mais également à partir de plates-formes partenaires telle que Facebook et Twitter.

Avec toutes ses fonctionnalités intégrées, Google Data Studio permet l’exploitation et la création de Dashboard personnalisés.

Les développeurs, les cadres et les membres des équipes internationales de différents services peuvent comparer, filtrer et organiser à la volée les données précises dont ils ont besoin, dans un rapport unique.

Avantages : 

  • Partage d’un rapport instantanément avec un simple URL.
  • Connectivité avec les produits Google.

Inconvénients : 

  • La connexion MySQL non sécurisée  
  • Une propriété des données trop floue (à éviter si vous manipulez des informations confidentielles ou sensibles) 
  • Des connecteurs natifs limités 
  • Pas adapté aux cas d’usage complexes de reporting et de BI

Exemple :

Sciensano utilise Google Data Studio pour communiquer les chiffres relatifs à la campagne de vaccination Belge contre la COVID-19, ainsi que les chiffres relatifs aux hospitalisations journalières et nouveaux cas en Belgique. 

AMAZON QUICKSIGHT

Amazon QuickSight est un service Amazon Web Services (AWS) permettant de créer des designs de data visualisation et analyser des données clients. Le service BI utilise le moteur de calcul SPICE (Super-fast, Parallel, In-memory Calculation Engine, moteur de calcul en mémoire parallèle super rapide) d’AWS pour effectuer des calculs de données et créer des graphiques rapidement.

Il permet d’obtenir des informations à partir de données, rapidement, n’importe où et sur n’importe quel appareil ou objets.

Il est possible de charger des fichiers CSV et Excel, de connecter des applications SaaS comme Salesforce, d’accéder à des bases de données sur site comme SQL Server, MySQL et PostgreSQL, et aussi les sources de données AWS telles qu’Amazon Redshift, Amazon RDS, Amazon Aurora, Amazon Athena et Amazon S3. 

Avantages :

  • Outil sans serveur, utilité rapide pour les tableaux de bord.
  • Intégration facile dans d’autres services AWS.
  • Une des solutions BI les plus rentables disponibles.

Inconvénients : 

  • Options limitées pour les graphiques.
  • Manque de nombreuses fonctionnalités de personnalisation.

Exemple :

Un exemple de rapport sur les profits dans le secteur hospitalier aux Etats-Unis. Les chiffres sont entre-autre visualisés par Etat et type de service hospitalier. 

Conseils pour la Data Visualisation

Avoir un impact fort grâce à son contenu visuel, c’est ce que tout Analyste ou Data Analyste souhaite transmettre en réalisant le design de son dashboard. Il est crucial de pouvoir avoir une bonne data visualisation pour faire passer le message à son interlocuteur et créer une relation.

En effet, notre cerveau réussit à traiter les images beaucoup plus rapidement qu’une quantité de nombres bruts ou de textes. Il est donc essentiel de faire les bons choix, avec discipline.

Nous vous présentons ici quelques exemples qui vont de manière simple vous aider à faire passer votre message avec plus d’impact.

Utiliser une cartographie

L’exemple ci-dessous nous montre comment il est facile pour notre cerveau de visualiser le pays ayant eu le plus de visite sur les 4 dernières années et de voir où il y a une augmentation sur la carte alors qu’identifier le résultat à partir du tableau reste une tache plus complexe pour notre cerveau.

data visualisation cartographie

Clarifier le message

Donnez de la clarté au message que vous souhaitez transmettre : 

  • Supprimez toutes les fioritures de vos graphiques 
  • Ne gardez que l’essentiel compréhensible en un instant
  • Vos axes numériques doivent toujours commencer à 0
  • Utilisez des couleurs bien distinctes pour mettre en avant ce que vous souhaitez 

data visualisation clarté

Choisir le bon graphique

Choisissez le bon type de graphique :  

  • Par exemple le pie-chart n’est pas le bon type de graphique pour représenter les évolutions
  • Évitez la visualisation 3D ou la perspective : l’œil humain peut être trompé sur la taille réelle des segments
  • Identification de la légende : attentions aux couleurs utilisées pour chaque catégorie. Privilégiez des couleurs d’une même palette ou même couleur de différentes intensités

Retrouvez un arbre de décision simple d’utilisation pour choisir le meilleur graphique ici.

data visualisation graphique

Faciliter la compréhension

Le graphique doit s’adapter au besoin pour fournir une aide à la compréhension : l’exemple ci-dessous nous montre une évolution par année et par catégorie. 

  • Dans le cas où l’objectif est d’analyser l’évolution des ventes par année, le bar plot est tout à fait recommandé.
  • Mais dans le cas où il est important d’identifier la catégorie la plus vendue à travers les différentes années, le bar plot devient alors illisible. Il doit alors être transformé en courbe afin que notre cerveau puisse identifier la comparaison plus facilement et rapidement.
  • Limiter le nombre de catégories à visualiser sur un graphique : privilégier les top N dans les catégories trop nombreuses.

Transmettre une information juste

Attention aux faux messages transmis. En effet, si vous utilisez une courbe cumulative pour montrer qu’au cours des années votre chiffre d’affaires s’est envolé, il est facile de transmettre un message erroné à votre auditoire. 

En effet, si l’on rajoute, comme sur le graphique ci-dessous, les valeurs annuelles non cumulées, il est alors clair que depuis 2018, il y a un ralentissement des ventes non négligeable.

Restez factuel dans le message à transmettre. Il ne sert à rien de vouloir enjoliver votre histoire car il suffira d’un œil éclairé dans l’auditoire pour vous reprendre dans votre message.

data visualisation info correcte

Conclusion

En conclusion, nous pouvons dire que la Data Visualisation est un outil puissant quand on s’intéresse au big data. La data visualisation (ou dataviz) est une activité à laquelle il faut consacrer du temps lors de la restitution d’une analyse ou de la mise en place de Dashboard. C’est la partie visible de votre travail d’analyste et de la business intelligence, ne la négligez pas. Il est de votre responsabilité de vous adapter à votre public.

Une bonne data visualisation (dataviz) reste celle qui est immédiatement perceptible par notre cerveau et compréhensible en un coup d’œil.

Dites-vous que si vous devez réfléchir trop longtemps pour comprendre l’objectif d’un graphique, celui-ci doit alors être revu et amélioré. Cela doit rester le plus simple visuellement.

N’hésitez pas à visiter le site des pires data visualisations afin de les éviter à votre tour. 

De plus, si vous avez besoin d’accompagnement en data visualisation / dataviz, et si nous pouvons donner un conseil, n’hésitez pas à contacter les experts de Valkuren.