Big Data, Small Data, Open Data, Internet of Things, les données régissent et conditionnent notre quotidien. Selon Marie-Laure Schaff, statisticienne pour Base Plus, en 2015 nous comptons 15 milliards d’appareils connectés alors qu’en 2020 nous en enregistrerons 50 milliards. Évidemment les données sont démultipliées du fait du nombre de device grandissant. Elles sont donc enregistrées en permanence, partout : objets connectés, smartphones, CRM, etc. Aujourd’hui on entend beaucoup parler de « datavisualisation » ; comment les acteurs du transport peuvent-ils en tirer profit ?
Qu’est-ce que la datavisualisation et comment a-t-elle évoluée ?
La datavisualisation est, comme son nom l’indique, la visualisation de données. Il s’agit en fait de représenter de façon graphique et visuelle une série de données pour transmettre un message clé. Plus la représentation est simple et visuelle, plus le message est clair et pertinent. Comme le disait Confucius, « une image vaut mille mots » ! Et en effet, il est reconnu que le cerveau est capable de traiter une image 60 000 fois plus vite qu’un texte. À partir de là, on comprend évidemment l’intérêt de la « dataviz ».
Mais ce phénomène est loin d’être nouveau. La représentation de données synthétisées sous forme visuelle a toujours existé : graphiques, cartes et plan de métro par exemple, sont des moyens de faire passer visuellement une information. Cependant elle a évolué car les données stockées sont de plus en plus volumineuses, rapides et variées, et la mobilité et l’itinérance des données sont devenues une absolue nécessité. Naturellement les analyses de données deviennent de plus en plus complexes et ont poussé les outils de restitution graphique à s’adapter. La datavisualisation a donc toujours existé, mais elle prend aujourd’hui une place tout à fait unique. Son enjeu aujourd’hui ? Être immersive ; c’est-à-dire proposer les données en temps réel et personnalisées pour améliorer l’expérience utilisateur.
La datavisualisation, inévitable pour les transports
On l’aura compris, la datavisualisation devient pour l’entreprise un vecteur inévitable de performance économique. En analysant ses données clients de façon pertinente, elle peut utiliser la datavisualisation comme un outil d’aide à la décision. La SNCF l’a bien compris et s’y lance en mettant à disposition ses données via une API (Application Programming Interface). Cette application, outre le fait de mettre à disposition ses données, permet l’interconnexion entre plateformes pour la lecture et l’écriture de données. Les données peuvent ainsi s’uniformiser en fonction des besoins de chacune des interfaces concernées, tout en restant à jour. Cela facilite et accélère grandement l’analyse des données. Dans un premier temps l’objectif est de mieux comprendre le flux des deux milliards de voyageurs qui transitent chaque année dans les gares et établissent des connexions avec d’autres moyens de transports : bus, taxis, vélos en libre-service… Dans un second temps, le but sera de se doter d’un cluster Hadoop (traitement informatique permettant d’analyser en masse des données) pour suivre et optimiser en temps réel le flux des voyageurs en fonction des retards de trains, incidents et autre. Tout cela fait partie du plan digital de Yves Tyrode, annoncé en février 2015.
Mais la datavisualisation n’a pas d’utilité que pour l’entreprise, elle est aussi destinée au client via une interface utilisateur. Qui n’a pas déjà regardé son trajet sur Google Maps, pour d’une part vérifier le trajet à emprunter mais aussi optimiser son temps ? Vous aurez surement remarqué que Google Maps, en plus de vous indiquer le meilleur parcours à emprunter, vous donne les ralentissements et zones à éviter si vous prenez la voiture. En vélo, il vous indiquera les dénivelés de votre trajet. Il s’agit là de datavisualisation ! Google est assez avancé sur ce sujet car il met à disposition des utilisateurs plusieurs services du même type. Aussi aura-t-on Google Flights qui propose en fonction de la destination voulue, différents trajets en avion, ainsi que leur coût. Les alternatives sont proposées sous forme de carte, il est facile et rapide de voir les trajets éventuellement moins chers en atterrissant dans une autre ville, proche.
Pour les transports en commun, rien de plus simple : Citymapper ! Cette start-up londonienne permet aux utilisateurs via l’application d’optimiser leur trajet grâce à 5 moyens de transports différents : métro, RER, bus, Vélib’ et Uber (pour l’appli de Paris). Ainsi, vous saurez quel transport privilégier en fonction de la durée du trajet, du nombre de calories brûlées et du coût du transport ! Vous choisissez les transports en commun ? L’application vous montrera où monter pour optimiser les changements.
Screenshots de Citymapper
Beaucoup d’avantages, mais aucun frein ?
Oui, la datavisualisation présente de nombreux intérêts. En interne, on s’en sert comme d’une aide à la prise de décision. Il suffit de déterminer quelques indicateurs, les plus parlant et impactant, de les étudier et les présenter visuellement. Cela évite la multiplication des tableaux et des graphiques. La datavisualisation permet souvent d’orienter les décisions. En externe, elle permet de communiquer de façon impactante et de proposer des applications ludiques et intéractives qui améliorent l’expérience utilisateur.
Mais beaucoup de freins compliquent son développement. Par exemple Citymapper tire ses données de 15 sources différentes (Apple, Google, Foursquare, Yelp, Forecast.io, OpenStreetMap, Cyclestreets, le Stif, la RATP, la SNCF, JCDecaux Cyclocity (Vélib’, Cristolib, VélO2), Autolib’, Uber, eCab (Taxis G7)). Les données de chaque entité sont différentes de nature, avec des formes et structures bien variées. Avant de pouvoir exploiter ces données-là, il faut passer par une étape de retraitement en masse des datas. Lorsque l’application fournit de l’information en temps réel, il faut savoir/pouvoir retraiter rapidement les inputs.
Mais outre le fait de traiter la donnée avant de l’exploiter, encore faut-il y avoir accès ! Et c’est ici que se pose un problème d’actualité. Dans le cadre des transports, les applications les plus utilisées du grand public ne sont pas toujours fournies par les gros acteurs du secteur : SNCF et RATP. Google Maps, Moovit et surtout Citymapper ont la préférence des parisiens ! Mais voilà, il est compliqué pour eux de récupérer les données de ceux qui les détiennent. Citymapper a d’ailleurs fait circuler une pétition pour que la RATP communique les données en temps réel, à savoir les prochains départs des bus et métros. Affaire à suivre !