Des progrès technologiques considérables ont permis à l’industrie automobile de faire un pas de plus vers l’introduction de véhicules autonomes entièrement connectés dans la vie quotidienne des consommateurs. Selon Gartner, 250 millions de véhicules connectés seront en circulation d’ici 2020, tandis qu’une étude publiée par P&S Intelligence estime que le marché mondial des voitures connectées atteindra 156,1 milliards de dollars à l’horizon 2023. Un véhicule qui vous conduit tout seul au travail pendant que vous lisez la presse ou écoutez votre musique préférée présente un énorme potentiel commercial.

Il faudra toutefois attendre encore quelques années avant d’envisager une production de masse de véhicules pleinement autonomes. D’ici là, nous devrons nous contenter de véhicules semi-autonomes. Ces véhicules disposent d’une technologie embarquée, telle que des systèmes avancés d’assistance au conducteur (ADAS), des systèmes d’infodivertissement et des capteurs intelligents, qui fournissent aux prototypes de véhicules connectés modernes leurs fonctions « intelligentes ». Volvo possède sa propre fonction « Pilot Assist » très similaire à l’Autopilot de Tesla et au « Drive Pilot » de Mercedes-Benz. Cadillac propose pour sa part une technologie « Super Cruise », BMW un « Traffic Jam Assistant » et Audi un « Traffic Jam Pilot ». Que ce soit sur route ou sur les pistes d’essai allemandes où les véhicules sont soumis à des tests rigoureux, ces technologies ne sont pas encore entièrement autonomes et ont peu de chances de fonctionner dans certaines conditions telles que : les zones à forte circulation, les limites de vitesse supérieures à 60 km/h ou les différents scénarios de circulation exigeant le transfert d’importants volumes de données entre le système embarqué du véhicule et le système informatique central.

Repenser le stockage des données à bord des véhicules connectés

Cette nouvelle génération de véhicules et leurs fonctions connectées évoluent, ce qui entraîne inévitablement une profusion de données et une surcharge du réseau, avec des opérations informatiques d’une extrême complexité au sein du système embarqué. Aussi un stockage hautes performances de plus grande capacité, optimisé pour le haut niveau d’exigence de l’environnement automobile, est-il nécessaire. Le nombre de véhicules connectés aujourd’hui en circulation est estimé à 21 millions et ils collectent des téraoctets de données. D’après Gartner, un véhicule connecté générera en moyenne plus de 280 Po de données par an d’ici 2020, soit au moins 4 To par jour. Ces données sont produites par le matériel embarqué composé de caméras (20 à 60 Mo/s), de sonars (10 à 100 Ko/s), de radars (10 Ko/s), de systèmes LIDAR (10 à 70 Mo/s) et de GPS (50 Ko/s). Cela représente une grande quantité d’informations à stocker, transférer et sécuriser à travers une multitude de points de terminaison et différents réseaux de distribution.

Nous devons adopter une approche différente pour les données hébergées à bord des véhicules. Les véhicules autonomes sont pilotés, au sens propre comme au sens figuré, par l’intelligence des données. Aujourd’hui plus que jamais, face au volume croissant de données produit par les nouvelles voitures, et lors de la mise au point d’innovations, les entreprises du secteur automobile cherchent à améliorer leurs processus de collecte et de gestion des informations. Concernant les véhicules connectés, les efforts se concentrent globalement sur la conservation de données pertinentes et leur ingestion efficace dans des workflows d’intelligence artificielle, d’analyse et de développement ainsi que dans d’autres applications. Les caractéristiques et exigences de ces environnements varient bien souvent en fonction du type de véhicule. Au cours des prochaines années, différents types de véhicules connectés, avec divers besoins en stockage, verront le jour.

De nouvelles architectures de stockage pour les véhicules autonomes

La flotte de véhicules de développement possédera sa propre architecture de stockage pour gérer les données. Les modèles de milieu de gamme pour particuliers mettront quant à eux l’accent sur des systèmes d’infodivertissement (streaming audio et vidéo) exigeant un type d’architecture totalement différent. Les constructeurs automobiles devront tenir compte d’une multitude de facteurs pour concevoir les systèmes chargés de recevoir et de stocker les données recueillies par les véhicules. Ils devront tout d’abord déterminer comment créer une infrastructure capable d’assurer une transition fluide des données entre les différentes étapes de leur cycle de vie, depuis leur capture initiale dans le véhicule jusqu’à leur rétention à long terme en vue de développements futurs ou bien pour prouver la conformité aux réglementations ou traiter les litiges. Cette infrastructure devra probablement permettre d’accéder à l’ensemble des données de manière active et d’y effectuer des recherches. Outre une durabilité extrême, avec reprise après incident et protection par « air gap », elle devra offrir des outils pour garantir le respect du RGPD ou, selon la région, des lois locales en matière de protection des données.

Dans tous les cas, l’une des approches les plus éprouvées consiste à combiner stockage frontal hautes performances, composé de disques durs ou SSD, et stockage économique reposant sur la bande ou le stockage objets pour une rétention évolutive de volumes massifs de données. Les infrastructures de Cloud public sont également utiles pour les pics d’activité d’analyse, lorsque les besoins en ressources de traitement dépassent les capacités généralement requises ou disponibles sur site. Pour les archives massives de plusieurs pétaoctets, la bande constitue le meilleur média. Plus les volumes de données sont élevés, plus les avantages économiques de la bande sont importants, et ce d’autant plus que les solutions actuelles de sauvegarde sur bande présentent un dispositif frontal de type cache hautes performances, et que la quasi-totalité du traitement est automatisée et gérable à distance. L’aspect le plus important de la conception de l’infrastructure est de faire en sorte que les ressources de stockage et de traitement soient accessibles aux utilisateurs pour leurs workflows spécifiques à toutes les étapes du cycle de vie des données.

Nous avons récemment travaillé avec un développeur primé de composants électroniques de nouvelle génération pour systèmes de sécurité active et véhicules autonomes. Il cherchait un moyen d’éliminer les goulots d’étranglement dus à une explosion du volume de données et à la complexité accrue de son workflow. Nous lui avons recommandé d’utiliser des disques hautes performances et une archive sur bande, avec un point de gestion unique. Imaginez un peu le scénario suivant : les données de recherche d’un constructeur automobile générées lors de récents tests de véhicules dotés d’intelligence artificielle sont ingérées dans des baies de disques hautes performances. Les systèmes HPC de l’équipe d’ingénierie accèdent directement aux données via des connexions SAN Fibre Channel haut débit. Une fois les données stockées sur disque, la solution en effectue automatiquement deux copies dans une archive sur bande. Ces copies font initialement office de sauvegarde et, plus tard, l’une d’elles fera partie d’une archive active. Lorsque les données hébergées sur le système de stockage hautes performances ne sont plus activement utilisées, l’espace disque est récupéré, mais l’une des copies sur bande est conservée dans l’archive où elle reste accessible. La seconde copie des données sur bande a un double objectif : fournir une copie de sécurité hors site à des fins de reprise après incident et de protection contre les ransomwares, tout en permettant aux équipes de conception et d’ingénierie réparties à travers le monde de partager efficacement les données.


L’avenir des données

L’industrie automobile s’oriente à grande vitesse vers l’intelligence artificielle. La technologie requise pour stocker les données liées aux capteurs, à la connectivité, à la cartographie et à la sécurité évolue rapidement, d’où une dépendance de plus en plus forte des véhicules vis-à-vis des données. Les constructeurs automobiles connaissent l’importance des données, en particulier des volumes d’informations nécessaires pour garantir l’expérience utilisateur escomptée. À ceci s’ajoute un écheveau complexe de plates-formes et d’algorithmes qui fonctionnent de concert pour fournir un système unifié et véritablement autonome qui changera à tout jamais la relation du consommateur avec son véhicule.

La grande question qui se posera à l’avenir aux constructeurs automobiles est de savoir quelle approche de stockage adopter pour les données de leurs véhicules. Cette question est d’autant plus intéressante que l’ère de la 5G approche à grands pas. Tout d’abord, les solutions de stockage ont déjà démontré leur capacité à répondre aux besoins des workflows de bout en bout. Il conviendra d’utiliser des solutions de stockage flexibles, permettant d’étendre les performances et la capacité de manière indépendante, et d’augmenter la capacité de stockage secondaire tout en réduisant au minimum l’espace de stockage primaire actif afin de maîtriser les coûts. Les constructeurs automobiles ont tout intérêt à opter pour une solution de stockage multiniveau, le principe étant de transférer les données vers le niveau de stockage le mieux adapté aux besoins en matière d’accès.

Chaque niveau est configuré pour offrir un rapport coûts/performance spécifique en fonction du cas d’utilisation de chaque véhicule, du nombre de capteurs embarqués et des impératifs de rétention des données à bord du véhicule. Une telle approche garantit l’accès aux données, leur traitement et leur gestion selon le niveau de performances requis et au coût le plus bas pour atteindre les résultats souhaités.