Le Big Data, pétrole du 21e siècle

Big-Data-1Le Big Data, pétrole du 21e siècle

Par Farid Gueham

Le 21e siècle est le siècle de la donnée, de la « data ». Ces informations numériques qui circulent toujours plus vite grâce à des algorithmes de plus en plus puissants qui les exploitent, les interprètent. Ces équations donnent du sens à une masse de données peu lisible à l’état brut. S’il fallait trouver un ambassadeur français du big data, le nom de Rand Hindi ne ferait probablement pas débat. Ce jeune ingénieur français a même été récompensé parmi les 35 jeunes innovateurs les plus prometteurs de l’année 2014 par le célèbre MIT. L’ambition de Rand ? Développer des logiciels pour mettre le big data au service des citoyens. Et de la donnée, il n’en manque pas. Jamais le monde n’aura été autant analysé, suivi, décrypté. Nos mails, nos téléphones portables, nos cartes bancaires laissent des traces numériques.

3000 milliards de milliards de données produites en 2013 : c’est ça le big data.
Pour être exploitable, l’information doit suivre plusieurs phases de traitement. Elle est d’abord stockée, puis transite par la data analyse, cette étape qui permet de la trier. de l’ordonner. C’est également cette analyse qui permettra de créer des applications qui se déclinent en différentes catégories, en fonction des usages souhaités : de nouveaux annuaires, des synthèses ou des statistiques. Mais c’est un usage plus poussé qui intéresse Rand Hindi : le data prédictif. Cette
fonction permettrait de créer sur la base de nos comportements passés et présents des projections de comportements futurs : catastrophe naturelle, guerre, famine, pénurie de matière première etc.

Et dans notre vie au quotidien, le big data peut-il nous aider ?
Des applications créées à partir d’une base de données passées peuvent-elles avoir une incidence sur notre vie de tous les jours ? Il semblerait que oui ! La SNCF le pense aussi. Le groupe a ouvert l’accès de toutes ses données jamais rendues publiques auparavant. On y trouve la composition des trains, le nombre d’usagers qui les utilisent, les horaires. L’entreprise organise même un concours, le temps d’un week-end pour mettre en concurrence des développeurs afin d’imaginer l’application la plus utile pour les usagers. Et le grand gagnant de cette compétition n’est autre que Rand Hindi, le jeune architecte d’algorithmes.

Rand Hindi a créé l’application « Tranquilien ».
Cette application permet aux usagers de trouver une place assise dans des wagons de RER ou de métro généralement bondés. En rentrant l’horaire d’un train, il est possible de visualiser la prédiction de son taux de remplissage par wagon. Les wagons les moins bondés sont représentés par des petits points verts, les plus utilisés, par des points oranges ou rouges. « Bon, on me rétorque souvent qu’aux heures de pointe, c’est plein et qu’aux heures creuses, c’est vide » ajoute Rand mais ce qui est subtil, c’est qu’entre deux trains, avec à peine quelques minutes d’écart, on peut voir une différence et cela aide vraiment pour trouver une place assise ». De la data pour apporter plus de confort aux voyageurs. Il fallait y penser. Rand ajoute « c’est une option qui est assez intéressante parce que proposer du confort aux voyageurs, c’était autrefois le luxe des fabricants de voitures. Et de pouvoir dire aujourd’hui qu’un transporteur public puisse aussi faire une promesse de confort, je ne dirai pas que c’est révolutionnaire, mais c’est innovant ».

Pour développer cette application, les équipes de Tranquilien ont travaillé en partenariat avec la SNCF à partir de toutes les données de transport ouvertes comme les horaires, les données de comptage ou les informations sur le matériel roulant. Toutes ces informations, Tranquilien a pu en faire des modèles en les croisant avec les calendriers des vacances scolaires, la météo, tout ce qui peut avoir une incidence sur la fréquentation du train. Toute sa vie Rand Hindi a toujours été passionné par la technologie et le code. Il avait dix ans lorsque sa mère lui glisse un livre d’informatique entre les mains en lui disant « lis-le, ça te sera surement utile plus tard ». A quatorze ans, il décide de créer, avec un copain, un réseau social. C’était en 1995, cinq ans avant Facebook.

Au lycée, il décide de lancer son agence de développement web, de quoi se faire son propre argent de poche. Le vrai bouleversement de sa vie, aura lieu à Londres, à la UCL. Il y étudie l’ intelligence artificielle. « C’est a partir de ce moment que j’ai compris que les ordinateurs, lorsqu’ils étaient couplés avec de la donnée étaient capables de prédire ce qui allait se passer ».

La recette miracle du modèle prédictif de Tranquilien.
Tout commence par une bonne récolte : c’est la collecte de la donnée qui sera nettoyée, puis mise en forme afin de pouvoir être exploitée. Car dans sa forme brute, la liste de transport de la SNCF est assez indigeste : une succession interminable de lignes vertes, de chiffres, de références. Au début de chaque ligne, on trouve l’identifiant du trajet, puis celui du service et enfin celui du train. L’objectif n’est pas d’accumuler de la data, mais d’en extraire de l’intelligence. Pour faire parler cette donnée, les développeurs et les informaticiens utilisent des algorithmes, ces suites d’opérations ou d’instructions qui permettent de résoudre un problème. Les algorithmes peuvent à souhait ordonner ou filtrer les données, mais aussi réaliser des calculs statistiques.

« Ce que l’on fait, entre dans la catégorie du Machine-Learning » ajoute Rand Hindi. « C’est une forme d’intelligence artificielle qui est capable, à partir de données qu’on lui offre, de dériver des règles statistiques et de faire des prédictions. Une fois cette donnée récupérée, elle est analysée. Elle peut être rendue exploitable à travers des API, comprenez des morceaux de code qui vont permettre à des produits (Smartphones, ordinateurs) d’accéder directement à des prédictions ». Des applications reliées à de puissants moteurs de calcul pourraient donc prédire et faciliter notre quotidien. Et l’ambition de Rand Hindi ne s’arrête pas là : « après avoir travaillé avec la SNCF, nous nous sommes dit, finalement, ne pourrait-on pas étendre cette même méthode à tout ce que nous faisons dans la journée ? Sommes-nous en mesure de créer une application globale, qui pourrait être un compagnon de la vie des gens ? ». Cette appli, c’est « Snips ». Concrètement, elle sait qu’il est dans un café, qu’il a rendez-vous prévu avec Michael, l’ un de ses associés, que dans ses habitudes il prend un taxi pour aller à ses rendez-vous. Et naturellement, elle lui propose un « Uber » à proximité. En somme, un véritable cerveau de poche, un point d’entrée dans nos besoins, qui s’améliore avec le temps, et qui nous donne les moyens de faciliter notre quotidien.

Le big data prédictif, un oracle un peu envahissant.
Mais pour pouvoir fonctionner, ce genre d’application doit accéder à notre géo-localisation, à nos habitudes de déplacement ou de consommation. Si ces données peuvent être utilisées par Rand Hindi, elles peuvent l’être par n’importe qui, à des fins commerciales, ou afin de surveiller les consommateurs. La protection de la donnée privée intéresse les chercheurs de l’INRIA, l’Institut national de recherche en informatique et en automatique. Car, les sites sur lesquels nous nous
connectons, récupèrent toujours un fragment de nos informations. Dès lors, les groupes privés peuvent croiser les données pour créer des profils complets. Par exemple, aux Etats-Unis, un employeur peut commander une recherche sur ses employés. Pour 50 dollars, il disposera d’informations sur les propriétés immobilières de la personne, sur ses condamnations par la justice, il saura si la personne est célibataire ou mariée, à quelle date et avec qui.

Les données privées font l’objet d’une réelle convoitise. Le Forum économique mondial parle de la data comme du « pétrole du 21eme siècle ». Enjeux économiques, enjeux de liberté, les données sont au centre du débat. Pour Rand Hindi, il est important de dépasser la psychose pour mieux comprendre les potentialités qu’offre cette ressource précieuse « Les gens ne réalisent pas ce qui est possible aujourd’hui. Nous devons les aider à comprendre que la technologie est au service de notre quotidien, c’est une forme de trans-humanisme qui accompagne les hommes pour libérer leur créativité ».

Pour aller plus loin

- Snips, l’application développée par Rand Hindi
- Application SNCF Tranquilien
- Rapport du Forum économique mondial “Personal Data: The « New Oil » of the 21st Century
- Rand Hindi nommé jeune innovateur français de l’année par le MIT

Qu'en pensez-vous?