2,5 trillions d’octets. C’est grosso modo la quantité de données que nous produisons chaque jour via Internet, les objets connectés, les signaux GPS et autres outils numériques. Un flux évidement colossal qui se retrouve au centre de toutes les convoitises. Car dans ces données se nichent des informations au sujet de notre identité, de nos passions, de nos désirs et de nos activités. Autrement dit, une mine d’or pour les entreprises avides de mieux connaître leurs clients pour anticiper leurs attentes.

Mais on ne récolte pas - et on analyse encore moins - des Téraoctets de données avec une clé USB, un tableau excel et un thermos de café à portée de main. Pour y parvenir, un nouveau champ technologique conquiert progressivement tous les secteurs à commencer par la banque, les assurances, les télécoms mais aussi l’hôtellerie. On parle bien sûr du Big Data.

Afin de mieux comprendre en quoi il consiste, quels sont ses enjeux et ses applications, nous sommes allés interroger Babiga Birregah, enseignant-chercheur spécialiste dans l’analyse des données de masse à l’Université de Technologie de Troyes. Extension de l’intelligence artificielle, problèmes de confidentialité et investissement de longue haleine : voici tout ce que vous devez savoir sur le sujet.

WOMBEE : On entend chaque jour parler du Big Data dans les médias, que ce soit à propos d’élections présidentielles, du renseignement d’État ou de ciblage publicitaire. Pourquoi est-ce que ce domaine relativement neuf intéresse-t-il autant les décideurs ?

Babiga Birregah

Babiga Birregah :

Parce que depuis un certain nombre d’années nous avons des systèmes socio-techniques - comme les réseaux de transport, les moteurs de recherche ou les réseaux sociaux - qui produisent énormément de données. Par exemple, lorsque vous fréquentez un site internet vous y laissez des traces. Ces traces sont récoltées et peuvent être analysées pour déduire qui vous êtes, quels sont vos centres d’intérêt, etc. Le problème jusqu’ici est que nous avons été limités pour les traiter en aussi grand nombre. Le Big Data apporte à la fois les technologies pour collecter massivement ces données mais aussi pour les analyser et en tirer des informations pertinentes.

Où en est-on au niveau des avancées techniques ?

Aujourd’hui l’enjeu est de trouver l’algorithme capable de répondre à un problème précis. Depuis un moment, nous employons le machine learning pour cela - des technologies qui fonctionnent par apprentissage. Nous allons maintenant passer à la vitesse supérieure avec le deep learning. Les algorithmes vont être capables de s’adapter d’eux-mêmes grâce à un mix entre le machine learning et les réseaux neuronaux. Sans compter l’émergence de nouveaux systèmes de stockage de données actionnables comme les graphes, qui permettent de modéliser de façon plus lisible les relations entre les données.

Le groupe Accor a acquis en 2011 un Master Data Management (système centralisé de collecte de donnée). Quel regard portez-vous là-dessus ?

Aujourd'hui, tout est basé sur la capacité à connaître et anticiper ce que ses clients veulent pour être en mesure de fournir les services adéquats au bon moment. Le marché est très volatile et il faut être constamment dans l'anticipation et l’innovation. Et l'anticipation vient de la capacité à ingérer l'information, la traiter et à apporter l’aide à la décision pertinente pour innover. L'hôtellerie et le tourisme de façon générale, sont des secteurs hautement concurrentiels. Pour fidéliser le client, il faut fournir des services qui sont au plus près de ses besoins. En ce sens le Big Data peut aider le groupe Accor à prendre les bonnes décisions pour ses clients et conquérir de nouvelles parts de marché.

La promesse du Big Data est de proposer des avantages sur des services qui vous intéressent vraiment.

Vous avez évoqué les traces numériques que nous laissons. Mais beaucoup de personnes entrent volontairement de fausses informations lorsqu’elles effectuent une réservation en ligne par exemple. Ou bien elles réservent mais ce ne sont pas elles qui vont consommer le service par la suite.

Oui, sur Internet il ne s’agit que de déclaratif. On revient donc à la question de la pertinence du traitement: quel est l'algorithme qui peut nous permettre d’approcher le plus possible de la réalité ? L'enjeu des nouveaux algorithmes de machine learning est bien là. Faire émerger des informations véridiques à partir de déclarations.

Peut-on imaginer un large mouvement de défiance des clients quant au caractère intrusif que le Big Data peut représenter dans certains cas ?

Peut-être. Mais il devient de plus en plus difficile d’y échapper. Aujourd’hui je ne peux tout simplement pas utiliser de nombreux outils si je refuse de communiquer un minimum d’informations à mon propos. Prenons un exemple : la loi impose désormais aux responsables de sites Internet d’informer leurs utilisateurs de la présence de cookies et autres traceurs sur leurs sites. Est-ce que les gens arrêtent de fréquenter ces sites Internet ? Au contraire. Dans certains cas les avantages que peuvent promettre ces sites constituent des leviers d’encouragement pour les utilisateurs. C’est un peu le principe de la carte de fidélité dans un supermarché. Vous acceptez qu’on enregistre vos habitudes de consommation et en échange vous avez des réductions. La promesse du Big Data est, sur la base de ces données collectées sur vous et sur d’autres utilisateurs des mêmes services ou des services connexes, de proposer des avantages sur des produits ou des services qui vous intéressent vraiment.

Aucun secteur du tourisme ne peut s'en passer aujourd'hui

Quel investissement le Big Data représente-t-il pour une entreprise, qu’elle exerce dans l’hôtellerie, le tourisme, ou dans tout autre domaine ?

Le Big Data est un secteur très mouvant et nous n'avons jamais toutes les cartes en main. Il faut toujours chercher à innover et trouver de nouvelles solutions. Et pour cela, il est nécessaire de disposer des meilleurs talents, des bonnes technologiques et d’un matériel très performant. C’est à dire du stockage pour la masse de données, de préférence dans le cloud. Il faut aussi une équipe de data scientists et surtout, se donner le temps pour l’innovation. Même si des sommes très importantes sont engagées, cela peut prendre du temps et de l’énergie avant d’obtenir un retour sur investissement.

Tous les « petits » comme les hôteliers indépendants n’ont pas le poids ni les moyens financiers d’investir dans le Big Data. Risquent-ils de se retrouver « hors-jeu » ?

Tout dépend de leur stratégie. C’est comme la révolution du e-commerce. Aucun secteur du tourisme ne peut s’en passer aujourd’hui. La plus petite maison d’hôte doit faire appel à minima à un comparateur aujourd’hui pour s’assurer de la visibilité. Du coup ces gros agrégateurs que sont par exemple Booking.com, Trivago, Hotels.com, etc. pourrons moyennent l’investissement nécessaire, proposer de nouveaux services aux sites dont ils hébergent les offres. C’est le seul moyen pour les « petits » de survivre.