Qu'est-ce que le "Big Data" ?

1.pngNon, «Big Data» n'est pas le prochain blockbuster de l'été ! Pourtant, cet éventuel film aurait un scénario digne des grosses productions hollywoodiennes.

Le terme de «Big Data» est un terme informatique qui désigne une explosion des volumes de données de nature informatique à traiter par une structure. Et pour vous présenter le problème, je pourrais vous l'annoncer comme une bande-annonce :

«Internet a grandi !»
«Désormais, le monde entier surfe sur le web !»
«Mais son succès sera sa perte !»

A ce moment-là, rajoutons deux protagonistes basés sur des gros clichés cinématographiques hollywoodiens :

John : «Jennifer, attention ! Un Big Data !»
Jennifer : «Oh non, John, c'est horrible ! Que va-t-on faire ?»
John : «Je ne sais pas encore mais il faut affronter cette grosse donnée rapidement !»
Jennifer : «Et ces 3 «V» écrits dessus, qu'est-ce que c'est ?

Retour à la réalité : je vais répondre à ces questions à la place de John.

Le Big Data ou le nouveau challenge informatique

On peut définir le Big Data, littéralement les grosses données comme un ensemble de données  hypervolumineux devenant diffiicile à gérer. Cela implique pour une entreprise de savoir comment stocker, rechercher, analyser un nombre impressionnant de données et d'informations.

Selon les chiffres d'IBM, Internet génère quotidiennement 2,5 trillions de données, c'est-à-dire 2,5 milliards de milliards ou encore 2,5 x 10 puissance 18 de données. Pfff....

Le Big Data fait non seulement référence à l'explosion du volume des données Internet dans les entreprises mais également aux nouveaux moyens technologiques adaptés à cette situation. Plusieurs solutions sont mises en œuvre depuis quelques années visant à repenser la gestion de ces données ; Et les premiers à résoudre ce « gros » problème est Google.

En fait, ce problème n'est pas nouveau car le « Big Data » implique systématiquement la mise en place de technologies dans le but de « traiter un volume très important de données aussi bien structurées que non structurées, se trouvant sur des terminaux variés (PC, smartphones, tablettes, objets communicants...), produites ou non en temps réel depuis n'importe quelle zone géographique dans le monde. » (article « Qu'est-ce que le Big Data ? » extrait du JDN)

Le terme « Big Data » désigne donc ce problème et les moyens mis en place pour le résoudre.

Les « 3V » ou la 3D du Big Data

On entend souvent parler du Big Data et des «3 V», initiales de Volume, Vitesse et Variété.
Serait-ce un nouveau problème ? Non ! Ce sont les trois intitales permettant d'identifier les trois dimensions du « Big Data » c'est-à-dire d'évaluer conrètement l'envergure du chantier à mener.

La première dimension à prendre en compte, le premier « V » désigne simplement le Volume : la masse de données est en constante augmentation et donc difficilement quantifiable et analysable. De plus, le développement des objets connectés ne vont pas simplifier l'équation...
Je vous fais part de l'exemple très concret trouvé sur le site d'IBM : « Convertir les 350 milliards de relevés annuels de compteurs afin de mieux prédire la consommation d'énergie ».

Le second « V » consacre la vitesse car nous sommes tous désireux de trouver rapidement une information ou d'être guidé en temps réel par notre GPS via notre smartphone... Et quand on joue à un jeu de stratégie en temps réel sur internet, on peut rapidement imaginer la quantité de données circulantes...

Le dernier « V » désigne la variété des données. Quelles soient structurées ou non, l'hétérogénéité des données à traiter rend la mission plus complexe que jamais. L'exemple le plus parlant serait le multimédia sur un site internet : traiter efficacement les images, les vidéos, etc. d'un site internet lui-même composé de données XML ou autres...

Pour conclure, le Big Data est un challenge à la hauteur du problème que génère notre utilisation quotidienne d'Internet. Les nouvelles technologies de l'information multiplient les enjeux du Big Data sans oublier les sites de e-commerce, les moteurs de recherche, etc.

Les solutions ne manquent pas mais elles doivent s'adapter aux changements perpétuels et à l'augmentation continuelle des données sur Internet.
C'est loin d'être un scénario catastrophe mais nous pourrons sans doute suivre cette histoire avec intérêt...

Étiquettes: