Big Data: C’est quoi ? Définition
On associe souvent aux Big Data le concept des 3V, selon les termes de l’analyste Doug Laney, au début des années 2000 :
Volume
Less organisations collectent énormément de données, d’où le BIG de Big Data, depuis de nombreuses sources. Parmi celles-ci, on peut noter les transactions diverses avec les clients et partenaires, mais aussi depuis les réseaux sociaux, ou encore les informations émanant des puces RFID et des compteurs intelligents.
Vélocité
De nouvelles données sont générées en continu à un rythme sans précédent, ce qui impose de facto des problématiques de traitement.
Variété
Des sources variées impliquent des formats variés, ce qui ajoute aux problématiques de traitement. Les données sont alors numériques et structurées, comme les bases de données en tous genres, ou informelles, comme les documents textes divers, mails, vidéos, fichiers audio et autres informations de transactions, financières par exemple.
Certains analystes parlent eux des 5V, en ajoutant deux nouvelles problématiques :
Véracité
La qualité des données impacte la qualité des décisions basées sur celles-ci. Il est donc primordial de faire attention à la fiabilité des données, notamment en fonction du point de collecte, et de leur caractère déclaratif ou non. On peut aussi citer, en matière de web analytics, les problématiques de fiabilité causées par les bad bots.
Valeur
Alors que le volume de données ne cesse de croître, la problématique liée à la valeur concerne l’exploitation des différents types de données, c’est à dire : comment exploiter les données au service de mon entreprise ? En même, il est important de faire le tri entre les données qui sont utiles, et celles qui le sont moins, ou pas du tout.
Enfin, de nombreuses entreprises ont construit leur modèle économique autour des Big Data.