Le Big Data




Définition du Big Data : ce sont des données « volumineuses » dont la taille va au-delà de la capacité des outils logiciels couramment utilisés pour capturer, gérer et traiter les données dans un délai acceptable, c’est à dire des quantité de données que les outils de BI traditionnels ne peuvent pas gérer. Ces données sont en constante augmentation, de quelques téraoctets elles sont passées à plusieurs péta-octets. MIKE 2.0 est une approche ouverte de gestion de l’information, définit les données de gros en termes de permutations utiles, la complexité et la difficulté de supprimer des enregistrements individuels.

 

Définition du Big Data et l’approche des 3V

Dans un rapport de recherche datant de 2001,les analystes de META Group – devenu aujourd’hui Gartner – définissent les défis et les opportunités de la croissance des données. Ils parlent d’une croissance à trois dimensions. En effet, le volume augmente (quantité de données), la vitesse d’entrée et de sortie ainsi que la variété des types et des sources de données. Le cabinet Gartner group, et maintenant une grande partie de l’industrie, continuent à utiliser cette approche nommés « 3Vs » lorsqu’il s’agit de décrire les Big Data. En 2012, Courtney Lambert a élargi la définition de Gartner pour « 4Vs » en y ajoutant le terme « virtuel ».

 

Le big Data et les actions Gouvernementales

En 2012, l’administration Obama a annoncé le Big Data Research et Development Initiative, qui a étudié la façon dont les big data pourraient être utilisées pour résoudre les problèmes importants auxquels est confronté le gouvernement. Ce projet compte 84 programmes différents répartis sur six départements. Le Gouvernement fédéral des Etats-Unis est propriétaire de six des dix plus puissants supercalculateurs au monde.

 

Le Big Data dans le secteur privé

Walmart par exemple traite plus d’un million de transactions clients chaque heure, qui est importées dans des bases de données qui contiennent plus de 2,5 pétaoctets de données. L’équivalent de 167 fois l’information contenue dans tous les livres de la bibliothèque du Congrès américain. Facebook gère 40 milliards de photos à partir de sa base d’utilisateurs. La société FICO protège 2,1 milliards de comptes actifs dans le monde entier. Le volume de données commerciales dans le monde entier, dans toutes les sociétés, double tous les 1 voire 2 ans, selon les estimations.

 

Le Big Data et l’industrie du logiciel

Big data a accru la demande de spécialistes en gestion de l’information comme Oracle Corporation, IBM, Microsoft, SAP et HP. Ils ont dépensé plus de 15 milliards de dollars pour leurs logiciels spécialisés dans la gestion de données et d’analyses. Ce secteur à lui seul vaut plus de 100 milliards $ et augmente de près de 10% par an, ce qui est à peu près deux fois élevé que l’industrie du logiciel dans son ensemble. Les économies développées font un usage croissant des technologies à forte intensité de données.

Il y a 4,6 milliards de téléphones mobiles dans le monde entier et il y a entre 1 milliard et 2 milliards de personnes accédant à Internet. Entre 1990 et 2005, plus de 1 milliard de personnes dans le monde entra dans la classe moyenne. Ce qui signifie que les gens qui ont de plus en plus d’argent deviendront de plus en plus instruits puis contribueront à leur tour à la croissance de l’information.