Un nouvel enjeu de société : le Big Data

Aujourd’hui les données nous envahissent. Elles sont notre monde et nous contribuons à les composer jour après jour. Elles sont partout et non plus que dans notre ordinateur. Le Big data se base sur un ensemble d’innovation techniques qui remet en question la façon dont les individus et les entreprises génèrent, stockent et transmettent les données (massification, stockage illimité, meilleure techniques d’analyse…). Mais d’où vient cette montée en puissance du Big Data ? Ce n’est pas uniquement une histoire de technologie mais également en relation avec les évolutions culturelles de la diffusion d’information. Cependant, un autre problème se pose : on ne supprime plus rien. Cette caractéristique suppose un changement profond de paradigme. Aujourd’hui de nombreuses questions se posent quant à la protection de nos données personnelles. Mais tout d’abord, avant de comprendre ce nouvel enjeu du Big Data, il convient de comprendre à quoi nous avons réellement affaire ?

Que sont concrètement les Big Data ?

Les données représentent une information sans contexte à la fois typée et organisées (c’est-à-dire structuré en bases de données). Elles sont les données des entreprises comme les emails, les bases de données, les historiques de processus métiers mais peuvent également être des données en dehors des entreprises comme les bases de données externes, les contenus échangés sur les réseaux sociaux ou en ligne, les historiques de navigation et de recherches…Ce ne sont pas qu’un ensemble de données disponible mais constitue une démarche visant à faire des données un mode de décision, une façon de créer de la valeur. On a l’habitude de définir les Big Data selon les 3V qui sont le Volume (des échanges de plus en plus nombreux), la Variété (des types de contenus différents) et la Vélocité (traitement en temps réel).

Comment expliquer leur soudaine montée en puissance ?

Leur explosion peut s’expliquer par un ensemble de progrès technologiques avec les objets connectés et nouvelles infrastructures d’échanges de données en même temps que la société évolue vers un plus grand partage d’information. On estime ainsi à plus de 220 milliard de recherches Google par mois.

Qu’en est-il de nos données personnelles ?

Selon l’article 2 de la loi « informatique et libertés », les données personnelles sont toutes les informations relatives à une personne physique qui peut être identifiée directement ou non souvent par référence à un numéro d’identification qui lui est propre. Nous sommes régulièrement voire constamment amenés volontairement ou par la contrainte de partager certaines de nos données personnelles. On peut évoquer ainsi les formulaires avec l’obligation d’accepter les fameuses « conditions générales ». En signant, nous n’aurions donc plus le droit de disposer de nos propres données et nous accepterions de léguer aux entreprises la possibilité de les diffuser encore. On peut citer ici l’exemple donné dans l’article de Xavier De la Porte sur Internet Actu qui évoque la prise de conscience d’un père, par les achats que sa jeune fille de 16 ans avait fait dans la grande surface américaine Target, que cette dernière était enceinte. En effet, retraçant ses récents achats, la chaîne de distribution lui avait envoyé des publicités ciblées proposant couches et petits pots pour bébés. Le magasin effectue un gros travail de statistique, de construction d’algorithmes qui se constituent à partir du nombre important d’informations que l’on apporte en faisant simplement nos courses. Le magasin peut même aller jusqu’à connaître des informations sur un client qu’aucun de ses proches est susceptible de connaitre. Les enjeux sont ambivalents selon les points de vue. En effet, aujourd’hui les gros acteurs américains de l’internet à savoir Facebook et Google préfèreraient un allègement des règles de protections des données personnelles en Europe car constitueraient un frein à leur activité. Ainsi on se demande si l’on veut vivre dans un monde ou les algorithmes sauront avant notre docteur ou nous-même une éventuelle pathologie. Il faudrait ainsi surveiller les algorithmes, les encadrer à l’image des recherches du physicien Barabasi et de kate Crawford.

 

La montée en puissance des Big Data pose ainsi de nouveaux défis aux défenseurs de la vie privée car en effet ils permettent de plus en plus l’exploitation des informations personnelles identifiables. Tout ce qu’on tape sur les moteurs de recherche, tout ce qu’on écrit sur les formulaires, tout ce qu’on accepte de rendre public ou diffusable n’est plus sous notre contrôle. Cependant le réel danger réside en ce que les gens sont rarement conscients de la manière dont leurs données sont utilisées sans leur accord à cause de la complexité des procédés techniques souvent cachée. De nombreux scientifiques et ingénieurs tentent de proposer des techniques dans lesquelles nous pourrions utiliser les Big Data à notre intérêt tout en gardant nos données protégées et en maximisant la protection de la vie privée, mais cela reste encore un point encore fondamentalement difficile à appliquer.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *