Le manque de transparence, de débat et de connaissances autour des données numériques mène vite à la technocratie… et le pire, c’est qu’on s’y habitue ! Certains irréductibles pourtant utilisent quelques techniques de geek pour contrer la mise sur le marché de leurs données personnelles. Deux spécialistes du numérique nous aident à mieux comprendre les faits et enjeux du big data : un premier pas dans la lutte pour la protection de nos infos persos. 

Depuis l’Antiquité, « les données sont au cœur des techniques de gestion de la société, pour permettre aux humains de (sur)vivre durablement ensemble : gestion des besoins alimentaires, de la population, organisation des services… », rappelle François Gilbert, chargé de mission numérique à l’Université de Rennes 2. Seulement, avec les premiers pas de l’informatique et le développement expansif de l’Internet, l’exploitation des données promet aujourd’hui la découverte d’informations plus poussées sur la « gestion de la société », et donc sur nous autres, usagers 2.0.

Il paraît que les données personnelles sont surnommées « l’or noir du XXIème siècle »… mais à qui reviennent réellement les profits ? Aux fameux GAFA (Google, Apple, Facebook, Amazon) ? Certes, le recueil et l’utilisation de ces données numériques peuvent « être utiles pour des prises de décisions, notamment dans des situations où il faut agir vite, [comme les] données relatives aux pandémies », explique Adrien Ferro, créateur de l’AFFAC (Adrien Ferro Formation Accompagnement Conseil). Mais elles servent aussi souvent à des fins marketing avec une traçabilité de nos comportements, voire à dessein d’espionnage, comme l’a révélé l’affaire Snowden en 2013. Avec des enjeux multiples et majeurs, les algorithmes créent aujourd’hui un nouveau paysage sociétal, avec des sujets plutôt controversés.

Une gestion abstraite de données concrètes

Pour commencer, la loi Informatique et libertés précise que les données ne peuvent normalement être gardées que lorsqu’il y a un but en aval, et qu’une fois ce but atteint, elles doivent être supprimées. Seulement, tant de données circulent sur les réseaux qu’il est aujourd’hui pratiquement impossible de savoir si elles sont réellement anéanties.

Un autre sujet discutable est celui de l’Evidence-Based Sentencing, c’est-à-dire l’utilisation de facteurs statistiques comme l’âge ou le sexe pour déterminer de manière automatisée des peines d’emprisonnement. Utilisé dans une vingtaine d’États américains, ce procédé omettant l’« humain » permet ainsi de déterminer les risques de récidive et la lourdeur de la peine de l’accusé. À cela, Adrien Ferro objecte que l’homme est « la résultante d’une infinité de paramètres qui devraient [plutôt] nous laisser ouverts […] à l’imprévisible ». Des « prédictions » algorithmiques comme celles de l’Evidence-Based Sentencing ne devraient donc peut-être pas être le seul instrument de prise de décisions.

La forme scientifique a beau conférer ainsi un statut consciencieux aux algorithmes, un décideur sur trois ne se fierait pas aux données analysées pour prendre des décisions. Et le manque de transparence y est pour quelque chose ! Comment par exemple peut-on avoir confiance en des modèles privés d’analyse, qu’on ne peut décortiquer et par conséquent vérifier ?

Un manque de débat et de connaissances

Face à ce genre de problématique sur le traitement des données numériques, François Gilbert souligne un net manque de débat. En cause : des médias de masse qui ne transmettent que des situations simplifiées, et un « déficit de la culture numérique des élites, en particulier politiques ». En citant un effet « relatif » des révélations de Snowden sur les comportements et une CNIL considérée par les politiques comme gênante, le chargé de mission numérique enfonce le clou : « selon le principe de la grenouille plongée dans une casserole qui chauffe progressivement, la société est devenue beaucoup plus tolérante avec les dispositifs de captation et de traitement des données personnelles ».

Surveiller les algorithmes ou tromper la machine ?

Cette mauvaise habitude n’empêche pourtant pas certains groupes « en faveur des libertés individuelles de proposer des outils, navigateurs et autres ‘systèmes sur clé USB’ pour faciliter l’appropriation des techniques […] d’anonymisation des usages sur Internet ». Des outils qui ne sont pas tous à la portée du lambda, car s’il est « assez facile de contourner les dispositifs de surveillance de masse, [il l’est] beaucoup moins d’échapper à une surveillance ciblée ». Quand certains préconisent un contrôle des algorithmes, quelques internautes cherchent quant à eux à « tromper la machine » :

– Pour protéger leur vie privée, des révoltés de l’Internet mettent alors en place des stratégies d’évitement, comme l’utilisation du réseau Tor, faussant leur adresse IP et donc garantissant leur anonymat sur le web.

– Il existe aussi des extensions sur les navigateurs web – comme Ghostery – qui permettent de minimiser le recueil d’informations en bloquant les cookies des pages web que l’internaute visite.

– L’obfuscation (ou l’obscurcissement) est une autre de ces manœuvres. D’après Wikipédia (on aurait tort de s’en priver), cette technique consiste « à publier en quantité des informations [dans le but de] ‘noyer’ les informations existantes que l’on souhaite cacher ».

– La capture d’écran permet quant à elle de lire le contenu d’un message ou d’une image sur des logiciels comme Facebook ou Twitter, dont les algorithmes ne savent pas en lire le contenu.

En bref, du rocambolesque quand les vrais luxes et libertés sont, selon Adrien Ferro, la simple déconnexion !

Antonin Cyrille

Une réponse