Même si vous pensez que vous naviguez «anonymement» sur Twitter, les algorithmes d'apprentissage automatique peuvent toujours vous localiser parmi une foule d'autres utilisateurs de 10,000 à l'aide de métadonnées associées à vos messages, selon une nouvelle étude.
«Métadonnées» fait référence à des données sur d'autres données. Dans le contexte d'une publication Twitter, cela inclut la date et l'heure de la publication, le nombre de caractères qu'il contient, le périphérique à partir duquel elle a été publiée, son style grammatical, l'emplacement à partir duquel elle a été publiée et de nombreux autres marqueurs. Le tweet moyen contient environ 144 morceaux de métadonnées.
À l'aide de l'apprentissage automatique, des chercheurs de l'University College London et du Turing Institute ont mis au point une méthode permettant d'identifier des utilisateurs individuels avec une précision 96.7 à l'aide de métadonnées uniquement. Même si votre pseudonyme est «LibPwner2016», les métadonnées peuvent toujours révéler votre identité. Et la plupart de ces métadonnées sont accessibles via l'API de Twitter.
L’expérience a été réalisée sur Twitter, mais les chercheurs disent que les mêmes méthodes peuvent être utilisées pour tester la confidentialité sur d’autres plateformes.
«Les méthodes décrites dans ce travail peuvent être appliquées à une vaste gamme de plates-formes et de systèmes générant des métadonnées présentant des caractéristiques similaires», ont conclu les chercheurs.
C'est une mauvaise nouvelle pour Facebook, qui a passé une grande partie de cette année sous le contrôle des autorités nationales après des scandales répétés impliquant la perte de données d'utilisateurs sensibles à des tiers.