Actualités

Publié le 19 octobre 2021 Mis à jour le 19 octobre 2021

Assurer la confidentialité des données par le bruit mathématique

Si on peut imiter le style, on peut aussi le faire disparaître

Reconstitution d'un déchiquetage

En 2013, Peter Millican, un chercheur en linguistique informatique, a réussi à démontrer par une analyse de style littéraire que Robert Galbraith, l'auteur présumé de la série policière du héros Cormoran Strike, était en fait J.K. Rowling. Cette anecdote illustre à quel point la confidentialité ne tient pas tant à l'anonymat qu'à l'impossibilité de faire des recoupements de données.

Qu'un individu réponde à un sondage de façon anonyme ne veut pas dire que l'on ne parviendra pas à l'identifier. Comment alors garantir la confidentialité des données ?  Qu'il s'agisse de grands ensembles de données ou des données locales très spécifiques, le problème de la confidentialité demeure.

Une des solutions est d'ajouter du bruit ou du «flou» aux données. Par exemple «Location guard» est une application de navigation qui permet de masquer l'emplacement exact d'un utilisateur. Ainsi un touriste à Paris pourrait ne pas vouloir révéler qu'il visite le cabaret du Moulin Rouge, aussi, l'application le localisera dans une zone plus large, incluant par exemple la cathédrale Notre-Dame ou le Louvre. Cette technique est appelée «confidentialité différentielle locale».

Confidentialité du style et préservation du sens

Les travaux de Natasha Fernandes ont poussé un peu plus loin la confidentialité différentielle locale avec des métriques en l'appliquant aux documents texte de telle manière qu'un ordinateur puisse comprendre de quoi parle le texte sans pouvoir identifier son auteur.

«Pour garantir que l'apprentissage automatique ne puisse pas détecter le style d'écriture d'un auteur donné, nous avons ajouté une mesure de distance et montré mathématiquement qu'il était possible de conserver la classification du document tout en se protégeant contre l'identification. ». 

Par exemple, cette propriété de floutage permettrait de garantir l'anonymat d'un lanceur d'alerte, d'un client ou de tout auteur de communication textuelle.

Un des principaux objectifs de Natasha Fernandes est de faciliter la compréhension des risques de violation de la vie privée.

«Si les gens ont besoin d'un diplôme en mathématiques pour comprendre le degré de risque d'une atteinte à la vie privée, cela ne leur inspire pas la confiance nécessaire pour se sentir assez à l'aise pour partager leurs données, »


Pour l'article complet :

Comment les mathématiques rendent la confidentialité en ligne plus sûre
https://www.inria.fr/fr/mathematiques-confidentialite-securite-vie-privee

How JK Rowling was unmasked - https://www.bbc.com/news/entertainment-arts-23313074

En savoir plus sur cette actualité

Visiter inria.fr


Voir plus de nouvelles de cette institution
INRIA - Institut national de recherche en informatique et en automatique

Domaine de Voluceau
Rocquencourt - B.P. 105
78153 Le Chesnay
France

Tél.: 33 (0)1 39 63 55 11

Contacter

Voir le profil

Le fil RSS de Thot Cursus - Besoin d'un lecteur RSS ? Feedly, NewsBlur


Les tweets de @Thot


Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez nos infolettres en pédagogie et technologies éducatives

Vous pourrez aussi indexer vos ressources préférées et retrouver votre historique de consultation

M’abonner à l'infolettre

Superprof : la plateforme pour trouver les meilleurs professeurs particuliers en France (mais aussi en Belgique et en Suisse)


 

Ajouter à mes listes de lecture


Créer une liste de lecture

Recevez nos nouvelles par courriel

Chaque jour, restez informé sur l’apprentissage numérique sous toutes ses formes. Des idées et des ressources intéressantes. Profitez-en, c’est gratuit !