Tiers de confiance pour les appariements de données

Un tiers de confiance est un organisme indépendant n’ayant pas d’intérêt direct dans l’utilisation des données sources ou résultantes tout en garantissant la confidentialité des données directement identifiantes.

Le Centre d’Accès Sécurisé aux Données (CASD) a été lauréat de l’appel à projet équipement d’excellence (Equipex). Le projet soumis présentait six grands thèmes de développement dont un sur les méthodologies d’appariement et le rôle de tiers de confiance que pourrait assurer le CASD. Le jury international, qui a évalué le projet, a particulièrement insisté dans son rapport sur cet aspect en le désignant comme le point le plus crucial du projet.

Pour réaliser des appariements de données provenant de sources gérées par différents producteurs tout en garantissant le respect de leur confidentialité, il est nécessaire de recourir à un organisme tiers appelé tiers de confiance en charge de réaliser les opérations nécessaires en conservant les éléments identifiants des individus.

Le CASD a pour objectif de donner toutes les garanties en matière de sécurité et de confidentialité exigées par les producteurs des données et par la CNIL dans le cadre de la réalisation d’appariements.

Le CASD a pour principale mission la mise à disposition des données confidentielles de manière hautement sécurisée. Les autres missions du CASD concernent la documentation des données, le support aux chercheurs, la formation et les appariements de données.

Pour mettre à disposition les données de manière hautement sécurisée, le CASD a mis au point une infrastructure informatique dont la particularité est d’être totalement isolée et fermée (étanche) assurant ainsi le confinement des données. Cette infrastructure est aujourd’hui située dans les locaux du GENES et héberge les données ainsi que les moyens de traitement associés. Le système a été conçu pour que les données ne puissent pas être extraites de cet environnement centralisé. Pour accéder à distance aux moyens de traitements des données, les utilisateurs doivent se connecter à partir d’un établissement identifié par son adresse réseau, utiliser un boitier sécurisé spécialement conçu à cet effet par le GENES (la SD-Box) et s’authentifier à l’aide d’une carte à puce (authentification forte par certificat).

Le CASD et les pré-requis définissant un tiers de confiance

Le CASD est aujourd’hui composé de 27 personnes réparties dans 3 entités :

  • Un service datascience et infrastructure IT chargé de l’exploitation, de la recherche et du développement en matière de datascience et de sécurité informatique.
  • Un service statistique spécialisé dans la collecte et de la mise en forme des données, la documentation et le respect de la confidentialité des données notamment sur les questions de secret statistique.
  • Un service de gestion de projets (PMS) chargé de tous les sujets d’organisation.

Toutes les opérations de traitements liées aux appariements sont réalisées dans un environnement dédié et isolé au sein de l’infrastructure informatique hautement sécurisée du CASD. L’accès ne peut se faire, même pour le personnel du CASD, qu’à partir d’un terminal SD-Box avec authentification forte.

Par ailleurs, le CASD ou ses agents n’ont pas d’intérêt direct dans l’utilisation des données sources ou résultantes. Il n’y a pas, parmi le personnel du CASD, de chargé d’étude ou de chercheurs par exemple. De plus, le CASD offre toutes les garanties de confidentialité pour les données directement identifiantes.

Tous les pré-requis définis par la CNIL pour qualifier un tiers de confiance sont réunis : indépendance, pas d’intérêt direct pour les données, missions et moyens etc.

Pour toute demande d’information relative aux opérations de tiers de confiance, pour les appariements, nous vous invitons à nous contacter par e-mail à l’adresse suivante : service@casd.eu