Projets internationaux

Le CASD est engagé depuis sa création dans l’ouverture de l’accès transnational aux données confidentielles pour la recherche. L’accès est possible depuis les pays de l’Union Européenne ou des pays associés dans les mêmes conditions que pour les chercheurs résidents en France. Il est également désormais ouvert depuis l’Amérique du Nord  avec quelques dispositions spécifiques. Enfin le CASD participe de façon très active à des projets européens et internationaux visant à faciliter l’utilisation des données confidentielles par delà les frontières nationales.

Un accès sécurisé depuis les pays de l’Union européenne et les pays associés.

Pour les résidents des pays de l’Union européenne et des pays associés, les critères d’accréditation et les procédures sont identiques à celles des résidents en France (procédure d’habilitation). L’accréditation auprès du Comité du Secret Statistique et l’enrôlement au CASD nécessitent un court déplacement en France. L’accès sécurisé peut ensuite se faire depuis l’institution du demandeur, via l’installation d’une SD-Box adressée par voie postale.

Les données de l’INSEE désormais accessibles depuis l’Amérique du Nord

L’Insee, dans sa volonté de soutien à la recherche, a également autorisé l’accès à ses données avec des SD-Box du CASD localisées aux Etats-Unis et au Canada dans les situations suivantes:

  • Chercheurs ressortissants d’un État membre de l’Union européenne, en poste au sein d’une université ou d’un centre de recherches ou d’études américain ou canadien ;
  • Chercheurs en poste au sein d’une université ou d’un centre de recherches ou d’études américain ou canadien, dans le cadre d’un projet de recherche mené en partenariat avec un centre de recherche ou d’études ou une université d’un État membre de l’Union européenne.

Le CASD s’efforce de promouvoir au niveau européen et international un accès plus facile des chercheurs aux données confidentielles aux delà des frontières nationales. Après avoir participé à deux projets européens portant sur les conditions et la faisabilité d’un réseau de centres sécurisés tant pour les données nationales, Dwb du FP7 (PCRD) qu’européennes avec l’EssNet correspondant (projet financé par Eurostat), le CASD coordonne l’IDAN (International Data Access Network) qui construit concrètement la coopération entre 6 centres sécurisés de 4 pays (France, Allemagne, Pays-Bas et Royaume-Uni avec l’objectif de faciliter pour les chercheurs l’utilisation des données confidentielles de ces centres pour un même projet. Des partenariats sont ainsi progressivement mis en place comme celui avec l’Agence fédérale allemande de l’emploi FDZ/ IAB.

EssNet SCFE

Le CASD est partenaire du projet ESSnet SCFE (Sharing Common Functionalities in the ESS), coordonné par l’INSEE et financé par la Commission Européenne via EUROSTAT. Ce projet vise à promouvoir le partage d’expérience et le développement de solutions communes entre les instituts statistiques et autres autorités statistiques au sein de l’ESS dans la perspective de mettre en œuvre une architecture « service-oriented ».

Le CASD travaille avec l’INSEE sur la réutilisation du service de publication RDF (Resource Description Framework) de l’INSEE afin de récupérer les principales métadonnées directement à la source pour les mettre à disposition de ses utilisateurs.

CESSDA

Le CESSDA (Consortium of European Social Sciences Data Archives) a pour mission de coordonner en Europe l’accès aux données pour la recherche en sciences sociales via l’adoption de standards et bonnes pratiques professionnelles pour l’archivage, la documentation et l’accès aux données hébergées dans les banques de données des pays membres. Il est l’une des 5 grandes infrastructures de recherche pour les sciences sociales, reconnue dans le cadre du processus ESFRI (European Strategy Forum on Research Infrastructures).

Le CASD apporte une contribution ponctuelle au développement du CESSDA et à ses activités dans le cadre de PROGEDO (PROduction et GEstion des DOnnées en SHS).

La France, membre fondateur du réseau européen

Fondé en 1976, le CESSDA prend en 2013 la forme d’une infrastructure européenne de recherche en 2013 et est doté en 2017 du statut juridique d’ERIC (European Research Infrastructure Consortium), impliquant ainsi ministères ou Research Councils dans sa gouvernance.

La France est membre fondateur du CESSDA ERIC via PROGEDO dont le département CESSDA France- Réseau Quetelet doit assurer le rôle de Service Provider national français pour le CESSDA.

L’accès transnational aux données confidentielles

Peu de banques de données partenaires du CESSDA hébergent actuellement des données très détaillées requérant la mise en place d’un accès sécurisé, telles que celles en provenance de la statistique publique et administrative.

Le potentiel pour la recherche que représente l’ouverture de telles sources de données va être un enjeu important pour le CESSDA dans les années à venir après sa phase de construction initiale (mise en place d’un catalogue et d’une base de questions européenne).

L’implication du CASD et un intérêt à terme

Dans la phase actuelle, le CASD a participé à deux des activités mises en place par le CESSDA dans le cadre de sa phase de construction. Le CASD suit ainsi la réflexion sur les standards pour les metadonnées qui seront recommandés aux partenaires du CESSDA et celle sur la mise en place d’un point d’accès unique (one stop shop) permettant aux chercheurs d’accéder rapidement à l’ensemble des ressources disponibles.

A terme, le CASD est intéressé par le rôle que pourrait jouer le CESSDA pour la mise en place d’une infrastructure sécurisée distribuée telle que celle dessinée dans le cadre du projet DwB pour les données nationales confidentielles et dans le cadre du projet ESSnet DARA pour l’accès aux données confidentielles européennes (Eurostat), deux projets pour lesquels le CASD a mis en place un Proof of Concept.

CIMES

Des Métadonnées pour les données nationales en Europe…

CIMES (Centralising and Integrating Metadata from European Statistics) fournit un aperçu général et complet des microdonnées officielles diffusées à des fins de recherche par les instituts nationaux de statistique (INS) en Europe.

Il s’agit d’une base de données décrivant ces microdonnées, les procédures pour en demander l’accès, des informations sur les fichiers disponibles (fichiers publics, fichiers scientifiques, fichiers sécurisés), les conditions d’accès et les liens vers les fournisseurs. Il ne donne pas un accès direct aux données, il ne contient que des métadonnées. CIMES regroupe ainsi des informations qui sont actuellement dispersées dans toute l’Europe, soit dans les INS ou les archives de données, et les stockent dans une base de données structurée compatible avec la norme DDI.

…Accessibles grâce à une documentation précise et contrôlée

La documentation distingue les séries, les études et les ensembles de données. Une série est un ensemble d’études représentant un processus de collecte de données transversales longitudinales ou répétées. Il illustre le processus continu de collecte de données effectué par les INS, où chaque vague de collecte est une étude. L’ensemble de données se réfère à l’ensemble des fichiers qui sont diffusés. Par exemple, l’Enquête sur la population active (LFS) est une série, la collecte réelle des données en 2007 est une étude, le LFS 2007 et l’ensemble de données est un ensemble de fichiers diffusés, par exemple le fichier scientifique de l’EPA (SUF) 2007.

Chacun de ces niveaux est documenté par une liste de champs et un vocabulaire contrôlé. Actuellement, CIMES couvre 277 séries, dont 1 893 études et 2 244 ensembles de données dans 31 pays européens, fournissant également des liens pour les principales microdonnées intégrées européennes.

CIMES est un produit du projet européen FP7 DwB qui vise à faciliter l’utilisation du nombre croissant de microdonnées officielles en Europe. L’application Web CIMES est développée par le CASD.

ADP, CED, CNRS-Réseau Quetelet, FORS, GESIS, RODA, ONS et UL ont participé au CIMES, collectant et structurant les métadonnées pour la durée du projet DwB. Le travail se poursuit actuellement avec le soutien du CNRS et du CASD.

https://cimes.casd.eu/

DWB

Faciliter l’accès transnational aux données confidentielles

Les chercheurs font face à de grandes difficultés pour travailler sur des données très détaillées (ou dites confidentielles) d’un pays dont ils ne sont pas résidents. Les procédures d’habilitation tout comme les modes d’accès diffèrent. Peu de pays autorisent un accès sécurisé à distance depuis un autre pays. Avec 29 partenaires de 14 pays européens, impliquant des instituts nationaux de statistiques et des banques de données pour les sciences sociales, le projet Data Without Boundaries (2011-2015) financé dans le cadre du 7ème programme cadre de la Commission Européenne, a jeté les bases d’une coopération visant à faciliter l’accès transnational aux données confidentielles pour la recherche.

Un Proof of Concept pour un réseau sécurisé distribué

Le CASD, partenaire de ce projet aux côtés de l’INSEE, a notamment construit avec l’institut fédéral de statistique allemande, DESTATIS, et la banque de données pour la recherche allemande, le GESIS, un Proof of concept pour un réseau sécurisé distribué.

Celui-ci permettrait aux utilisateurs habilités de travailler avec un équipement et un seul point d’accès sur des données hébergées par-delà les frontières dans différents centres sécurisés. Le Proof of Concept :

  • montre la possibilité de mettre en œuvre une infrastructure intégrée, dotée d’une très haute sécurité tout en étant flexible aux contraintes variables des différentes législations nationales.
  • permet a minima aux utilisateurs de travailler avec un même équipement, une même procédure et d’un même point d’accès sur des sources de données situées dans les centres sécurisés partenaires.

Un tel réseau, utilisé dans tout son potentiel, rend possible à une équipe de chercheurs localisés dans différents pays de travailler ensemble facilement sur des sources multiples et éventuellement combinables le temps de l’analyse.

Vers une construction pas à pas

Les partenaires de DwB ont également travaillé sur des solutions pour améliorer l’information et la documentation sur les données nationales en Europe, comme le CASD qui a notamment construit , (Centralising and Integrating Metadata from European Statistics).

Le CASD va travailler à construire pas à pas, avec quelques partenaires et au plus près des projets des chercheurs et de leurs besoins, des coopérations bi-latérales ou multilatérales pour avancer concrètement dans la construction de cette infrastructure pour la recherche.

ESSNet Dara

Le CASD a mis en place une infrastructure d’accès sécurisé distant dans le cadre d’un pilote (proof of concept) pour le projet collaboratif européen DARA avec l’Allemagne, la Grande Bretagne, la Hongrie et le Portugal.

Dans ce cadre, le CASD a présenté le pilote de centre d’accès sécurisé européen, appelé DARA, au WGSC (Working Group on Statistical Confidentiality) à Luxembourg (Eurostat). Ce dispositif pilote, qui s’appuie sur la technologie CASD, a donné entière satisfaction aux partenaires du projet.

 

[Schéma du déploiement pour le pilote européen DARA]