Le projet TeraLab

La plateforme de services big data TeraLab a pour objectif d’accélérer la recherche et l’innovation dans le domaine des données massives.

Les technologies du Big Data se déploient de manière soutenue dans les organisations du fait notamment de l’augmentation de la volumétrie de données collectées. Cela soulève la question de la sécurité et le risque de réidentification qui deviennent des sujets de préoccupation majeure, limitant souvent les possibilités d’innovation permises par ces nouvelles technologies.

TeraLab est une initiative de deux partenaires qui ont une mission de soutien au développement économique par l’enseignement, la recherche et l’innovation :

TeraLab est conçu pour apporter une réponse immédiate aux besoins des chercheurs, enseignants et entreprises pour développer la connaissance et les innovations grâce aux technologies du big data. La plateforme comprend deux compartiments :

Le projet a été labellisé par le pôle de compétitivité Cap Digital et a reçu le soutien du Programme d’Investissement d’Avenir (PIA).

Aspect Novateur du compartiment CASD-Teralab :

Le compartiment CASD-Teralab se distingue des solutions existantes en mettant un accent particulier sur :

  • la gestion de la sécurité informatique : grâce à une innovation technologique brevetée, reconnue comme équipement d’excellence qui a fait ses preuves (la SD-Box).
  • la gestion de la confidentialité et les risques de ré-identification.
  • l’intégration intelligente et poussée des solutions Big Data : l’écosystème Hadoop accompagné des multiples Framework de traitement à haute échelle (machine Learning, deep Learning).

Etapes à venir pour le Big Data en entreprise :

La fourniture d’un niveau de sécurité très élevé et homogène permettra d’offrir des possibilités de croisements de données à très fort potentiel entre les différentes plateformes sécurisées. Par conséquent, CASD-Teralab entend, grâce à cette technologie, jouer un rôle de tiers de confiance entre entreprises et entre entreprises et utilisateurs.

Le compartiment CASD-Teralab s’appuie sur une plateforme technique évolutive pour offrir un service dédié à l’innovation en matière d’analytique de données volumineuse (de l’ordre des Tera et Peta octets).

Le caractère confidentiel des données hébergées par le CASD exige des garanties de sécurité très élevées. Celles offertes en standard par les technologies du Big Data sont bien souvent insuffisantes pour permettre un accès extérieur sécurisé à des données confidentielles. La technologie du CASD associé à une isolation physique et logique des projets permet de palier à cela.

Dans le cadre de son développement, les actions suivantes sont en cours  :

  • d’industrialiser la plateforme, quasiment « plug and play » dans l’environnement de l’entreprise ou n’importe quelle institution propriétaire des données.
  • d’intégrer un module d’anonymisation puissant et compatible au sein de l’écosystème CASD-TeraLab.
  • d’ajouter des ressources GPU (pour des applications « deep learning » et généralement de AI) au catalogue des ressources (i.e. CPUs, RAM, stockage)
  • d’«inter-connecter» la plateforme à d’autres plateformes via un tiers de confiance, permettant d’apparier des sources de données, sans qu’aucun des propriétaires de données ne perde la maîtrise de celles-ci.

Utiliser CASD-Teralab pour valoriser vos données :

Les équipes CASD-Teralab et Teralab-IMT sont à votre disposition :

  • si vous souhaitez expérimenter ces nouvelles technologies sur vos données
  • si vous souhaitez travailler sur les données d’un partenaire et que vous souhaitez apporter des garanties concernant la sécurité des données. Nous pouvons apporter des réponses dans ce cas en tant que tiers de confiance

N’hésitez pas à nous contacter service@casd.eu