DataLab sécurisé pour Proof of Concept

Le CASD propose aux entreprises et organismes publics disposant de gros volumes de données à valoriser, un environnement clés-en-mains sécurisé pour DataScientists, qui s’appuie sur l’infrastructure et les outils de Datascience modernes déployés dans le cadre de Teralab, au sein de l’espace confiné proposé par le CASD et sa technologie.

Ce DataLab peut-être mis en place notamment dans le cadre de projets expérimentaux de valorisation des données, menés en interne ou par des intervenants externes, pouvant aboutir à un ou plusieurs proofs of concepts, et permettre à une organisation d’expérimenter avant de généraliser une architecture, un outil ou encore un modèle.

Le DataScientist peut, au moyen d’une SD-Box et de sa carte d’accès biométrique accéder au DataLab afin d’y effectuer ses travaux sur les données massives pour lesquelles il a été nommément habilité. Ce DataLab s’appuie notamment sur :

  • Un environnement Windows performant
  • Un cluster Hadoop d’au moins 4 nœuds physiques, extensible facilement et rapidement
  • Une suite d’outils de datascience à jour : Spark, TensorFlow, R, Rstudio, Dataiku DataScience Studio, qGIS, Python, SAS, Stata, SPSS…
  • La mise en œuvre éventuelle de :
    • Serveur de Deep Learning (à base de processeurs graphiques)
    • Serveur OpenStreetMap dédié
    • Serveur SQL
    • Serveur TeraMemory