IA et big data : CASD-IA

Le projet CASD-IA

Le CASD dispose d’une plateforme conçue spécifiquement pour l’hébergement de projets requérant une infrastructure et des technologies IA : CASD-IA.

La plateforme CASD-IA dispose d’outils matériels ainsi que de logiciels pour répondre aux besoins des projets sur des données sensibles, que ce soit en termes de sécurité,  de stockage de données massives ou de puissance de calcul.

Nous offrons à tous nos utilisateurs une infrastructure s’appuyant sur des serveurs haute performance avec des ressources adaptables aux besoins de leurs projets. Toute la chaîne d’installation et de mise en route de clusters ainsi que la maintenance de leurs ressources logicielles sont assurées par l’équipe CASD-IA grâce à son expertise en data science, IA et big data.

 

La plateforme de services IA et big data du CASD a pour objectif d’accélérer la recherche, l’innovation et la production dans le domaine d’intelligence Artificielle et des données massives.

  • Le CASD fournit des compartiments hyper sécurisé (Bulle sécurisée via la technologie CASD).

Aspect Novateur du compartiment CASD-IA :

Le compartiment CASD-IA se distingue des solutions existantes en mettant un accent particulier sur :

  • la gestion de la sécurité : grâce à une innovation technologique brevetée,de sécurisation des données et de l’accès (la SD-Box).
  • la gestion de la confidentialité et des risques de ré-identification.
  • l’intégration des technologies de traitement de données : mllib, machine Learning, deep Learning…

La fourniture d’un niveau de sécurité très élevé et homogène permet d’offrir des possibilités de croisements de données à très fort potentiel entre les différentes plateformes sécurisées.

Le compartiment CASD-IA s’appuie sur une plateforme technique évolutive pour offrir un service ouvert à l’innovation en matière d’analytique de données.

Le caractère confidentiel des données hébergées par le CASD exige des garanties de sécurité très élevées. Celles offertes en standard par les technologies de traitement de données sont bien souvent insuffisantes pour permettre un accès extérieur sécurisé à des données confidentielles. La technologie du CASD associée à une isolation physique et logique des projets permet d’apporter une réponse qui a fait ses preuves.

Utiliser CASD-IA :

Les équipes CASD-IA sont à votre disposition :

  • si vous souhaitez expérimenter ces nouvelles technologies sur vos données
  • si vous souhaitez travailler sur les données d’un partenaire et que vous souhaitez apporter des garanties concernant la sécurité des données. Nous pouvons apporter des réponses dans ce cas en tant que tiers de confiance

N’hésitez pas à nous contacter service@casd.eu

L’offre CASD-IA

CASD-IA offre une plateforme de services personnalisés pour les calculs et les traitement de le domaine de l’IA et du big data .

Au-delà de l’infrastructure physique et logicielle, la plateforme offre un environnement complet pour les besoins en analytique. Ces services additionnels sont :

  • une équipe de support interne au projet.
  • l’expertise, les produits et les solutions des écosystèmes IA et big data tels que des fournisseurs de données, prestataires ou partenaires du projet spécialistes.

La plateforme exploitée en mode SAAS ou PAAS offre des outils et services pour les analystes de données, dédiés au traitement statistique, l’analyse ou la visualisation des données. Par exemple :

  • statistiques (Ex: R-Evolution),
  • machine learning (MLlib, MAHOUT, SPARK)
  • deep Learning (TensorFlow…)
  • généralistes (Ex: Python),
  • mining (Ex: Knime),
  • graphiques (Ex: Dataviz, R-shiny, Bokeh)
  • de façon générale l’accès à l’Appstore analytics

L’équipe support interne est composée d’experts dont la mission est d’entretenir, exploiter et faire évoluer cette plateforme. Dans une première phase, cette équipe établit les spécifications du service à partir des besoins du projet.

Utiliser CASD-IA :

Les équipes CASD-IA sont à votre disposition :

  • si vous souhaitez expérimenter ces nouvelles technologies sur vos données
  • si vous souhaitez travailler sur les données d’un partenaire et que vous souhaitez apporter des garanties concernant la sécurité des données. Nous pouvons apporter des réponses dans ce cas en tant que tiers de confiance

N’hésitez pas à nous contacter service@casd.eu

Infrastructure IA : CASD-IA

L’infrastructure IA pour répondre aux besoins les plus exigeants.

La configuration matérielle de la plateforme inclut des calculateurs physiques, des périphériques de stockage et des réseaux dont l’architecture est adaptée aux exigences de puissance de calcul et de stockage pour l’IA et le big data. Sa mise en œuvre facilite le déploiement et répond à la montée en charge progressive des projets hébergés.
Cette configuration, physiquement installée en France, est conçue pour offrir une très haute disponibilité et apporter toute la confidentialité et l’intégrité attendues par les utilisateurs et propriétaires des données.

Un compartiment ultra-sécurisé CASD-IA (technologie CASD) constitué de serveurs très hautes performances hébergés au sein d’une bulle isolée du réseau externe, accessible uniquement via le boitier SD-Box du CASD. Les serveurs au sein de ce compartiment sont connectés entre eux via une liaison réseau suffisamment dimensionnée pour les besoins de stockage et de traitements distribués. La configuration matérielle en termes de vCPU, RAM et stockage est parfaitement adaptable aux besoins des projets big data accueillis.

L’infrastructure est dimensionnée pour accueillir plusieurs centaines de téraoctets de données « brutes » (hors compression et réplication) et traiter, en batch ou en temps réel, directement en mémoire plusieurs tera-octets.

La configuration matérielle est adaptable aux besoins des projets.

Les ressources logicielles incluent principalement le middleware dédié à l’IA et au big data permettant d’accéder  de façon appropriée aux données.

Il s’agit par exemple des systèmes de bases de données NoSql (i.e. au-delà du SQL : relationnelle, colonne, clé-valeur, graphe, document…), des modèles/moteurs de parallélisation (Mapreduce, Spark), des systèmes de virtualisation, ainsi que des outils de management et monitoring. Les ressources intègrent en outre les outils collaboratifs et interfaces utilisateurs à l’état de l’art.

Ces solutions logicielles viseront à supporter des traitements batchs mais aussi temps réel pour appréhender les flux de données,  et également autoriser des sessions interactives sur les données.

Les ressources généralement mises en place par les projets s’appuyent sur Hadoop (dont les distributions Cloudera et HortonWorks), Hive, Impala, Sqoop, MongoDB, Neo4j, ElasticSearch, Parstream, ou Redis.

En matière d’outils pour l’IA, il y a des infrastructure GPUs « Up to~40k CUDA cores » adaptable pour chaque projet avec des outils comme Python, TensorFlow, MXNet, Theano, Keras, Caffe, ConvNet, PyTorch, Anaconda

Le déploiement de cette infrastructure logicielle est également incrémental pour répondre aux attentes des projets « proof of concept » et aux opportunités offertes par les nouvelles offres apparaissant à un rythme très soutenu.