Webinaire CASD DATA TECH – GeoParquet et Apache Sedona : stockage et traitement des données géolocalisées

 

Le CASD organise le 25 novembre 2025, de 11h à 12h un webinaire sur des technologies dédiées aux traitements à grandes échelles de données spatiales : nous enverrons le lien pour s’inscrire dans notre prochaine newsletter.

Il sera présenté Apache Sedona qui étend les possibilités d’Apache Spark (et également Apache Flink et Snowflake) au traitement de données spatiales à grande échelle. Il fournit des ensembles de données spatiales distribuées et un moteur de requêtes SQL spatiales qui chargent, traitent et analysent efficacement des données spatiales à grande échelle sur une ou plusieurs machines.

GeoParquet est une extension d’Apache Parquet conçue pour stocker des données vectorielles géospatiales (points, lignes, polygones) dans un format compressé, riche en métadonnées et organisé en colonnes. Il est déjà pris en charge par de nombreux outils (par exemple Apache Sedona, GeoPandas, QGIS, DuckDB, Kepler GL, etc.)