DuckDB – 23 juin 2026

Le CASD vous donne rendez-vous pour une nouvelle session Web Data Tech dédiée à DuckDB

Il y avait eu un webinaire parquet/DuckDB qui mettait plus l’accent essentiellement sur le format parquet. Cette session essentiellement l’outil DuckDB et ses nombreuses caractéristiques qui le rendent aujourd’hui incontournable pour le traitement performant de données. Il sera notamment abordé :

– La caractéristique générale d’architecture (In process, databasefile, configurationless, vectorisation…)
– Quelques caractéristiques de syntaxe (from, negative select,…)
– Les window functions – pour les calculs par groupes de lignes (rank, lag, ,…)
– Optimisation de l’usage disque et RAM : encodage, streaming, limitation de RAM …
– Modules complémentaires (UI, spatial, parquet, S3…)
– Exemple d’usage avec R, python et julia