Aller au contenu principal

Mode Spark - Source Parquet

Métadonnées

Les métadonnées des jeux de données Parquet sont inférées du schéma.

Types

Trevas assure la conversion entre les types Parquet et les types supportés par le moteur Trevas.

Roles

Les rôles VTL sont ajoutés par Trevas au schéma Parquet, via l'adjonction d'une métadonnée vtlRole sur chaque descriptif de champ.

Par défaut, les colonnes sans rôle dans le schéma Parquet auront pour rôle MEASURE dans Trevas.

VTL permet de faire évoluer les rôles au sein des scripts (voir ici)

Lecture

Dataset<Row> sparkDataset = spark.read().parquet("folder_path");
SparkDataset dataset = new SparkDataset(sparkDataset);

Écriture

// Trevas Spark Dataset
SparkDataset dataset = ...;

// Spark Dataset
Dataset<Row> sparkDataset = dataset.getSparkDataset();

sparkDataset.write()
.mode(SaveMode.Overwrite)
.parquet("folder_path");