第65课:SparkSQL下Parquet深入进阶
本期内容:
1 SparkSQL下的Parquet序列化
2 SparkSQL下的Parquet源码解读
3 SparkSQL下Parquet总结
Parquet中关键概念:
1 Block
2 File
3 Column Chunk
数据按列存储时,每一列的数据被分割成多个列块。存储逻辑视图:RowGroup。每一列的列簇组合起来就叫
第65课:SparkSQL下Parquet深入进阶
本期内容:
1 SparkSQL下的Parquet序列化
2 SparkSQL下的Parquet源码解读
3 SparkSQL下Parquet总结
Parquet中关键概念:
1 Block
2 File
3 Column Chunk
数据按列存储时,每一列的数据被分割成多个列块。存储逻辑视图:RowGroup。每一列的列簇组合起来就叫