Parquet Orc CarbonData三种存储格式对比。
特点:
1.都有row group 的概念。没有整个列存储在一个数据结构中。而是按多少行,区分了一下。
2.carbonData 相对于其他两种加了更多的索引和统计信息。
详细内容看图:
Parquet Orc CarbonData三种存储格式对比。
特点:
1.都有row group 的概念。没有整个列存储在一个数据结构中。而是按多少行,区分了一下。
2.carbonData 相对于其他两种加了更多的索引和统计信息。
详细内容看图: