- 博客(2)
- 收藏
- 关注
原创 Hive优化—ORCfile
Hive优化—ORC文件格式一. 基于index优化1. row group index简介:ORC文件中每一个 Stripe 会分成多个 row group , 并保存每个 group 的统计信息,配置orc.create.index = true 开启生成索引配置orc.row.index.stride = 10000 设置每个 group 的行数- 设置太小,会产生大量的统计信...
2020-03-14 23:32:24 494
转载 Hive优化——ORCFile简介
Hive优化——ORCFile简介一、ORC文件格式简介The Optimized Row Columnar (ORC) file format provides a highly efficient way to store Hive data. It was designed to overcome limitations of the other Hive file formats. U...
2020-03-14 23:12:11 387
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人