1. 采用分区表
https://blog.csdn.net/qq_43546676/article/details/127534535
2. 采用分桶表
https://blog.csdn.net/qq_43546676/article/details/127541400
3. 采用物化视图代替索引
Hive索引的缺点:
- Hive构建索引的过程是通过一个MapReduce程序来实现的,而MR非常慢,最终使得查询效率反而降低。
- 每次Hive中原始数据表的数据发生更新时,索引表不会自动更新;必须手动执行一个Alter index命令来实现通过MapReduce更新索引表,导致整体性能较差,维护相对繁琐。
以上以上缺点,hive3.0版本舍弃了索引功能。但是我们可以使用物化视图代替索引提高查询效率。
https://blog.csdn.net/qq_43546676/article/details/127622478