《Hive权威指南》第八章：HiveQL索引

最新推荐文章于 2021-08-15 16:21:38 发布

csyigy

最新推荐文章于 2021-08-15 16:21:38 发布

阅读量258

点赞数 1

分类专栏： Hive权威指南文章标签： hive 大数据 mapreduce hdfs

本文链接：https://blog.csdn.net/csyigy/article/details/105490324

版权

8 HiveQL：索引

Hive只有有限索引的功能。Hive中没有普通关系型数据库中键的概念，但是还是可以对一些字段建立索引来加速某些操作的。一张表的索引数据存储在另外一张表中。

当逻辑分区实际上太多太细而几乎无法使用时，建立索引也就成为分区的另一个选择。建立索引可以帮助裁剪掉一张表的一些数据块，这样能够减少MapReduce的输入数据量。并非所有的查询都可以通过建立索引获得好处。通过EXPLAIN命令可以查看某个查询语句是否用到了索引。

这里是否就感觉到索引和分区是否有相似之处，都是通过裁剪数据块来加快查询性能

Hive中的索引和关系型数据库中一样，需要仔细评估才能够使用。维护索引需要额外的存储空间，同时创建索引也需要消耗计算机资源。用户要自己做好相应的评估。

8.1 创建索引

例如下表：

CREATE TABLE employee(
	name 			STRING,
    salary			FLOAT,
    subordinates	ARRAY<STRING>,
    deductions		Map<STRING,STRING>,
    address			STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
)
PARTITIONED BY (country STRI

最低0.47元/天解锁文章

csyigy

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
《Hive权威指南》第八章：HiveQL索引

目录8 HiveQL：索引8.1 创建索引Bitmap索引8.2 重建索引8.3 显示索引8.4 删除索引8.5 实现一个定制化索引处理器8 HiveQL：索引Hive只有有限索引的功能。Hive中没有普通关系型数据库中键的概念，但是还是可以对一些字段建立索引来加速某些操作的。一张表的索引数据存储在另外一张表中。当逻辑分区实际上太多太细而几乎无法使用时，建立索引也就成为分区的另一个选择。建立...
复制链接

扫一扫

专栏目录