hive基础

最新推荐文章于 2022-10-11 16:16:56 发布

sd116460

最新推荐文章于 2022-10-11 16:16:56 发布

阅读量119

点赞数

分类专栏： Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sd116460/article/details/84942828

版权

Hive 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

非关系型数据库语言，语言逻辑与MySQL大致相似，但是要求能够更加严格一点。

hive> ALTER TABLE student1 ADD COLUMNS

> (address STRING,grade STRING);

在添加属性的时候，需要添加columns关键字（列）

•ROW FORMAT DELIMITED 行格式分隔

如果文件数据是纯文本，可以使用 STORED AS TEXTFILE。如果数据需要压缩，使用 STORED AS SEQUENCE

Distinct：查询的数据去重

LOAD DATA LOCAL INPATH '/home/hadoop/djt/user.txt' INTO TABLE group_test;

从指定位置向指定表中导入数据（保留源文件）

ORDER BY 会对输入做全局排序，因此只有一个 Reduce（多个 Reduce 无法保证全局有序）会导致当输入规模较大时，需要较长的计算时间。使用 ORDER BY 查询的时候，为了优化查询的速度，使用 hive.mapred.mode 属性。

hive.mapred.mode = nonstrict;(default value/默认值) 默认是不精确的

hive.mapred.mode=strict;

与数据库中 ORDER BY 的区别在于，在 hive.mapred.mode=strict 模式下必须指定limit ，否则执行会报错。

hive> set hive.mapred.mode=strict;

hive> select * from group_test order by uid limit 5;

在设置hive.mapred.mode为精确时，必须添加limit限制条件，否则会报错

CLUSTER BY 查询

cluster by 除了具有 distribute by 的功能外还兼具 sort by 的功能。

创建索引：

hive> create index user_index on table user(id) as 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' with deferred rebuild IN TABLE user_index_table;

创建索引，索引名称为：user_index 在user表，表的user（id）为索引

Hive关键字concat_ws:带着间隔符号的拼接，使用语法：

hive> select concat_ws(‘,’,'abc’,'def’,'gh’) from dual;

输出结果：abc,def,gh

字符串长度：length，字符串翻转：reverse，字符串拼接concat

字符串截取：substring，substr

字符串转大写：upper（string a），ucase（string a）

字符串转小写：lower(string a) ，lcase（string a)

去两侧空格函数：trim（String a）

去左侧空格ltrim 去右侧空格rtrim

个数统计：count 和统计：sum

求平均数：avg

求最大最小值：max，min

复合类型操作;

Map类型：create table map_test as select map( kay,value,kay,value) from student

Struct类型：根据输入的参数构造结构体类型

语法:

hive> create table array_test as select array('jay','liu','gang') from student;

hive> describe array_test;

hive> select array_test from array_test;

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive基础

非关系型数据库语言，语言逻辑与MySQL大致相似，但是要求能够更加严格一点。hive&gt; ALTER TABLE student1 ADD COLUMNS &gt; (address STRING,grade STRING);在添加属性的时候，需要添加columns关键字（列）•ROW FORMAT DELIMITED 行格式分隔如果文件数据是纯文本，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。