hive简单hql整理

最新推荐文章于 2024-05-21 11:40:29 发布

chuiyandian9835

最新推荐文章于 2024-05-21 11:40:29 发布

阅读量83

点赞数

文章标签：大数据数据库

原文链接：https://my.oschina.net/u/1790925/blog/402785

版权

DDL操作：增删改数据库表和数据库(hive中ddl操作是可以操作数据库的)

DML操作：增删改数据

HIVE中特别的字段集合类型：

Strutc(first String,last String): 由first 和last 组成一个字段

Map(key,value,key,value...)：由key value 组成字段，需要指定哪个是key 哪个是value

Array(value String,value String,value String)：由平级的字段来组成

安装好hive后 (安装hive 过程不详述)输入 hive 进入hive：

进入hive后默认进入default数据库

use mydb;--使用自己创建的数据库

set hive.cli.print.currend.db=true;设置hive命令后显示数据库名

HIVE数据库相关操作

创建数据库

create database if not exists mydb

location '/my/databases'--指定数据文件存放位置。通常该位置是由hive.metastore.warehouse.dir 指定。也可以临时指定

comment 'my databases'--描述我的数据库

with dbproperties('creator' = 'pang','date' = '2015-4-15');--创建信息

查看数据库列表

show databases in mydb; --也可以show databases like 'my.*'展出以my开头的 .* 是匹配项。in mydb 是只列出mybd下的表

查看数据库信息

describe database extended mydb; --若不加extended 则只能看的到comment

删除数据库

drop database if exists financials cascade;删除数据库 cascade级联删除，如果数据库里面有表有数据需要通过级联删除才能删掉。

修改数据库

alter database mydb set dbproperties('edited-by','pang');--修改数据库信息

HIVE表相关操作

创建外部表

creat external table mytable(name String,age int)--创建外部表，用处是除了hive外的程序部件也可以使用外部表

创建表：

create table mytable(name String,age int,friends Array(String),deduction Map(String,float),address Strutc(street:String ,city:String,state:String,zip:int))

row format delimited--每一行之间用分隔符来替代

fields terminated by '\001'--域之间用 \001 来分割即 ^A

collection items terminated by '\002'--数组之间元素用 \002 来分割即 ^B

map keys terminated by '\003'--key 和 value之间用 \003 来分割即 ^C

lines terminated by '\n'--行结束用回车

stored as textfile;--以textfile 格式来存储这个数据文件.

这些特定字段分割都是缺省分隔。如果不指定创建语句下方的分隔规则，则使用该分隔规则。

复制创建新表

cteate table if not exists mydb.mytable1 like mytable;--使用mydb. 可以指定数据库

查看表描述

describe extended mydb.mytable; --mydb.mytable.name这样既可查看某个字段的描述

更改表名

alter table mytables rename to tables;

更改列名列类型

alter table mytable change columns hms hours_minutes_seconds int after severity;

添加列

alter table mytable add columns(

app_name String comment 'application name',

session_id long

)

hive不支持行级别的insert、delete、update。将数据放入表中的唯一办法是批量载入。

加载本地文件到表中对应的分区下

load data local inpath '${env:home}/california-employees' overwrite into table mytable partition(country='us')

从另外一张表查询出数据插入到表中

insert overwrite TABLE table partition (country='us') select * from mytables

创建表的同时插入数据

creat table mytable as select name,age from students where age='18'

修改某列信息

alter table mytable replace columns(

message String comment 'the rest of the message'

);

HIVE表分区

创建分区表

create table mytable(name String,age int,friends Array(String),deduction Map(String,float),address Strutc(street:String ,city:String,state:String,zip:int))

partitioned by(country String);--以国家为分区。分区关键字不一定在表字段上体现。分区表的存储会变成一个子目录里面的一系列文件

分区表查询存在一个strict模式(严格模式)概念。

set hive.mapred.mode=strict;

select e.name,e.salary from mytable e limit 100; 会报错

FAILED:ERRORin semantic analysis:No partition predicate found for alias "e" table "mytable"

set hive.mapred.mode=nonstrict; 则可以查询

但是：既然存在分区，则应该尽量使用分区来查询，不用条件乱查效率低下。

列出分区

show partitions mytable partition (country='us');列出美国分区下的表

增加分区

alter table mutables add if not exists

partition(year = 2015 ,mouth =4 ,day =1) location '2015/4/1'

partition(year = 2015 ,mouth =4 ,day =2) location '2015/4/2'

partition(year = 2015 ,mouth =4 ,day =3) location '2015/4/3'...;

可以将一根非分区表按条件批量插入到分区表中

FROM mytable mt

insert overwrite TABLE table partition (country = 'us') select * where mt.cnty = 'us'

insert overwrite TABLE table partition (country = 'china') select * where mt.cnty = 'china'

insert overwrite TABLE table partition (country = 'japan') select * where mt.cnty = 'japan';

以上分区方法是不是太累赘？没办法hive就是这么笨拙。不过也不是没有办法：动态分区插入

hive> set hive.exec.dynamic.partition=true; 动态分区插入功能开启

hive> set hive.exec.dynamic.partition.mode=nonstrict; 所有的分区都可以动态插入

hive> set hive.exec.max.dynamic.partitions.oernode=1000;某一个表最大分区数(可选设置)

然后使用动态分区插入语句:

hive>insert overwrite Table mytable

>partition(country)

>select ...,cty,st

>from table;

HIVE数据导出

hive的数据文件是明文文本，可以直接拷贝导出。

如果需要改动数据格式，也可以使用insert overwrite

insert overwrite local directory '/tmp/pang'

select name,salary,address from mytable where name like '%王%'

手动整理可能有打错的单词不要太认真！！hive更新较快语句持续更新！！

转载于:https://my.oschina.net/u/1790925/blog/402785

chuiyandian9835

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive简单hql整理

DDL操作：增删改数据库表和数据库(hive中ddl操作是可以操作数据库的) DML操作：增删改数据 HIVE中特别的字段集合类型： Strutc(first String,last String): 由first 和last 组成一个字段 Map(key,value,key,va...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。