HiveSQL DDL

HiveSQL

按数据操作分类,来分别说明脚本的使用。

1.DDL

1.1建表说明
元数据:描述数据的数据
表分类:主要分内表和外表
内表:元数据和数据本身均被 hive 管理。删除表则全部删除。
外表:元数据被 hive 管理,数据本身存储在 hdfs,不受 hive 管理。删除表则只删除元数据,数据本身不变。

1.2建表模板

CREATE [external] TABLE [IF NOT EXISTS] table_name [(col_name data_type [comment col_comment], ...)] [comment table_comment]
[partitioned by (col_name data_type [comment col_comment], ...)]
[clustered by (col_name, col_name, ...)
[sorted by (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
[row format row_format] 
[stored as file_format] 
[location hdfs_path]

关键词解释
external: 创建内部表还是外部表,此为内外表的唯一区分关键字。
【有外部表;没有内部表】
comment col_comment: 给字段添加注释
comment table_comment: 给表本身添加注释
partitioned by: 按哪些字段分区,可以是一个,也可以是多个
clustered by col_name… into num_buckets BUCKETS:按哪几个字段做 hash 后分桶存储
row format:用于设定行、列、集合的分隔符等设置
row format delimited
fields terminated by ‘\t’
stored as : 用于指定存储的文件类型,如 text,rcfile 等
location : 设定该表存储的 hdfs 目录,如果不手动设定,则采用 hive 默认的存储路径

1.3示例

创建学生表student,包括 id,name,classid,classname 及分区和注释信息。

CREATE	TABLE student( 
id string comment '学号',
username string comment ' 姓 名 ', 
classid int comment ' 班 级 id', 
classname string comment '班级名称’)comment '学生信息主表'
partitioned by (come_date string comment '按入学年份分区') 
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001' 
LINES TERMINATED BY '\n'
STORED AS	textfile;

1.4命令

1.4.1查看已存在表的详细信息:

show create table
 或者 
desc tablename/desc formatted tablename

1.4.2显示所有表:

show tables;

1.4.3更改表:

alter table student rename to student2;

1.4.4增加字段:

alter table student2 add columns (age int comment "我是新增加的列");

1.4.5确认表结构。

show create table student2;

1.4.6创建视图(虚表)
视图:本身不存储实际数据,只存储表关系,使用时再去通过关系查找数据。

create view student2_view as select id,username from student2;

1.4.7删除视图

drop view student2_view;
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,那我可以为您提供一些学习Hive SQL的资源和建议。 1. 官方文档 首先,您可以参考Hive官方文档中关于Hive SQL的部分。官方文档提供了很详细的介绍和示例,可以帮助您快速入门。 链接:https://cwiki.apache.org/confluence/display/Hive/LanguageManual 2. 外部资源 除了官方文档,还有一些外部资源可以帮助您学习Hive SQL。以下是一些推荐的资源: - Hive Tutorial:这是一份比较全面的Hive教程,包括Hive SQL的基本语法、DDL、DML、函数等内容。链接:https://www.tutorialspoint.com/hive/index.htm - Hive Cheat Sheet:这是一份Hive SQL的速查表,可以帮助您快速查找Hive SQL的语法和用法。链接:https://www.edureka.co/blog/wp-content/uploads/2019/07/Hive-Cheat-Sheet.pdf - Hive Cookbook:这是一份Hive SQL的实战指南,通过一些常见的场景和问题,来帮助您深入理解Hive SQL的使用和优化。链接:https://www.oreilly.com/library/view/hive-cookbook/9781449328714/ 3. 实践项目 最后,我建议您通过实践项目来学习Hive SQL。通过实际操作,您可以更深入地了解Hive SQL的使用和优化技巧。以下是一些可以参考的实践项目: - Kaggle竞赛:Kaggle上有很多与Hive SQL相关的数据分析和数据挖掘竞赛,您可以参加这些竞赛来练习Hive SQL的使用。 - Github项目:Github上也有很多Hive SQL的开源项目,您可以参考这些项目来学习Hive SQL的最佳实践和优化技巧。 希望以上资源对您有所帮助,祝您学习愉快!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值