HiveSQL基本操作--实战篇

本文详细介绍了HiveSQL的基本操作,包括数据类型、存储格式(如textfile, SequenceFile, RCFile, ORCFile, Parquet)、数据库与表的操作、LOAD DATA语句的使用、内置运算符以及实例应用。通过实例展示了如何创建表、加载数据、操作表属性及使用各种运算符。特别强调了Hive的存储优化和数据管理策略。" 105996286,9542406,LVS集群部署实战:NAT DR模式详解与配置,"['lvs', 'linux', '运维']
摘要由CSDN通过智能技术生成

HiveSQL基本操作

HiveSQL基本操作--实战篇

HIve

目录

  • 一、Hive数据类型
  • 1、基本类型
  • 2、复杂类型
  • 二、存储格式
  • 1、textfile
  • 2、SequenceFile
  • 3、RCFile
  • 4、ORCFile
  • 5、Parquet
  • 三、操作数据库
  • 1、创建数据库
  • 2、删除数据库
  • 3、进入数据库
  • 四、操作表属性
  • 1、显示数据库下面所有表
  • 2、删除表
  • 3、显示建表结果
  • 4、显示表分区
  • 5、修改表属性
  • 6、表重命名
  • 7、新增列
  • 8、删除列
  • 9、修改列
  • 10、删除分区
  • 11、增加分区
  • 12、修改分区、LOCATION
  • 四、创建表
  • 五、LOAD DATA语句
  • 六、hive内置运算符
  • 1、算术运算符
  • 2、逻辑运算符
  • 3、复杂运算符
  • 七、hive视图与索引
  • 八、实例
  • 1、把本地文件放在新建表中
  • 2、把hdfs文件放在新建表中
  • 3、把查询结果放在一个新建表中
  • 4、把查询结果放在本地文件中
  • 5、把查询结果放在HDFS文件中
  • 6、差集使用左右连接
  • 7、其他
  • 8、shell 运行hive
  • 九、注意

一、Hive数据类型

Hive所有数据类型分为两种:

  • 基本类型
  • 复杂类型

1、基本类型

 

2、复杂类型

 

二、存储格式

Hive会为每个创建的数据库在HDFS上创建一个目录,该数据库的表会以子目录形式存储,表中的数据会以表目录下的文件形式存储。对于default数据库,默认的缺省数据库没有自己的目录,default数据库下的表默认存放在/user/hive/warehouse目录下。

1、textfile

textfile为默认格式,存储方式为行存储。数据不做压缩,磁盘开销大,数据解析开销大。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值