Hive是基于Hadoop生态的一个重要组件,是对数据仓库进行管理和分析数据的工具。她提供了SQL查询方式来分析存储在HDFS分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能。
这种SQL就是Hive SQL,她可以将SQL语句转换为Map Reduce任务运行,通过特殊的SQL去查询分析需要的内容,使不熟悉map reduce的用户很方便的利用SQL 语言查询,汇总,分析数据。
一、基础命令
1、数据库操作
- show databases; # 查看某个数据库
- use 数据库; # 进入某个数据库
- show tables; # 展示所有表
- desc 表名; # 显示表结构
- show partitions 表名; # 显示表名分区
- show create table_name; # 显示创建表的结构
2、表结构修改
- use xxdb; create table xxx; # 内部表
- create table xxx like xxx; # 创建一个表,结构与其他一样
- use xxdb; create external table xxx; # 外部表
- use xxdb; create external table xxx (l int) partitoned by (d string); # 分区表
- alter table table_name set TBLPROPROTIES ('EXTERNAL'='TRUE'); # 内部表转外部表
- alter table table_name set TBLPROPROTIES ('EXTERNAL'='FALSE');# 外部表转内部表
3、字段类型