1. 基本命令
- 建表
--不指定表的格式
CREATE TABLE person(
id int,name string,age int);
--指定表中,字段间的格式
CREATE TABLE person(
id int,name string,age int)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
- 插入数据
INSERT INTO person(id,name,age)--id,name,age也可以省略
VALUES(1,‘Tom’,20);
- 加载磁盘上已经有的数据到表中
--建立一个person2表
CREATE TABLE person2(
id int,name string,age int)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ';
--从本地加载数据
LOAD DATA
LOCAL INPATH
'/home/hivedemo/person2'
INTO TABLE person;
- 克隆表
CREATE TABLE person3 LIKE person2;
--再克隆一个表
CREATE TABLE person4 like person2;
- 将person2表中查出的数据放入person3中。
INSERT INTO person3
SELECT * FROM person2
WHERE age > 20;
- 将person2表中查出的age>20的放入person3.
同时,person2中查出id<5的放入person4.
FROM person2--提取共同条件
INSERT INTO TABLE person3
SELECT * WHERE age>20
INSERT OVREWRITE TABLE person4
SELECT * WHERE id<5;
- 将表person2中所查到的数据放到本地磁盘
INSERT OVERWRITE LOCAL DIRECTORY
'/home/hivedata'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
SELECT * FROM person2
WHERE age > 20;
- 将表person2中所查到的数据放到HDFS中
INSERT OVERWRITE DIRECTORY
'/person'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '
SELECT * FROM person2
WHERE id <=5;
- 改表名
ALTER TABLE person3 RENAME TO man;
- 添加字段
ALTER TABLE person4
ADD COLUMNS (gender string,addr string);
2. 外部表
在HDFS中已经有数据。然后建立一个表来放数据。这个称之为外部表。
外部表被删除的时候,HDFS上的数据并不会被删除。
--创建一个外部表
CREATE EXTERNAL TABLE flows(
phone string,addr string,name string,flow int)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LOCATION DIRECTORY
'/flows';
3. 分区表
分区表的目的是实现数据分类
create table cities(id int, name string)
partitioned by (province string)
row format delimited fields terminated by ' ';