Hive创建外部表
1. 环境需求:
Hadoop-2.6.0
Hive-1.2.1
Hue-3.7.0
2. 开发过程:
1) 创建hdfs目录
hadoop dfs -mkdir /wy/input
2) 上传本地数据到hdfs中
hadoop dfs –put/usr/wy/writing.txt /wy/input
注:外部表指在表结构创建以前,数据已经保存在hdfs中了,通过创建表结构,将数据格式化到表的结构里。
3) 创建外部表
create externaltable wxeventmenuclick (ToUserName varchar(255), FromUserName varchar(255),CreateTime varchar(255), MsgType varchar(255), Event varchar(255), EventKeyvarchar(255))row format delimited fields terminated by '\|' STORED AS TEXTFILElocation '/wy/wxeventmenuclick' ;
注:
[ROW FORMATDELIMITED]关键字,是用来设置创建的表在加载数据的时候,支持的列分隔符;
[STORED ASfile_format]关键字是用来设置加载数据的数据类型。Hive本身支持的文件格式只有:Text File,Sequence File。如果文件数据是纯文本,可以使用 [STORED ASTEXTFILE]。如果数据需要压缩,使用 [STORED AS SEQUENCE] 。通常情况,只要不需要保存序列化的对象,我们默认采用
[STORED ASTEXTFILE]。
[LOCATION]指定hdfs路径
4)hue查看表数据