hive加载日志文件

chendaya

于 2013-01-28 14:15:44 发布

阅读量132

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chendaya/article/details/8548782

版权

1、首先查看该日志文件的格式

本人是初学者，因此先从最基础地开始

进入 /var/log/目录，随便打开一个日志，发现日志的格式为：

2013-01-28 09:39:40,055 INFO org.apache.hadoop.hdfs.StateChange: BLOCK* ask 12.0.8.13:50010 to delete blk_2602656880162637453_1549
2013-01-28 09:39:43,057 INFO org.apache.hadoop.hdfs.StateChange: BLOCK* ask 12.0.8.15:50010 to delete blk_-7064132219913668413_2398 blk_2602656880162637453_1549 blk_-9058423074655725391_1844

该日志的格式只有两个部分：1、时间；2、事件。用'，'分开的

2、建表，此表有两列数据，分别对应时间和事件

CREATE TABLE namenode_log ( time string, acthion string)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\,'

STORED AS TEXTFILE;

3、加载数据

LOAD DATA LOCAL INPATH '/var/log/hadoop/hadoop-root-namenode-node0.log'

OVERWRITE INTO TABLE namenode_log;

OVERWRITE的意思为重写，也就是删除表中的历史数据

4、查看数据

select * from namenode_log; 查看所有的数据，并没有启动mapreduce程序

select time from namenode_log; 查看time这一列的数据，就用到了mapreduce程序了

select * from namenode_log order by time;也动用了mapreduce程序

5.谈谈分割符

hive加载数据的时候，分割符是很重要的；

Hive 中没有定义专门的数据格式，数据格式可以由用户指定，用户定义数据格式需要指定三个属性：列分隔符（通常为空格、”\t”、”\x001″）、行分隔符（”\n”）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive加载日志文件

1、首先查看该日志文件的格式本人是初学者，因此先从最基础地开始进入 /var/log/目录，随便打开一个日志，发现日志的格式为：2013-01-28 09:39:40,055 INFO org.apache.hadoop.hdfs.StateChange: BLOCK* ask 12.0.8.13:50010 to delete blk_2602656880162637453_15
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。