大数据爬坑行(四)Hive的首次数据分析

在上一节,我写了个产生日志的小程序,通过flume上传到了hdfs,同时hive也安装好了,这次我们试试用hive分析一下上传的日志。

再看一看现在hdfs的情况把
在这里插入图片描述

接下来创建外部表
在这里插入图片描述

这里对得比较辛苦,创建了几次都漏了字段,可以的话还是下载个管理工具比较好。
创建成功后,就是一般的sql操作了,我比较熟悉oracle,语法上有点差别,遇到无法执行的sql查一下就是了。
where rownum<=10变成了limit 10
在这里插入图片描述
没有表头看起来不方便
set hive.cli.print.header=true;
set hive.resultset.use.unique.column.names=false;

最后分析一下今天运行中发生EC错误的传感器处于error或warn状态的设备的平均速度吧。

结束。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值