- 博客(4)
- 资源 (26)
- 收藏
- 关注
转载 hive分析nginx日志之UDF清洗数据
接着来看:1、首先编写UDF,如下:--使用String类型的replaceAll()函数:package net.dbking.hadoop.chavin_hive;import org.apache.hadoop.hive.ql.exec.UDF;import org.apache.hadoop.io.Text;public class RemoveQu
2017-12-31 16:15:03 595
转载 hive中创建子表并插入数据过程初始化MR报错解决方法
本文继成上一篇通过hive分析nginx日志文章,详情参考下面链接:http://www.cnblogs.com/wcwen1990/p/7066230.html 接着来: 创建业务子表:drop table if exists chavin.nginx_access_log_comm;create table if not exists cha
2017-12-31 16:14:01 1141
转载 使用hive分析nginx访问日志方法
以下案例是使用hive分析nginx的访问日志案例,其中字段分隔通过正则表达式匹配,具体步骤如下:日志格式:192.168.5.139 - - [08/Jun/2017:17:09:12 +0800] "GET //oportal/static/ui/layer/skin/default/icon.png HTTP/1.1" 200 9905 http://192.168.100.12
2017-12-31 16:12:11 518
转载 Flume-1.4.0和Hbase-0.96.0整合
最近由于项目需要把Flume收集到的日志信息插入到Hbase中,由于第一次接触这些,在整合的过程中,我遇到了许多问题,我相信很多人也应该会遇到这些问题的,于是我把整个整合的过程写出来,希望给那些同样遇到这样问题的朋友帮助。 在使用Flume的时候,请确保你电脑里面已经搭建好Hadoop、Hbase、Zookeeper以及Flume。本文将以最新版的Hadoop-2.2.0、Hbase-0
2017-12-31 11:18:55 291
深入理解Java虚拟机:JVM高级特性与最佳实践].周志明.高清扫描版.pdf
2017-01-09
高性能的socket通讯服务器(完成端口模型--IOCP)
2014-06-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人