自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

夏天小厨的博客

追求完美的厨子

  • 博客(6)
  • 收藏
  • 关注

原创 kylin使用出现的坑(一)——java.net.UnknownHostException: XXXX;invalid IPv6 address

异常Kylin在启动之后报一下错误:java.net.UnknownHostException: 192.168.83.131:2181: invalid IPv6 address,具体如下图所示这是由于端口号2181在zk connectString里写了两遍,从而造成了master:2181:2181的情况。cd /usr/hbase/conf    vi hbase-site...

2018-12-25 12:53:27 15824

原创 Kylin2.5.0安装部署及样例sample.sh

由于Kylin本身只是一个Server,所以安装部署还是比较简单的。但是不得不说Kylin对各个协作系统的版本要求还是比较高的。最新官网kylin v2.5版本的要求各个软件版本为OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+(本文用的是:CentOS 7) Hadoop: 2.7+, 3.1+(本文:2.8.5) Hive: 0.13 - 1....

2018-12-25 12:43:19 1602 1

原创 Flume+Kafka整合案例实现

 一、为什么要集成Flume和Kafka我们很多人在在使用Flume和kafka时,都会问一句为什么要将Flume和Kafka集成?那首先就应该明白业务需求,一般使用Flume+Kafka架构都是希望完成实时流式的日志处理,后面再连接上Flink/Storm/Spark Streaming等流式实时处理技术,从而完成日志实时解析的目标。第一、如果Flume直接对接实时计算框架,当数据采集速...

2018-12-17 11:23:34 22347 6

原创 Flume+HDFS实战及遇到的坑

《Flume Source组件实战—Avro、Spool、Exec(详细图文)》一文中,我们介绍了集中不同的Source 组件的使用方式,Source监控取到的数据大多数都是通过LoggerSink输出Cli端界面上,并没有将这些数据真正下沉落地,那么这里LoggerSink记录INFO级别的日志,一般多数用来进行系统调试。在本文中,我们将着重介绍在生产环境中常用的sink组件:HDFS Sink...

2018-12-13 16:20:04 10478 1

原创 Flume Source组件实战—Avro、Spool、Exec(详细图文)

在Flume原理剖析和安装部署章节,我们最后提到NetCat Source的实例,实现了监听一个指定的网络端口,只要在应用程序向这个端口里面写数据,这个NetCat Source组件就能获取到信息。本章内容继续讲解Flume Source的其他几个常用组件,Avro Source、Spool Source、Exec Source,后两者是属于自动监控读取文件的source组件。因为本文只测试Sou...

2018-12-11 17:03:07 6493

原创 Flume1.8.0原理解析及安装部署

Flume是数据收集/聚合/传输的组件,也是我们生产环境中常用的日志收集传输系统,常用的一种日志实时处理架构就是Flume+Kafka+Storm/Flink+HDFS,这些实时系统的集成日后我们会提及到。一  背景简介:Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,2009年贡献给Apache并成为顶级项目。Flume支持在日志系统中定...

2018-12-10 20:47:22 815

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除