自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

夏天小厨的博客

追求完美的厨子

12月 11月 10月

原创 kylin使用出现的坑(一)——java.net.UnknownHostException: XXXX;invalid IPv6 address

异常Kylin在启动之后报一下错误：java.net.UnknownHostException: 192.168.83.131:2181: invalid IPv6 address，具体如下图所示这是由于端口号2181在zk connectString里写了两遍，从而造成了master:2181:2181的情况。cd /usr/hbase/conf vi hbase-site...

2018-12-25 12:53:27 15824

原创 Kylin2.5.0安装部署及样例sample.sh

由于Kylin本身只是一个Server，所以安装部署还是比较简单的。但是不得不说Kylin对各个协作系统的版本要求还是比较高的。最新官网kylin v2.5版本的要求各个软件版本为OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+（本文用的是：CentOS 7） Hadoop: 2.7+, 3.1+（本文：2.8.5） Hive: 0.13 - 1....

2018-12-25 12:43:19 1602 1

原创 Flume+Kafka整合案例实现

一、为什么要集成Flume和Kafka我们很多人在在使用Flume和kafka时，都会问一句为什么要将Flume和Kafka集成？那首先就应该明白业务需求，一般使用Flume+Kafka架构都是希望完成实时流式的日志处理，后面再连接上Flink/Storm/Spark Streaming等流式实时处理技术，从而完成日志实时解析的目标。第一、如果Flume直接对接实时计算框架，当数据采集速...

2018-12-17 11:23:34 22347 6

原创 Flume+HDFS实战及遇到的坑

《Flume Source组件实战—Avro、Spool、Exec（详细图文）》一文中，我们介绍了集中不同的Source 组件的使用方式，Source监控取到的数据大多数都是通过LoggerSink输出Cli端界面上，并没有将这些数据真正下沉落地，那么这里LoggerSink记录INFO级别的日志，一般多数用来进行系统调试。在本文中，我们将着重介绍在生产环境中常用的sink组件：HDFS Sink...

2018-12-13 16:20:04 10478 1

原创 Flume Source组件实战—Avro、Spool、Exec（详细图文）

在Flume原理剖析和安装部署章节，我们最后提到NetCat Source的实例，实现了监听一个指定的网络端口，只要在应用程序向这个端口里面写数据，这个NetCat Source组件就能获取到信息。本章内容继续讲解Flume Source的其他几个常用组件，Avro Source、Spool Source、Exec Source，后两者是属于自动监控读取文件的source组件。因为本文只测试Sou...

2018-12-11 17:03:07 6493

原创 Flume1.8.0原理解析及安装部署

Flume是数据收集/聚合/传输的组件，也是我们生产环境中常用的日志收集传输系统，常用的一种日志实时处理架构就是Flume+Kafka+Storm/Flink+HDFS，这些实时系统的集成日后我们会提及到。一背景简介：Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，2009年贡献给Apache并成为顶级项目。Flume支持在日志系统中定...

2018-12-10 20:47:22 815

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除