自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呼呼的小窝

笨鸟先飞

  • 博客(3)
  • 资源 (6)
  • 收藏
  • 关注

原创 改造CDH HDFS服务NameNode,DataNode进程的日志输出格式为Json

背景由于项目需要,需要将CDH中HDFS服务的进程的log输出格式改造成json格式,以便于后续使用Spark的处理,因此对其进行改造修改NameNode进程的日志输出格式在CDH中进行配置:log4j.appender.RFA.layout.ConversionPattern = {"time":"%d{yyyy-MM-dd HH:mm:ss,SSS}","logtyp...

2018-02-24 23:52:46 951

原创 Sqoop抽取数据到MySQL时遇到的一个坑

背景对数据进行标准的ETL流程的操作 Sqoop ==data==> Hive ETL==sqoop==> MySQLxxx.properties文件mysql_driver="jdbc:mysql://localhost:3306/ruozedata_bi"mysql_username="root"mysql_password="root"driver_...

2018-02-21 00:42:02 1792

原创 Spark RDD深入理解

通过RDDscala源码来解读什么是RDDResilient Distributed DatasetRDD通过RDDscala中的注释来解读RDD的概念RDD五大特性RDD五大特性在源码中的体现分析RDDscala分析JdbcRDDscala分析getPartitions方法分析compute方法图解RDD通过RDD.scala源码来解读什么是RDD...

2018-02-18 16:29:36 2498

CDH5.10.0离线安装部署文档

CDH 5.10.0 离线安装部署文档 使用了青云的3台云主机 安装的服务有HDFS、YARN 与 ZooKeeper

2017-10-05

CDH5.10.0离线安装

CDH5.10.0离线安装部署 使用了青云的三台云主机 安装的服务有:HDFS、YARN与ZooKeeper

2017-10-05

MapReduce Job集群提交过程源码跟踪及分析

MapReduce Job集群提交过程源码跟踪及分析

2017-08-26

MapReduce Job本地提交过程源码跟踪及分析

MapReduce Job本地提交过程源码跟踪及分析

2017-06-08

sequencefile&mapfile代码

sequencefile&mapfile相关测试代码

2017-05-01

hadoop2.7.3 自定义实现机架感知(Java版本)

博客Hadoop机架感知配置自主实现的jar包 http://blog.csdn.net/lemonZhaoTao/article/details/70991813

2017-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除