自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呼呼的小窝

笨鸟先飞

  • 博客(6)
  • 资源 (6)
  • 收藏
  • 关注

原创 Spark累加器剖析(2) —— 累加器执行的过程

Spark累加器系列文章: Spark累加器剖析(1) —— 介绍 & 重点类 & 源码解析综述Driver端 Driver端初始化构建Accumulator并初始化 同时完成了Accumulator注册:Accumulators.register(this) 同时Accumulator会在序列化后发送到Executor端Driver接收到ResultTas...

2018-07-29 17:30:19 4235

原创 Spark累加器剖析(1) —— 介绍 & 重点类 & 源码解析

由于最近在项目中需要用到Spark的累加器,同时需要自己去自定义实现Spark的累加器,从而满足生产上的需求。对此,对Spark的累加器实现机制进行了追踪学习。 本系列文章,将从以下几个方面入手,对Spark累加器进行剖析:Spark累加器的基本概念累加器的重点类构成累加器的源码解析累加器的源码解析累加器使用中的坑自定义累加器的实现参考文章:累加器实现机制及自定义累加...

2018-07-28 01:15:33 3459

原创 Flume收集log到HDFS(雏形)

Flume系列文章: Flume 概述 & 架构 & 组件介绍 Flume 使用入门 & 入门Demo在本篇文章中,将继续介绍Flume的使用Flume的使用场景监控某个文件,并把新增的内容输出到HDFS(这是离线处理的典型的一个场景) Agent的技术选型,该如何选择?在这里我们的选择如下:exec sourcememory channel...

2018-07-22 00:28:45 1773

原创 HBase Shell & Java API

HBase Shellhelp命令查看帮助:hbase(main):001:0> help 'status'Show cluster status. Can be 'summary', 'simple', 'detailed', or 'replication'. Thedefault is 'summary'. Examples: hbase> status...

2018-07-21 23:41:03 959

原创 HBase读写流程 & 模块协作

HBase写流程假如说我们要插入一条数据到某个表里面,会经历的过程如下图: 概述Client会先访问zookeeper,得到对应的RegionServer地址Client对RegionServer发起写请求,RegionServer接受数据写入内存当MemStore的大小达到一定的值后,flush到StoreFile并存储到HDFS详细流程Client首先会去访问Z...

2018-07-21 23:24:24 964

原创 HBase简介 & 数据存储模型 & 对比RDBMS & 基础架构 & 环境部署

HBase简介及其在大数据生态圈的位置HBase简介HBase是一个分布式的、面向列的开源数据库来源于google的Bigtable HBase在Hadoop之上提供了类似于Bigtable的能力(是基于Hadoop的HDFS进行存储)HBase不同于一般的关系数据库,它适合非结构化数据存储Bigtable是什么 Bigtable是压缩的、高性能的、高可扩展性的、基于Googl...

2018-07-21 23:13:27 2061

CDH5.10.0离线安装部署文档

CDH 5.10.0 离线安装部署文档 使用了青云的3台云主机 安装的服务有HDFS、YARN 与 ZooKeeper

2017-10-05

CDH5.10.0离线安装

CDH5.10.0离线安装部署 使用了青云的三台云主机 安装的服务有:HDFS、YARN与ZooKeeper

2017-10-05

MapReduce Job集群提交过程源码跟踪及分析

MapReduce Job集群提交过程源码跟踪及分析

2017-08-26

MapReduce Job本地提交过程源码跟踪及分析

MapReduce Job本地提交过程源码跟踪及分析

2017-06-08

sequencefile&mapfile代码

sequencefile&mapfile相关测试代码

2017-05-01

hadoop2.7.3 自定义实现机架感知(Java版本)

博客Hadoop机架感知配置自主实现的jar包 http://blog.csdn.net/lemonZhaoTao/article/details/70991813

2017-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除