自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呼呼的小窝

笨鸟先飞

  • 博客(3)
  • 资源 (6)
  • 收藏
  • 关注

原创 Spark Streaming与Kafka的整合

官网:http://spark.apache.org/docs/latest/streaming-kafka-integration.html从官网的介绍当中我们也可以发现,Spark Streaming有2种方式去接收kafka的数据:使用receiver去接收数据,同时使用的是kafka的high level api另外一种方式是没有使用receiver的,即direct方式,是从Sp...

2020-01-23 23:17:59 361

原创 Spark Streaming中transform算子使用详解

在实际生产中会有一种场景(最典型的就是黑名单的场景),就是需要DStream与RDD之间进行互相操作的,那么此时就需要我们借助transform算子来进行实现了官网介绍:http://spark.apache.org/docs/latest/streaming-programming-guide.html#transform-operation具体代码可见如下:/** * transfo...

2020-01-20 10:13:43 1572

原创 Spark Streaming结合redis实现state的功能

前言在前面的文章中有介绍SparkStreaming中的updateStateByKey算子,具体可见文章:park Streaming中状态算子的使用,但是使用updateStateByKey算子会存在一个问题,就是必须使用checkpoint,同时造成小文件扎堆的情况而在这篇文章中SparkStreaming中foreachRDD算子使用详解所提到的写入mysql的最佳实践中,细看也不难...

2020-01-01 19:44:30 909 1

CDH5.10.0离线安装部署文档

CDH 5.10.0 离线安装部署文档 使用了青云的3台云主机 安装的服务有HDFS、YARN 与 ZooKeeper

2017-10-05

CDH5.10.0离线安装

CDH5.10.0离线安装部署 使用了青云的三台云主机 安装的服务有:HDFS、YARN与ZooKeeper

2017-10-05

MapReduce Job集群提交过程源码跟踪及分析

MapReduce Job集群提交过程源码跟踪及分析

2017-08-26

MapReduce Job本地提交过程源码跟踪及分析

MapReduce Job本地提交过程源码跟踪及分析

2017-06-08

sequencefile&mapfile代码

sequencefile&mapfile相关测试代码

2017-05-01

hadoop2.7.3 自定义实现机架感知(Java版本)

博客Hadoop机架感知配置自主实现的jar包 http://blog.csdn.net/lemonZhaoTao/article/details/70991813

2017-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除