自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

ghostband_的博客

08月

转载 spark streaming 读取kafka的offset

在使用Spark streaming读取kafka数据时，为了避免数据丢失，我们会在zookeeper中保存kafka的topic对应的partition的offset信息（每次执行成功后，才更新zk中的offset信息）；从而保证执行失败的下一轮，可以从特定的offset开始读。 http://blog.csdn.net/rongyongfeikai2/article/details/

2016-08-30 13:41:40 700

转载 kafka + spark streaming 架构

Kafka是一个分布式的发布-订阅式的消息系统，简单来说就是一个消息队列，好处是数据是持久化到磁盘的（本文重点不是介绍kafka，就不多说了）。Kafka的使用场景还是比较多的，比如用作异步系统间的缓冲队列。将一些数据（比如日志）写入到kafka做持久化存储，然后另一个服务消费kafka中的数据，做业务级别的分析，然后将分析结果写入HBase或者HDFS 正因

2016-08-29 16:09:25 1098

空空如也

oozie定时循环调度spark任务

2016-07-22

oozie调用shell中的问题

2016-07-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

ghostband_ CSDN认证博客专家 CSDN认证企业博客

码龄9年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

1: 原创

143万+: 周排名

168万+: 总排名

8718: 访问

: 等级

123: 积分

1: 粉丝

5: 获赞

6: 评论

2: 收藏

私信

关注

热门文章

分类专栏

spark streaming 2篇

最新评论

spark2.x写入数据到ElasticSearch5.X集群
code学习社: 请问，两套es集群，怎么用spark读取一es集群写入另一es集群
spark2.x写入数据到ElasticSearch5.X集群
Recall-MK: 谢谢，有帮助
spark2.x写入数据到ElasticSearch5.X集群
李孟聊人工智能: 有帮助
spark2.x写入数据到ElasticSearch5.X集群
awdzzzz: 你好，我想问一下，在将DataFream落地到Es上面，DF.saveToEs()这个方法，有没有办法指定DataFream里面数据存进ES的字段的类型？
spark2.x写入数据到ElasticSearch5.X集群
ghostband_: spark 写5.1.1是可以的

最新文章

提示

确定要删除当前文章？

取消删除