SparkStreaming从kafka消费数据

最新推荐文章于 2024-07-21 18:15:30 发布

BiggerData

最新推荐文章于 2024-07-21 18:15:30 发布

阅读量814

点赞数

文章标签： kafka java 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liutao3233/article/details/128086247

版权

val spark = SparkSession.builder().master("local[*]").appName("myKafka"),getOrCreate()
//5秒一个窗口
val ssc=new StreamingContext(spark.sparkContext,Seconds(5))
val kafkaParams = Map(
ConsumerConfig.BOOTSTRAP_SERVER_CONFIG->"192.168.30.182:9092",  //写自己的kafka所在虚拟机ip
ConsumerConfig.GROUP_ID_CONFIG->"cmoo1",    //消费者组
ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG->classOf[StringDeserializer].getName,
ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG->classOf[StringDeserializer].getName,
ConsumerConfig.AUTO_OFFSET_RESET_CONFIG->"earliest"
)
//从Kafka消费数据
val ds=KafkaUtils.createDirectStream(ssc,LocationStrategies.preferConsistent,
ConsumerStrategies.Subscribe[String,String](Set("mydemo"),kafkaParams)
ds.mapPartitions(itercr=>{
val lb =ListBuffer[String]()
itercr.foreach(cr=>lb.append(cr.value()))
lb.iterator
}).foreachRDD(line=>println(line.collect().mkString("\n")))
ssc.start()
ssc.awaitTermination()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SparkStreaming从kafka消费数据

SparkStreaming Kafka
复制链接

扫一扫

BiggerData CSDN认证博客专家 CSDN认证企业博客

码龄2年

44: 原创

119万+: 周排名

38万+: 总排名

3万+: 访问

: 等级

459: 积分

5: 粉丝

5: 获赞

6: 评论

27: 收藏

私信

关注

热门文章

最新评论

HDFS读写数据流程以及Block大小设置
Jason_-Jia: 确定的吗？这样的话，如果一个文件大小是1k 那么还是会在HDFS上用128M的空间去存储，想想也不可能呀，这样太浪费空间了。。只有超过128M大小才会对文件进行切割
HDFS读写数据流程以及Block大小设置
BiggerData: 实际存储是文件的大小，但是会占用128M的空间，这个128M的空间不会再存储其他东西了
HDFS读写数据流程以及Block大小设置
Jason_-Jia: 存储文件的Block Szie默认设置128M，如果文件不大不满128M也是占128M的空间，如果文件大小超过了128M，会进行数据切割，随机存储在节点上面。这句话是有问题，没有满足块大小的数据，实际存储的时候也是文件本身的大小。比如块大小是128M 文件的实际大小是64M，那么存储在linux上的文件大小也是 64M 而不是128M
HDFS读写数据流程以及Block大小设置
Jason_-Jia: 存储文件的Block Szie默认设置128M，如果文件不大不满128M也是占128M的空间，如果文件大小超过了128M，会进行数据切割，随机存储在节点上面。
Hbase的预分区
xiamuyingu: NUMREGIONS

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。