1.sparkstreaming不仅要从kafka读数据然后根据表的性质写数据到kafka的不同topic中
之前没搞清楚了,kafka存储的是ods层的数据
2.local[?] ?表示多少个分区,设置为*会导致资源浪费
3foreachRDD是行动算子
实时问题总结
最新推荐文章于 2022-04-14 09:52:15 发布
1.sparkstreaming不仅要从kafka读数据然后根据表的性质写数据到kafka的不同topic中
之前没搞清楚了,kafka存储的是ods层的数据
2.local[?] ?表示多少个分区,设置为*会导致资源浪费
3foreachRDD是行动算子