- Receiver方式
这种方式是在executor上启动一个receiver进程,固定时间间隔拉取一定的数据到内存中,再进行计算,这样会导致内存溢出,随着发展,当数据量到达一定的阀值会save data to WAL也就是会写入磁盘中。Receive方式会自动保存offset到zk中,
- Direct方式
直接连接到kafka的分区上,效率高,不会自动维护偏移量,需要自己维护偏移量offset
sparkstreaming+kafka教程与实战
最新推荐文章于 2023-02-27 20:58:08 发布