题记
目前我们对大数据进行研究方向以Spark为主,其中Spark Streaming是可以接收动态数据流并进行处理,那么Spark Streaming支持多源的数据发送端,例如TCP、ZeroMQ、自然也包括Kafka,而且Kafka+SparkStreaming的技术融合也比较常用而且成熟,所以我们需要搭建一个Kafka集群进行流数据的测试。
--------------------------------------------------------------------------------------
Blog: http://blog.csdn.net/chinagissoft
QQ群:16403743
宗旨:专注于"GIS+"前沿技术的研究与交流,将云计算技术、大数据技术、容器技术、物联网与GIS进行深度融合,探讨"GIS+"技术和行业解决方案
转载说明:文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!
--------------------------------------------------------------------------------------
环境介绍
目前我们的环境还是原有的Hadoop集群和Spark集群。三台集群,一台主节点,两台子节点。
- 192.168.12.210 master
- 192.168.12.211 slave1
- 192.168.12.212 slave2
同样,