- 博客(1)
- 收藏
- 关注
原创 基于spark的实时流数据需跟历史数据进行对比时所遇到的问题
环境: HDP-2.3 Hadoop 2.7.1.2.3 HBase 1.1.1.2.3 Spark 1.4.1.2.3 Kafka 0.8.2.2.3 Solr 5.3.0 项目需求: 实时的流数据需要和每个用户前一个数据进行比较,得出值是否相同。 方案1: 只有一个spark streaming的任务,在该任务中,Spark streaming从Kafka中
2016-01-28 17:42:41 2170
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人