数据源
从哪里读取数据,进程数据的处理
Kafka(多数)
Flume(少数):Flume可以实时采集数据,然后给Spark
TCP socket(开发测试)
数据处理
DStream#transfotmation
调用转换函数,将一个DStream转成另外一个DStream
针对不同的业务使用不同函数
企业使用最多2种统计类型函数
-实时累加统计
比如 双十一,销售订单额,订单数统计
DStream.updateStateByKey
-实时统计某时段内数据
比如:趋势分析,滴滴打车,最近10分钟路况&#