SparkStreaming
概述
Spark Streaming可以轻松构建可扩展的容错流应用程序
1)便于使用
2) 容错
3)Spark集成
计算框架
log-》flume-》kafka-》sparkStreaming-》hdfs || mysql -》hive||hbase
Dstream
数据源来源于分布式多台机器,多台计算
Dframe 属于离散数据流,在streaming中 以Dstream表示
1)创建Dstream,对Dstream处理就行
2)Dstream也是对rdd的再次封装,高级包装
rdd的程序入口:创建sparkContext
sparksql的程序入口:创建sparksession
streaming的程序入口:创建sparkContext,构造streamingContext()
范例
SparkStreaming与kafka的连接方式
1)receive
2)直连方式