这里将使用Twitter流式数据,它符合所有所需:持续而且无止境的数据源。\
Spark Streaming
\Spark Streaming在电子书《手把手教你学习Spark》第六章有详细介绍,这里略过Streaming API的详细介绍,直接进行程序开发 。\
程序开发设置部分
\程序开发起始部分需要做好准备工作。
val config = new SparkConf().setAppName(\"twitter-stream-sentiment\")\val sc = new SparkContext(config)\sc.setLogLevel(\"WARN\")\\val ssc = new StreamingContext(sc, Seconds(5))\\System.setProperty(\"twitter4j.oauth.consumerKey\