SparkStreaming
文章平均质量分 79
疯狂的程序猿88888
忘性太大,解决的问题赶紧写博客记下来
展开
-
Spark Streaming---初步理解
总论:SparkStreaming是一个流计算引擎,它会按照时间段来计算数据,比如每一秒钟计算一次数据,它是基于时间单位的,与内容无关 数据的来源:有很多,可以是日志数据,电商数据,app等, 架构:SparkStreaming 一般是和Kafka配合使用,熟悉Kafka的朋友都知道,Kafka是会把数据放到磁盘上的,所以当SparkStreaming与Kafka配合使用的时候就会本来把基于流原创 2016-05-28 16:21:15 · 404 阅读 · 1 评论 -
SparkStreaming---WordCount程序
public class WordCountOnline { public static void main(String[] args) { /** * 第一步,配置SparkConf * 1.至少两条线程:因为SparkStreaming应用程序在运行的时候至少有一条线程用于不断的循环接收 * 数据,并且至少有一条线程用于处理接收的数据(否则的话无法有线程用于处理数据,原创 2016-05-28 18:07:30 · 477 阅读 · 0 评论 -
SparkStreaming---wordCount源码解读
从上面的程序我们看出sparkStreaming其实是将一段时间间隔的数据作为一个整体,然后这段时间内的数据就可以作为rdd来进行计算,这也是SparkStreaming的核心,这一节介绍几类,在sparkStreaming中源码的解读 1.StreamingContext:先看下官方的解释 /** * Main entry point for Spark Streaming functio原创 2016-05-29 14:34:02 · 403 阅读 · 0 评论 -
SparkStreaming0nHDFS实战
public class WordCountOnline2 { public static void main(String[] args) { final SparkConf conf=new SparkConf().setAppName("SparkStreamingOnHDFS"); final String checkpointDirectory="hdfs:///liberar原创 2016-05-29 20:23:49 · 545 阅读 · 0 评论