文章目录 前言一、离散流(DStream) 前言 本文主要按照官方教程理解了spark离散化数据流 一、离散流(DStream) DStream 是spark 流提供的基本抽象。表示一系列连续的数据流,可以从源文件获得,也可以从输入流转换得到。DStream是由连续的RDD表示。每个RDD包含来自某个间隔的数据。 应用于数据流的任何操作都被转换为底层RDD上的操作。对每行DStream中的每个RDD应用flatMap操作以生成字DStream的RDD。