transform操作,应用在DStream上,可以用于执行任意的RDD到RDD的转换操作。他可以用于实现,DStream API中所没有提供的操作。
案例黑名单过滤
package com.llcc.sparkSql.MyTimeSort
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.SparkConf
import org.apache.spark.streaming.Seconds
object TransformaDemo {
def main(args: Array[String]): Unit = {
val conf=new SparkConf().setMaster("local[2]").setAppName("TransformaDemo")
val ssc=new StreamingContext(conf,Seconds(5));
val fileDS=ssc.socketTextStream("192.168.32.110", 9999);
val wordcountDS=fileDS.flatMap { line => line.split("