Spark学习笔记:DStream的transformation操作概览

本文概览了Spark Streaming的DStream transformation操作,包括开发步骤:创建输入DStream,转换操作,输出操作;DStream的分类:Input,Transformed和Output;以及常见的Transformation算子。
摘要由CSDN通过智能技术生成

DStream的transformation操作概览

一.Spark Streaming开发步骤

  • 创建输入DStream,如将Flume、Kafka、HDFS和Socket等作为数据源
  • 对输入DStream进行转换操作
  • 对转换后的DStream进行输出操作,比如存储到DBMS中

二.DStream分类

  • Input DStream,是最原始最初的DStream,它是依据不同的数据源创建的,也是RDD最初诞生的地方
  • Transformed DStream,是由其他DStream通过transformation算子转换而来的DStream
  • Output DStream,是由其他DStream通过Output算子生成,它只存在于Output算子内部,并不会像Transformed DStream一样由算子返回,它是触发Job执行的关键

三.常用Transformation算子

算子 描述
map(func) 源DStream的每个元素通过函数func返回一个新的DStream
flatMap(func) 类似于map操作,不同的是每个输入元素可以被映射出0或者更多的输出元素。
filter(func) 在源DStream上选择Func函数返回
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值