DStream中transform的理解误区与应用

本文介绍了DStream的transform操作,澄清了transform与Transformation的区别。transform是DStream的Transformation操作,不会立即执行,而是在每个batch间隔调用,用于执行RDD转换。错误理解包括在transform中使用action操作,但实际上transform仅支持转换操作。transform在实际应用中可用于执行随时间变化的RDD操作,如实时数据清理和关联维度数据。
摘要由CSDN通过智能技术生成

简介

DStream中的transform操作允许运行任何 RDD-to-RDD 函数。它能够被用来应用任何没在 DStream API 中提供的 RDD 操作。它和DStream其他普通的Transformation类操作的区别是可以使用所有RDD上的操作算子

而DStream中的output Operations类算子,如foreachRDD,会触发action操作生成具体的任务。

理解上的误区

transform vs Transformation

DStream上的操作也分为两大类:Transformation和Output Operations。其中transformation操作和RDD的transformation操作类似,是将DStream 输入的数据转换为另一个DStream,转换操作也是懒执行的,不会触发生成job任务。Output Operations操作是将DStream 的数据推到如数据库、文件系统等外部系统中去,从而触发生成实际的job任务。

transform是DStream的一种Transformation操作,其他DStream操作大都底层实际也是调用的transform。

transform中有RDD的action操作

transform是DStream的一种Transformation操作(实际在DStream子类的compute方法中执行),transform转换函数里是不能有关于rdd的action操作或者输出操作,有也不会执行,只能使用普通转换算子。输出操作只能在DStream的Output Operations类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值