spark核心组件的核心

==>Spark Streaming 的核心:

Dstream这个数据结构有三块比较重要:
父依赖
生成RDD的时间间隔
一个生成RDD的function
Dstream的概念:

       Discretized Stream是Spark Streaming的基础抽象,代表持续性的数据流和经过各种Spark算子操作后的结果数据流。DStream是一系列连续的RDD来表示。

==>Spark Sql 的核心:

DataFrame:

       dataframe是dataset的行的集合,本质是一个分布式的二维表,表:表信息

DataSet:

       Dataset是分布式数据集合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值