数值RDD的统计操作

最新推荐文章于 2022-06-20 16:32:10 发布

liangzelei

最新推荐文章于 2022-06-20 16:32:10 发布

阅读量3.8k

点赞数 2

分类专栏： scala spark Linux 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liangzelei/article/details/80573015

版权

大数据同时被 3 个专栏收录

45 篇文章 0 订阅

订阅专栏

34 篇文章 0 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

Spark 对包含数值数据的 RDD 提供了一些描述性的统计操作。 Spark 的数值操作是通过流式算法实现的，允许以每次一个元素的方式构建出模型。这些统计数据都会在调用 stats() 时通过一次遍历数据计算出来，并以StatsCounter 对象返回。

方法	含义
count()	RDD中的元素个数
mean()	元素的平均值
sum()	总和
max()	最大值
min()	最小值
variance()	元素的方差
sampleVariance()	从采样中计算出方差
stdev()	标准差
sampleStdev()	采样的标准差

举例如下：

scala> var rdd1 = sc.makeRDD(1 to 100)
rdd1: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[42] at
makeRDD at <console>:32
scala> rdd1.sum()
res34: Double = 5050.0
scala> rdd1.max()
res35: Int = 100

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数值RDD的统计操作

Spark 对包含数值数据的 RDD 提供了一些描述性的统计操作。 Spark 的数值操作是通过流式算法实现的，允许以每次一个元素的方式构建出模型。这些统计数据都会在调用 stats() 时通过一次遍历数据计算出来，并以StatsCounter 对象返回。方法含义count()RDD中的元素个数mean()元素的平均值sum()总和max()最大值min()最小值variance()...
复制链接

扫一扫

专栏目录

liangzelei CSDN认证博客专家 CSDN认证企业博客

码龄15年

92: 原创

10万+: 周排名

46万+: 总排名

32万+: 访问

: 等级

3100: 积分

31: 粉丝

67: 获赞

20: 评论

193: 收藏

私信

关注

热门文章

分类专栏

spring 1篇
Mybatis 1篇
vue 2篇
React Native 2篇
NodeJS 6篇
React 5篇
express 1篇
VMware 2篇
Linux 34篇
大数据 45篇
hive 14篇
mysql 5篇
zookeeper 6篇
flume 4篇
hbase 7篇
sqoop 3篇
kafka 6篇
IDE 3篇
scala 21篇
spark 19篇
maven 7篇
java 14篇
Elasticsearch 5篇
storm 3篇
redis 1篇
flash 1篇
数据结构和算法
log4j 1篇
php 1篇
scratch

最新评论

查看hdfs的fsimage和editlog
东方球败: 思考：同步使用http，而不是RPC，为什么呢？----因为RPC兼容性不好吗？这样Http兼容性好，方便SNN替换为别的组件？
Hadoop cdh版本搭建
qq_53106919: 请问Cm/CHD下载怎么下载需要账号和密码？账号和密码是什么呀
Hadoop cdh版本搭建
qq_53106919: CM
Eclipse各版本代号一览表以及官网上有很多版本的eclipse的比较
JauneChing0715: 有plugin的详细说明和获取方式吗？不要eclipse在线下载的那种，不知道怎么找到对应版本的插件，请教一下
Hadoop cdh版本搭建
Tisfy: 十分完美，正如：望天王降诏，早招安，心方足。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。