Python Spark RDD (2) 学习笔记十

10.6 RDD Key-Value基本“转换”运算
SparkRDD支持键值(Key-Value)运算,Key-Value运算也是Map/Reduce的基础。
10.6.1创建范例Key-ValueRDD
#创建范例Key-ValueRDD
kvRDD1=sc.parallelize([(3,4),(3,6),(5,6),(1,2)])
kvRDD1.collect()

#列出全部Keys值
kvRDD1.keys().collect()

#列出Values值
kvRDD1.values().collect()

10.6.2使用filter筛选key运算
#使用filter筛选key<5运算
kvRDD1.filter(lambda keyValue: keyValue[0]<5).collect()

10.6.3使用filter筛选value运算
#使用filter筛选value<5运算
kvRDD1.filter(lambda keyValue:keyValue[1]<5).collect()

10.6.4 mapValues运算
#将Value的每一个值进行平方运算
kvRDD1.mapValues(lambda x: x*x).collect()

10.6.5sortByKey从小到大按照Key排序
kvRDD1.sortByKey().collect()

sortByKey() 默认的参数ascending=True,从小到大排序
10.6.6sortByKey按照Key从大到小排序
kvRDD1.sortByKey(ascending=False).collect()

10.6.7reduceByKey
#reduceByKey
kvRDD1.reduceByKey(lambda x,y: x+y).collec

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值