spark针对两个RDD的算子及spark-sql

2018/04/11

提取两个RDD相同的key,看到有一个cogroup
有一个,困惑了我很久的问题,那就是,
一个是key-vaule类型的,另一个是只有key的,就是只有一个键值。那么我想得到他们key相同的。。,向上面↑转化?
你肯定是不能在转化的操作里面去查询,这是必然的,对于普通的RDD,他们的这类操作基于他们的元素,这种关系自然不能满足。
那么只能从key-value里面的RDD操作去寻找。


感觉,他针对两个RDD的算子,不够用,好多功能没办法满足。
还是说,我没有找到这个应用的路子。????
只用他的一些操作,满足不了我的要求。


是不是非要搞成数据库那种形式就会更好????


2018/04/11
下午初步使用了一下,spark-sql里面的一些函数,有很多和key-value的形式相同形式。也有一些自己的SQL语法函数在里面。


!!!!!!我觉得,得先吧我现在的困境是什么搞清楚。

2018/04/12
或者说, 他就是给出这些个原子类型的操作,让你去组合,然后得到相应的结果。

2018/04/13
看了一篇文章,好像spark-sql,使用了新的数据抽象,意思上感觉,会对一些操作有优化。
毕竟原来的直接对RDD的操作是我自己弄的,程序自己进行的话,会做一些优化。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值