2018/04/11
提取两个RDD相同的key,看到有一个cogroup
。
有一个,困惑了我很久的问题,那就是,
一个是key-vaule类型的,另一个是只有key的,就是只有一个键值。那么我想得到他们key相同的。。,向上面↑转化?
你肯定是不能在转化的操作里面去查询,这是必然的,对于普通的RDD,他们的这类操作基于他们的元素,这种关系自然不能满足。
那么只能从key-value里面的RDD操作去寻找。
感觉,他针对两个RDD的算子,不够用,好多功能没办法满足。
还是说,我没有找到这个应用的路子。????
只用他的一些操作,满足不了我的要求。
是不是非要搞成数据库那种形式就会更好????
2018/04/11
下午初步使用了一下,spark-sql里面的一些函数,有很多和key-value的形式相同形式。也有一些自己的SQL语法函数在里面。
!!!!!!我觉得,得先吧我现在的困境是什么搞清楚。
2018/04/12
或者说, 他就是给出这些个原子类型的操作,让你去组合,然后得到相应的结果。
2018/04/13
看了一篇文章,好像spark-sql,使用了新的数据抽象,意思上感觉,会对一些操作有优化。
毕竟原来的直接对RDD的操作是我自己弄的,程序自己进行的话,会做一些优化。