1、RDD生成:外部文件,别的RDD结果。
2、RDD是批量写,可以定位的具体读哪一行。
3、在一个数据集中,执行多种或者多次交互式查询
4、更好的支持多步骤迭代
5、MR 在迭代中必须将中间结果写入磁盘
转载于:https://www.cnblogs.com/isenhome/p/5083553.html
1、RDD生成:外部文件,别的RDD结果。
2、RDD是批量写,可以定位的具体读哪一行。
3、在一个数据集中,执行多种或者多次交互式查询
4、更好的支持多步骤迭代
5、MR 在迭代中必须将中间结果写入磁盘
转载于:https://www.cnblogs.com/isenhome/p/5083553.html