前言
本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系
正文
不可以,因为 load 数据的话 HDFS 下只会有一个文件无法完成分桶的效果,分桶和 MapReduce 中的分区是一样的道理,所以我们要借助中间表导入数据。
本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系
不可以,因为 load 数据的话 HDFS 下只会有一个文件无法完成分桶的效果,分桶和 MapReduce 中的分区是一样的道理,所以我们要借助中间表导入数据。