分区在HDFS上的表现形式是一个目录, 分桶是一个单独的文件
分区: 细化数据管理,直接读对应目录,缩小mapreduce程序要扫描的数据量
分桶: 1、提高join查询的效率(用分桶字段做连接字段)
2、提高采样的效率
作者:谦卑t
来源:CSDN
原文:https://blog.csdn.net/qq_42246689/article/details/84671926
版权声明:本文为博主原创文章,转载请附上博文链接!
分区在HDFS上的表现形式是一个目录, 分桶是一个单独的文件
分区: 细化数据管理,直接读对应目录,缩小mapreduce程序要扫描的数据量
分桶: 1、提高join查询的效率(用分桶字段做连接字段)
2、提高采样的效率
作者:谦卑t
来源:CSDN
原文:https://blog.csdn.net/qq_42246689/article/details/84671926
版权声明:本文为博主原创文章,转载请附上博文链接!