数据仓库的分区与分桶
数据仓库的分区与分桶分区解释:将数据仓库内存储数据量大的表,按表中列值进行切片,列值一样的数据划分到一起,列值分类有多少种就至少有这么多的分区目录。如:某电商公司订单表按天分区,按订单表的下单时间在同一天的数据划分到一个目录中。分桶解释:将数据仓库内存储数据量大的表,按表中列值的hash值对想划分的桶数取模,值一样活着同样在某些范围内的数据划分到一起,划分桶数有多少就有多少分桶目录。如:某电商公司订单表按天分区下再按订单号分桶,按订单表的下单时间在同一天的数据划分到一个目录中,再将数据按订单号进行has





