一、分桶表描述
- 分桶是将数据集分解成更容易管理的若干部分的一个技术,是比分区更为细粒度的数据范围划分。
- 在真实的大数据分析过程中,由于数据量较大,开发和自测的过程比较慢,严重影响系统的开发进度。此时就可以使用分桶来进行数据采样。采样使用的是一个具有代表性的查询结果而不是全部结果,通过对采样数据的分析,来达到快速开发和自测的目的,节省大量的研发成本。
二、分桶表的创建
-
原始分桶表
create table test_tb_f ( id int, name string, age int, gender string ) row format delimited fields terminated by

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



