Hive分桶表 概述: 分桶表也叫桶表,是一种用于优化查询而设计的表类型 分桶表对应的数据文件在底层会被分解为若干个小部分 在分桶时,要指定根据哪个字段将数据分为几桶(几个部分) 分桶规则: 分桶表的创建: 分桶表数据的加载: 分桶表优势: 1、减少全表查询 2、JOIN时可以提高效率,减少笛卡尔积数量 3、提高抽样的效率