分桶抽样查询 对于非常大的数据集,需要使用的是具有代表性的查询结果而不是全部。Hive可以通过对表进行`分桶抽样·来满足这个需求。 查询表stu_buck中的数据 hive (stu)> select * from stu_buck tablesample(bucket 1 out of 4 on id); tablesample tablesample是抽样语句 语法: TABLESAMPLE(BUCKET x OUT OF y) 含义 x表示从哪个bucket开始抽取; y必须是table总bucket数的倍数或者因