- 博客(1)
- 资源 (1)
- 收藏
- 关注
转载 hive 抽样
在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示: 数据块抽样(tabl...
2018-12-18 17:54:45 208
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人