采集样本数据

----start

    我们经常会遇到这样的情况,想看看某个表中的若干条数据,如10条、20条等。在DB2中,我们可以这么写:

 

不知道你注意到没有,以上这条语句无论你执行多少遍,结果集是不变的。那么我想每次随机的查询10条记录看看,该怎么处理呢?可以使用下面的SQL:

 

    上面是最简单的采集样本数据的方法,在DB2中,更为专业的是使用TABLESAMPLE采集样本数据。那么,为什么要采集样本数据呢?主要原因是当我们对海量数据进行分组统计时,即费时又费力,这时候,我们可以采集样本数据,然后对样本数据进行统计,以预测整体趋势。

一:语法

 

二:示例

三:采样方法

1、BERNOULLI(行级别伯努利采样):它检查每一行,准确率高,但是性能差。

2、SYSTEM(系统页级采样):它检查每一数据页(一个数据页包含若干行),性能高,但准确率差。

---更多参见:DB2 SQL 精萃

----声明:转载请注明出处。

----last updated on 2010.2.2

----written by ShangBo on 2009.9.25

----end

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值