[转]MSSQL、MYSQL,ACCESSl,Oracle随机读取N条记录方法

【转】http://www.eb163.com/club/thread-11767-1-1.html

 

 

随机取出n条记录:
  1. Sql server:select top n * from 表 order by newid()
  2. Access:Select top n * FROM 表 orDER BY Rnd(id) 
  3. mysql:Select * From 表 order By rand() Limit n
  4. select * from youtab where mod ( rowid , 3 ) = 0    
  5. 建议把MSSQL的联机丛书中的 Transact-SQL 参考大致看一遍,很多东西就心中有数了
  6. mysql中随机提取数据库记录
  7. -------------------------------------------------------------------------------
  8. select * from tablename order by rand() limit 10
  9. select * from tablename order by rand() limit 10
  10. sqlserver中随机提取数据库记录
  11. --------------------------------------------------------------------------------
  12. select top 10 * from tablename order by NEWID()   
  13. select top 10 * from tablename order by NEWID()
  14. Access中随机提取数据库记录
  15. -------------------------------------------------------------------------------
  16. SELECT top 10 * FROM tablename ORDER BY Rnd(FId)   
  17. SELECT top 10 * FROM tablename ORDER BY Rnd(FId)
  18. FId:为你当前表的ID字段名
  19. ==========================================================================================

Oracle取随机数据 
随机查看前N条记录(随机读取表内容)
  1. select * from (select * from tb_phone_no order by sys_guid())
  2. where rownum < 10;
  3. SELECT * FROM (SELECT * FROM chifan  ORDER BY dbms_random.random) WHERE ROWNUM<=5
  4. SQL> SELECT * FROM (SELECT * FROM A SAMPLE(0.01)) WHERE ROWNUM<=1;
  5. DT
  6. -----------------
  7. 20050105 14:59:52
  8. SQL> SELECT * FROM (SELECT * FROM A SAMPLE(0.01)) WHERE ROWNUM<=1;
  9. DT
  10. -----------------
  11. 20050306 00:43:05
  12. SQL> SELECT * FROM (SELECT * FROM A SAMPLE(0.01)) WHERE ROWNUM<=1;
  13. DT
  14. -----------------
  15. 20050406 02:59:50

注意每次取得的值都不同。

SAMPLE 是随机抽样,后面的数值是采样百分比。
我的测试表A是10万条,所以取0.01% 也就是 万分之一,这样返回记录数大约10条。
对于你的情况,你可以根据数据量来控制采样百分比。



oracle中获得某表中的随机数据记录
大数据集表随机取数据

select *
  from (select *
          from table_name sample(10)
         order by trunc(dbms_random.value(0, 1000)))
where rownum = 1;


sample(10):含义为检索表中的10%数据
从Oracle8i开始Oracle提供采样表扫描特性

Oracle访问数据的基本方法有:
1.全表扫描
2.采样表扫描

全表扫描(Full table Scan)
全表扫描返回表中所有的记录。
执行全表扫描,Oracle读表中的所有记录,考查每一行是否满足WHERE条件。Oracle顺序的读分配给该表的每一个数据块,这样全表扫描能够受益于多块读.
每个数据块Oracle只读一次.

采样表扫描(sample table scan)
采样表扫描返回表中随机采样数据。
这种访问方式需要在FROM语句中包含SAMPLE选项或者SAMPLE BLOCK选项.

SAMPLE选项:
当按行采样来执行一个采样表扫描时,Oracle从表中读取特定百分比的记录,并判断是否满足WHERE子句以返回结果。

SAMPLE BLOCK选项:
使用此选项时,Oracle读取特定百分比的BLOCK,考查结果集是否满足WHERE条件以返回满足条件的纪录.

Sample_Percent:
Sample_Percent是一个数字,定义结果集中包含记录占总记录数量的百分比。
Sample值应该在[0.000001,99.999999]之间。

1.使用SAMPLE选项
  1. SQL> select * from employee SAMPLE(30);
  2.      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO
  3. ---------- ---------- --------- ---------- --------- ---------- ---------- ----------
  4.       7369 SMITH      CLERK           7902 17-DEC-80        800                    20
  5.       7788 SCOTT      ANALYST         7566 19-APR-87       3000                    20
  6.       7839 KING       PRESIDENT            17-NOV-81       5000                    10
  7. Execution Plan
  8. ----------------------------------------------------------
  9.    0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=25 Bytes=2175)
  10.    1    0   TABLE ACCESS (SAMPLE) OF 'EMPLOYEE' (Cost=2 Card=25 Bytes=2175)
  11. Statistics
  12. ----------------------------------------------------------
  13.           0  recursive calls
  14.           0  db block gets
  15.           5  consistent gets
  16.           0  physical reads
  17.           0  redo size
  18.         880  bytes sent via SQL*Net to client
  19.         503  bytes received via SQL*Net from client
  20.           2  SQL*Net roundtrips to/from client
  21.           0  sorts (memory)
  22.           0  sorts (disk)
  23.           3  rows processed
  24. SQL> select * from employee SAMPLE(20);
  25.      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO
  26. ---------- ---------- --------- ---------- --------- ---------- ---------- ----------
  27.       7654 MARTIN     SALESMAN        7698 28-SEP-81       1250       1400         30
  28.       7844 TURNER     SALESMAN        7698 08-SEP-81       1500          0         30
  29. Execution Plan
  30. ----------------------------------------------------------
  31.    0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=16 Bytes=1392)
  32.    1    0   TABLE ACCESS (SAMPLE) OF 'EMPLOYEE' (Cost=2 Card=16 Bytes=1392)
  33. Statistics
  34. ----------------------------------------------------------
  35.           0  recursive calls
  36.           0  db block gets
  37.           5  consistent gets
  38.           0  physical reads
  39.           0  redo size
  40.         839  bytes sent via SQL*Net to client
  41.         503  bytes received via SQL*Net from client
  42.           2  SQL*Net roundtrips to/from client
  43.           0  sorts (memory)
  44.           0  sorts (disk)
  45.           2  rows processed     

2.使用SAMPLE BLOCK选项
  1. SQL> SELECT * FROM employee SAMPLE BLOCK (50); 
  2.      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO
  3. ---------- ---------- --------- ---------- --------- ---------- ---------- ----------
  4.       7369 SMITH      CLERK           7902 17-DEC-80        800                    20
  5.       7499 ALLEN      SALESMAN        7698 20-FEB-81       1600        300         30
  6.       7521 WARD       SALESMAN        7698 22-FEB-81       1250        500         30
  7.       7566 JONES      MANAGER         7839 02-APR-81       2975                    20
  8.       7654 MARTIN     SALESMAN        7698 28-SEP-81       1250       1400         30
  9.       7698 BLAKE      MANAGER         7839 01-MAY-81       2850                    30
  10.       7782 CLARK      MANAGER         7839 09-JUN-81       2450                    10
  11.       7788 SCOTT      ANALYST         7566 19-APR-87       3000                    20
  12.       7839 KING       PRESIDENT            17-NOV-81       5000                    10
  13.       7844 TURNER     SALESMAN        7698 08-SEP-81       1500          0         30
  14. 10 rows selected.
  15. Execution Plan
  16. ----------------------------------------------------------
  17.    0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=41 Bytes=3567)
  18.    1    0   TABLE ACCESS (SAMPLE) OF 'EMPLOYEE' (Cost=2 Card=41 Bytes=3567)
  19. Statistics
  20. ----------------------------------------------------------
  21.           0  recursive calls
  22.           0  db block gets
  23.           4  consistent gets
  24.           0  physical reads
  25.           0  redo size
  26.        1162  bytes sent via SQL*Net to client
  27.         503  bytes received via SQL*Net from client
  28.           2  SQL*Net roundtrips to/from client
  29.           0  sorts (memory)
  30.           0  sorts (disk)
  31.          10  rows processed
  32. SQL>

3.采样前n条记录的查询
也可以使用dbms_random包实现
  1. SQL> select * from ( 
  2.   2  select * from employee
  3.   3  order by dbms_random.value )
  4.   4  where rownum <= 4;    
  5.      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO
  6. ---------- ---------- --------- ---------- --------- ---------- ---------- ----------
  7.       7654 MARTIN     SALESMAN        7698 28-SEP-81       1250       1400         30
  8.       7839 KING       PRESIDENT            17-NOV-81       5000                    10
  9.       7369 SMITH      CLERK           7902 17-DEC-80        800                    20
  10.       7788 SCOTT      ANALYST         7566 19-APR-87       3000                    20
  11. Execution Plan
  12. ----------------------------------------------------------
  13.    0      SELECT STATEMENT Optimizer=CHOOSE
  14.    1    0   COUNT (STOPKEY)
  15.    2    1     VIEW
  16.    3    2       SORT (ORDER BY STOPKEY)
  17.    4    3         TABLE ACCESS (FULL) OF 'EMPLOYEE'
  18. Statistics
  19. ----------------------------------------------------------
  20.           0  recursive calls
  21.           0  db block gets
  22.           3  consistent gets
  23.           0  physical reads
  24.           0  redo size
  25.         927  bytes sent via SQL*Net to client
  26.         503  bytes received via SQL*Net from client
  27.           2  SQL*Net roundtrips to/from client
  28.           1  sorts (memory)
  29.           0  sorts (disk)
  30.           4  rows processed

对比一下SAMPLE选项
  1. SQL> SELECT * FROM employee SAMPLE (40); 
  2.      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO
  3. ---------- ---------- --------- ---------- --------- ---------- ---------- ----------
  4.       7499 ALLEN      SALESMAN        7698 20-FEB-81       1600        300         30
  5.       7521 WARD       SALESMAN        7698 22-FEB-81       1250        500         30
  6.       7698 BLAKE      MANAGER         7839 01-MAY-81       2850                    30
  7.       7839 KING       PRESIDENT            17-NOV-81       5000                    10
  8.       7844 TURNER     SALESMAN        7698 08-SEP-81       1500          0         30
  9. Execution Plan
  10. ----------------------------------------------------------
  11.    0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=33 Bytes=2871)
  12.    1    0   TABLE ACCESS (SAMPLE) OF 'EMPLOYEE' (Cost=2 Card=33 Bytes=2871)
  13. Statistics
  14. ----------------------------------------------------------
  15.           0  recursive calls
  16.           0  db block gets
  17.           5  consistent gets
  18.           0  physical reads
  19.           0  redo size
  20.         961  bytes sent via SQL*Net to client
  21.         503  bytes received via SQL*Net from client
  22.           2  SQL*Net roundtrips to/from client
  23.           0  sorts (memory)
  24.           0  sorts (disk)
  25.           5  rows processed
  26. SQL>

主要注意以下几点:

1.sample只对单表生效,不能用于表连接和远程表
2.sample会使SQL自动使用CBO 

Oracle 随机获取N条数据
    当我们获取数据时,可能会有这样的需求,即每次从表中获取数据时,是随机获取一定的记录,而不是每次都获取一样的数据,这时我们可以采取Oracle内部一些函数,来达到这样的目的
1) select * from (select * from tablename order by sys_guid()) where rownum < N; 
2) select * from (select * from tablename order by dbms_random.value) where rownum< N; 
3) select *  from (select * from table_name sample(10)   order by trunc(dbms_random.value(0, 1000)))  where rownum < N;

说明: 
  sample(10)含义为检索表中的10%数据,sample值应该在[0.000001,99.999999]之间,其中 sys_guid() 和 dbms_random.value都是内部函数,通过这样的方法,就可以实现我们的需求了.

注:
  在使1)方法时,即使用sys_guid() 这种方法时,有时会获取到相同的记录,即和前一次查询的结果集是一样的,我查找了相关资料,有些说是和操作系统有关,在windows平台下正常,获取到的数据是随机的,而在linux等平台下始终是相同不变的数据集,有些说是因为sys_guid()函数本身的问题,即sys_guid()会在查询上生成一个16字节的全局唯一标识符,这个标识符在绝大部分平台上由一个宿主标识符和进程或进程的线程标识符组成,这就是说,它很可能是随机的,但是并不表示一定是百分之百的这样.
      
  所以,为确保在不同的平台每次读取的数据都是随机的,我们大多采用2)和3)两种方案,其中2)方案更常用.3)方案缩小了查询的范围,在查询大表,且要提取数据不是很不多的情况下,会对查询速度上有一定的提高,

另:在Oracle中一般获取随机数的方法是:
select trunc(dbms_random.value(0, 1000)) from dual; (0-1000的整数)
select dbms_random.value(0, 1000) from dual; (0-1000的浮点数)

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值