SQL 随机抽样的总结

最新推荐文章于 2024-04-15 16:04:18 发布

lwlsky

最新推荐文章于 2024-04-15 16:04:18 发布

阅读量5.2k

点赞数

分类专栏： MS SQL 文章标签： sql system

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lwlsky/article/details/5620818

版权

MS SQL 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

对于SQL 随机抽样我们常想到的就是newid()，但如果对于一个在百万、千万甚至更大海量数据表中抽样的话，简单的newid()，其性能，效率就不是很理想了。所以在这里有必要讨论一下，择优而用。

long_goods是一个百万数据的表，Ctrl+L执行以下语句:

--id_index是我为主键加的一个非聚焦索引

SELECT top 1 * FROM long_goods order by newid()

--查询开销 43%

SELECT top 1 * FROM long_goods with(index=id_index) order by newid()

--查询开销 54%

select top 1 * from long_goods where id=(select top 1 id from long_goods order by newid())

--查询开销 1%

select top 1 * from long_goods where id=(select top 1 id from long_goods with(index=id_index) order by newid())

--查询开销 1%

虽然第三个与第四个的开销是一样，但实际应该是第四种优于第三种。

如果MS SQL2005升级到支持 TABLESAMPLE 的话，以下语句的抽样执行效率可为最优的

SELECT * FROM long_goods TABLESAMPLE SYSTEM (10 PERCENT)

呵呵..下班了，至于其中原因，下次有空再续.

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SQL 随机抽样的总结

对于SQL 随机抽样我们常想到的就是newid()，但如果对于一个在百万、千万甚至更大海量数据表中抽样的话，简单的newid()，其性能，效率就不是很理想了。所以在这里有必要讨论一下，择优而用。 long_goods是一个百万数据的表，Ctrl+L执行以下语句: --id_index是我为主键加的一个非聚焦索引SELECT top 1 * FROM long_goods or
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。