数据库查询思考

最新推荐文章于 2019-01-08 19:46:46 发布

ywz84

最新推荐文章于 2019-01-08 19:46:46 发布

阅读量169

点赞数

文章标签： SQL

本帖是我自己总结所到，也是第一次发贴。即为总结，里面肯定有理解上错误的地方，希望大家指点。语言上只要不是侮辱人的就OK，谢谢大家！当然也希望大家不要太相信我所写，自己验证下好，怕误导，本人不求有功，但求无过；

数据库查询，主要是数据抽取的过程，如何抽取？根据条件，取出数据集；条件可理解为两种：

1、在数据集中进行数据过滤。语句如 A.id =condition，这种语句即为在A表（表可以理解为一个数据集）过滤出满足条件的数据子集；

2、对两个数据进行交/并运算。语句如A.name = B.name,这种语句即为求数据的交集。

sql查询语句中的表，可以理解我基础的数据集合，我们要的是从基础数据集合中通过过滤、集合运算来得到我们所需的数据集合。查询条件通常都会有多个，每个数据库均有自己的分析sql的规则，如语句

where A.name ='test'

AND B.job = 'coder'

AND B.grade = 'A'

AND A.id = B.id

有的数据库也许是自上向下的解析语句，有的是自下向上解析。那解析的顺序不同有什么关系呢，它可能直接影响我们的查询效率；

以自下向上为例：假设 A表10W条数据，A.name ='test'：1W；B表10W，B.job = 'coder' 5W，B.grade = 'A' 1W；

A.name ='test'，过滤得到A表的1W条数据集，我们为他命题为“A1”；

执行B.job = 'coder'，那么就查询出5W条数据集（B1），再执行B.grade = 'A'，那么就是在B1的数据集中过滤满足条件的子集，B表满足条件的有1W条数据，但B1现只有5W条数据，我们按照概率计算，那么B1中满足条件的可以抽取出5K条数据（B2）；

注：实际多少条数据其实要看真实情况，我按概率计算，只为方便说明情况；当然有时我们遇到一些情况按概率进行猜测总比瞎猜好。

A1与B2进行交集查询，即为1W与5K按条件id相等进行求交集。

如果自下向上分析，第一步要进行的即为10W与10W求交集（C1），然后再C1上进行数据过滤。

大家可以看到，两者的执行顺序，可以直接影响到效率。

其实整个查询过程我们可以理解为数据过滤、集合运算的过程，那么我们就可以将它理解为一种运算。就如我们计算2+5+7×4 = 5 + 7×4 + 2 两者是等价的。再结合上数据库特有的解析顺序，那么就可以得到效率更高的语句。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。