数据库查询思考

 

本帖是我自己总结所到,也是第一次发贴。即为总结,里面肯定有理解上错误的地方,希望大家指点。语言上只要不是侮辱人的就OK,谢谢大家!当然也希望大家不要太相信我所写,自己验证下好,怕误导,本人不求有功,但求无过;

数据库查询,主要是数据抽取的过程,如何抽取?根据条件,取出数据集;条件可理解为两种:

 

 

1、在数据集中进行数据过滤。语句如 A.id =condition,这种语句即为在A表(表可以理解为一个数据集)过滤出满足条件的数据子集;

 

2、对两个数据进行交/并运算。语句如A.name = B.name,这种语句即为求数据的交集。

 

sql查询语句中的表,可以理解我基础的数据集合,我们要的是从基础数据集合中通过过滤、集合运算来得到我们所需的数据集合。查询条件通常都会有多个,每个数据库均有自己的分析sql的规则,如语句

      where A.name ='test'

        AND  B.job = 'coder'

        AND  B.grade = 'A'

        AND  A.id = B.id

有的数据库也许是自上向下的解析语句,有的是自下向上解析。那解析的顺序不同有什么关系呢,它可能直接影响我们的查询效率;

以自下向上为例:假设 A表10W条数据,A.name ='test':1W;B表10W,B.job = 'coder' 5W,B.grade = 'A' 1W;

 

A.name ='test',过滤得到A表的1W条数据集,我们为他命题为“A1”

执行B.job = 'coder',那么就查询出5W条数据集(B1),再执行B.grade = 'A',那么就是在B1的数据集中过滤满足条件的子集,B表满足条件的有1W条数据,但B1现只有5W条数据,我们按照概率计算,那么B1中满足条件的可以抽取出5K条数据(B2);

注:实际多少条数据其实要看真实情况,我按概率计算,只为方便说明情况;当然有时我们遇到一些情况按概率进行猜测总比瞎猜好。



A1B2进行交集查询,即为1W5K按条件id相等进行求交集。



如果自下向上分析,第一步要进行的即为10W10W求交集(C1),然后再C1上进行数据过滤。



大家可以看到,两者的执行顺序,可以直接影响到效率。



其实整个查询过程我们可以理解为数据过滤、集合运算的过程,那么我们就可以将它理解为一种运算。就如我们计算2+5+7×4 = 5 + 7×4 + 2 两者是等价的。再结合上数据库特有的解析顺序,那么就可以得到效率更高的语句。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值