SqlServer join和in的查询效率区别

之前做过一个下面的操作

select Id1 from table1 where id1 in (1,2,3,4,5...)

其中括号中的数组大概有1w+的量级。执行数据库语句的过程中出现了超过30s的command操作。后来换成了join查询,效率大幅度提升。

接下来比较一个in查询和join查询的区别。

  • in操作 :确定给定的值是否与子查询或列表中的值相匹配。in在查询的时候,首先查询子查询的表,然后将内表和外表做一个笛卡尔积,然后按照条件进行筛选。所以相对内表比较小的时候,in的速度较快。但是图上已经到万级别,所以不建议用,可是即使如此,table1是有索引的,按照table1是百万级的话,log(10000)*10000,也就是百万级的查询,对于sqlserver来说不是问题。但是我查询了30s,这就有问题了。稍等,我们详细分析,先来看看join查询。
  • join操作:join有三种处理方法。
    • nested loops join:嵌套join,时间复杂度是O(m*N),sqlserver在遇到万级的表时不会选择这个。
    • Merge join:合并join,时间复杂度是O(m+n),类似于归并排序的原理,在关联的属性是有序的条件下,合并的效率最高。
    • hash join:时间复杂度是O(m+n),以其中一张表的关联列为主键,建立临时hash表,另外一张表和hash进行匹配。这种hash临时表存储在内存中,比较消耗内存。
  • 对比之下,能用join的基本不要去用嵌套。
  • 但是回到最开始的问题,百万量级本应很快,慢的原因是什么呢?原因是在in 后面直接加的数组列表,没有在表中select出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值