使用from中的子查询来优化join


  1. CREATE
     TABLE `fact` (
  2.   `i` int(10) UNSIGNED NOT NULL,
  3.   `val` int(10) UNSIGNED NOT NULL,
  4.   KEY `i` (`i`,`val`)
  5. )
  6.  
  7. CREATE TABLE `dim` (
  8.   `id` int(10) UNSIGNED NOT NULL AUTO_INCREMENT,
  9.   `pad` varchar(100) NOT NULL,
  10.   PRIMARY KEY  (`id`)
  11. )
a)SELECT count(*) FROM dim
30720
b)SELECT count(*) FROM fact
7340032
c)SELECT count(*) FROM fact WHERE i<10000
733444
d)SELECT count(*) FROM fact LEFT JOIN dim ON val=id WHERE i<10000
733444
以下查询哪个更快?

 

(1)SELECT i,pad FROM fact LEFT JOIN dim ON val=id WHERE i<10000 LIMIT 500000,10;

(2)SELECT i,pad FROM (SELECT i,val FROM fact WHERE i<10000 LIMIT 500000,10) res LEFT JOIN dim ON val=id;

 

第一个查询:从fact表中得到i<10000的行,再和dim进行连接;连接后,从第500000行起取10行(相当于最多7340032+733444*30720行要被扫描)

第二个查询:从fact表中得到i<10000的行,从第500000行起取10行;再和dim表进行连接(相当于最多7340032+10*30000行要被扫描)

 

显然第二个查询更快,那么第二个查询和第一个查询的结果相等吗?

由于上述c和d查询返回的行数相同,说明fact表中的每一行在dim表中都有相应的行与之对应,因此第二个查询和第一个查询是结果是相同的;因此,在上述情况下,使用第二个查询更快!

阅读更多
文章标签: join 优化 c
个人分类: 数据库
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭