最近在开发站长帮手网(www.links.cn)的百度权重查询工具,数据已达亿万级别,主表为关键词主表(包含百度指数,百度收录等字段),字表为网站排名表(1-100)的排名。根据设计惯例,查询的时候主子表通过关键词字段关联查询,查询语句如下:
select top 1000 a.word,a.queryurl,a.irank,a.title,a.baiduurl,a.itraffic1,a.itraffic2,b.ibaiduindex from zibiao a
with(nolock)
inner join zhubiao b with(nolock) on a.word=b.word
where a.queryurl='http://www.links.cn'
order by b.ibaiduindex desc,a.irank
发现速度很慢,快的时候瞬间,慢的时候长达几分钟。分析sql server的查询执行计划如下:
分析这个执行计划图,主要资源开销是在主表的聚集索引查找,应该是子表根据网址找到关键词后,再到主表中查找关键词对应的指数的这一步比较耗时。
因这2个表的更新频率非常高,以为是更新频率太快,导致索引效率降低,于是