Android SQLite的查询优化(三)

http://www.eoeandroid.com/thread-83610-1-1.html

  五、连接查询
        在返回查询结果之前,相关表的每行必须都已经连接起来,在SQLite中,这是用嵌套循环实现的,在早期版本中,最左边的是最外层循环,最右边的是最内层循环,连接两个或者更多的表时,如果有索引则放到内层循环中,也就是放到FROM最后面,因为对于前面选中的每行,找后面与之对应的行时,如果有索引则会很快,如果没有则要遍历整个表,这样效率就很低,但在新版本中,这个优化已经实现。

        优化的方法如下:
        对要查询的每个表,统计这个表上的索引信息,首先将代价赋值为SQLITE_BIG_DBL(一个系统已经定义的常量):

        1、如果没有索引,则找有没有在这个表上对rowid的查询条件:

        如果有Rowid=EXPR,如果有的话则返回对这个表代价估计,代价计为零,查询得到的记录数为1,并完成对这个表的代价估计。
        如果没有Rowid=EXPR 但有rowid IN (...),而IN是一个列表,那么记录返回记录数为IN列表中元素的个数,估计代价为NlogN,
        如果IN不是一个列表而是一个子查询结果,那么由于具体这个子查询不能确定,所以只能估计一个值,返回记录数为100,代价为200。

        如果对rowid是范围的查询,那么就估计所有符合条件的记录是总记录的三分之一,总记录估计为1000000,并且估计代价也为记录数。
        如果这个查询还要求排序,则再另外加上排序的代价NlogN
        如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

       2、如果WHERE子句中存在OR操作符,那么要把这些OR连接的所有子句分开再进行分析。

         如果有子句是由AND连接符构成,那么再把由AND连接的子句再分别分析。
         如果连接的子句的形式是X<op><expr>,那么就再分析这个子句。
         接下来就是把整个对OR操作的总代价计算出来。
         如果这个查询要求排序,则再在上面总代价上再乘上排序代价NlogN
         如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

         3、如果有索引,则统计每个表的索引信息,对于每个索引:

         先找到这个索引对应的列号,再找到对应的能用到(操作符必须为=或者是IN(…))这个索引的WHERE子句,如果没有找到,则退出对每个索引的循环,如果找到,则判断这个子句的操作符是什么,如果是=,那么没有附加的代价,如果是IN(sub-select),那么估计它附加代价inMultiplier为25,如果是IN(list),那么附加代价就是N(N为list的列数)。

         再计算总的代价和总的查询结果记录数和代价。
         nRow = pProbe->aiRowEst * inMultiplier;/*计算行数*/
         cost = nRow * estLog(inMultiplier);/*统计代价*/
         如果找不到操作符为=或者是IN(…)的子句,而是范围的查询,那么同样只好估计查询结果记录数为nRow/3,估计代价为cost/3。
         同样,如果此查询要求排序的话,再在上面的总代价上加上NlogN
         如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

         4、通过上面的优化过程,可以得到对一个表查询的总代价

         再对第二个表进行同样的操作,这样如此直到把FROM子句中所有的表都计算出各自的代价,最后取最小的,这将作为嵌套循环的最内层,依次可以得到整个嵌套循环的嵌套顺序,此时正是最优的,达到了优化的目的。

         5、所以循环的嵌套顺序不一定是与FROM子句中的顺序一致,因为在执行过程中会用索引优化来重新排列顺序。

         六、索引

        在SQLite中,有以下几种索引:
        1)    单列索引
        2)    多列索引
        3)    唯一性索引
        4)    对于声明为:INTEGER PRIMARY KEY的主键来说,这列会按默认方式排序,所以虽然在数据字典中没有对它生成索引,但它的功能就像个索引。所以如果在这个主键上在单独建立索引的话,这样既浪费空间也没有任何好处。

        运用索引的注意事项:
        1)  对于一个很小的表来说没必要建立索引
        2)  在一个表上如果经常做的是插入更新操作,那么就要节制使用索引
        3)  也不要在一个表上建立太多的索引,如果建立太多的话那么在查询的时候SQLite可能不会选择最好的来执行查询,一个解决办法就是建立聚蔟索引。

         索引的运用时机:

         1) 操作符:=、>、<、IN等
         2) 操作符BETWEEN、LIKE、OR不能用索引,
         如BETWEEN:SELECT * FROM mytable WHERE myfield BETWEEN 10 and 20;
         这时就应该将其转换成:
         SELECT * FROM mytable WHERE myfield >= 10 AND myfield <= 20;
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         再如LIKE:SELECT * FROM mytable WHERE myfield LIKE 'sql%';
         此时应该将它转换成:
         SELECT * FROM mytable WHERE myfield >= 'sql' AND myfield < 'sqm';
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         再如OR:SELECT * FROM mytable WHERE myfield = 'abc' OR myfield = 'xyz';
         此时应该将它转换成:
         SELECT * FROM mytable WHERE myfield IN ('abc', 'xyz');
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         3) 有些时候索引都是不能用的,这时就应该遍历全表(程序演示)

java代码:

  1. SELECT * FROM mytable WHERE myfield % 2 = 1;
  2. SELECT * FROM mytable WHERE substr(myfield, 0, 1) = 'w';
  3. SELECT * FROM mytable WHERE length(myfield) < 5;
复制代码

系列之Android SQLite的查询优化(一) 的帖子链接 http://www.eoeandroid.com/thread-83601-1-1.html
系列之Android SQLite的查询优化(二) 的帖子链接 http://www.eoeandroid.com/thread-83603-1-1.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值