众所周知,like字符串匹配时存在%a会使索引时效,所以应避免出现,如果真的无法避免,则用以下方法:
Oracle
1、使用 select * from t where instr(name,'a')>0; 来代替 select * from t where name like '%a%'; 虽然有所提升,但是还是不快(曾经有人说使用contains,我尝试后结果得不到想要的结果集,我就放弃了,还有说使用全文索引的,这个应该可以,有待学习~下面的Mysql转载的内容就是利用了全文索引)
2、使用 select * from t where reverse(name)like reverse('%a'); 来代替 select * from t where name like '%a'; ,这样索引就有效了。(需要建立反向索引 create index test_like_name_reverse_index on t(reverse(name)); )
MySql
以下内容为转载~
问题:mysql like %XXX%使得数据库引擎不能使用索引,而导致select查询缓慢。200M的表select like需要1s左右,这是实时性要求高的服务器承受不了的。
解决方法:首先google一通发现,都在说like很难优化,一般都是采用开源插件分词+全文索引。然后再搜索,又搜索到了clucene,研究了下clucene,发现用它的人都是重新实现的分词模块,这样如果不实现中文分词模块,clucene的作用也不大。如果搜索的字符串长度不大的话,比如是搜索文章标题,那么自己来实现分词模块也不是很难。下面的方法就是针对这类需求而实现的。
基本原理是:把mysql配置文件中的ft_min_word_len=3改为1。(没有这项就直接添加),然后新建一个字段来保持分词结果,给这个字段建立全文索引。然后实现一个分词模块,把词语“大家好”拆分为“大 大家 大家好 家 家好 好”。然后用match .. against 来代替like %%,查询出来的结果跟like的结果基本相同(如果分词合理的话),但是效率比like高至少10倍以上。
具体实现见:
http://www.xiaoyatou.net/gitweb/?p=libyt.git;a=blob;f=luaTest/SplitWords.h;h=8d10daf10484b48d0534547ec15c295d82de2a79;hb=HEAD