sql语句提升like效率

最新推荐文章于 2022-03-31 06:29:37 发布

记录点滴人生

最新推荐文章于 2022-03-31 06:29:37 发布

阅读量9.2k

点赞数

分类专栏： oracle mysql 文章标签： sql

本文链接：https://blog.csdn.net/wodatoucai/article/details/17916717

版权

oracle 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

mysql

4 篇文章 0 订阅

订阅专栏

众所周知，like字符串匹配时存在%a会使索引时效，所以应避免出现，如果真的无法避免，则用以下方法：

Oracle

1、使用 select * from t where instr(name,'a')>0; 来代替 select * from t where name like '%a%'; 虽然有所提升，但是还是不快（曾经有人说使用contains，我尝试后结果得不到想要的结果集，我就放弃了，还有说使用全文索引的，这个应该可以，有待学习~下面的Mysql转载的内容就是利用了全文索引）

2、使用 select * from t where reverse(name)like reverse('%a'); 来代替 select * from t where name like '%a'; ，这样索引就有效了。（需要建立反向索引 create index test_like_name_reverse_index on t(reverse(name)); ）

MySql

以下内容为转载~

问题：mysql like %XXX%使得数据库引擎不能使用索引，而导致select查询缓慢。200M的表select like需要1s左右，这是实时性要求高的服务器承受不了的。

解决方法：首先google一通发现，都在说like很难优化，一般都是采用开源插件分词+全文索引。然后再搜索，又搜索到了clucene，研究了下clucene，发现用它的人都是重新实现的分词模块，这样如果不实现中文分词模块，clucene的作用也不大。如果搜索的字符串长度不大的话，比如是搜索文章标题，那么自己来实现分词模块也不是很难。下面的方法就是针对这类需求而实现的。

基本原理是：把mysql配置文件中的ft_min_word_len=3改为1。（没有这项就直接添加），然后新建一个字段来保持分词结果，给这个字段建立全文索引。然后实现一个分词模块，把词语“大家好”拆分为“大大家大家好家家好好”。然后用match .. against 来代替like %%，查询出来的结果跟like的结果基本相同（如果分词合理的话），但是效率比like高至少10倍以上。

具体实现见：

http://www.xiaoyatou.net/gitweb/?p=libyt.git;a=blob;f=luaTest/SplitWords.h;h=8d10daf10484b48d0534547ec15c295d82de2a79;hb=HEAD

http://www.xiaoyatou.net/gitweb/?p=libyt.git;a=blob;f=luaTest/SplitWords.cpp;h=b3cfe13b8952eda7819bf012779e10e9ff45a12c