Ques:
项目中需要有模糊搜索功能
解决方案:sql like 和正则
首先想到的是使用sql的模糊搜索
查找相关的知识,得以下注意事项:
1.使用sql匹配模式,不能使用操作符=或!=,而是使用操作符LIKE或NOT LIKE;
2.使用sql匹配模式,MYSQL提供了2种通配符。%表示任意数量的任意字符(其中包括0个)_表示任意单个字符
3.使用sql匹配模式,如果匹配格式中不包含以上2种通配符中的任意一个,其查询的效果等同于=或!=
4.使用sql匹配模式,不区分大小写
实例中,如果使用like "xxx%" 则可使用到索引,但是如果前后都是模糊匹配,使用select * from tableA from content like "%xxx%" 那么索引是无法生效的。很多文章中,引入了全文索引(据说百万级才用)。也就是说,在没有索引的支持情况下,此时的like的效率是比较低的
/*******************************************************************************************************************************************************************************/
全文索引,简要说明,只有MyISAM引擎支持全文检索(full text index),查询效率高。但是有局限,不支持事务和外键。Innodb支持事务和外键,但是不支持全文检索。所以,如果需要全文检索的数据,需要使用MyISAM引擎创建表。另外,还有“无效词;分词”的相关概念。
http://www.365mini.com/page/mysql-create-fulltext-index.htm
http://www.jb51.net/article/37738.htm
http://blog.sina.com.cn/s/blog_64589b110101c31a.html
http://www.cnblogs.com/bourneli/archive/2012/08/09/2630753.html
后续再研究
/*******************************************************************************************************************************************************************************/
除了sql上的处理方案,也可以使用正则通配符的方式来处理
#查询用户名以字符 l开头的用户:^l;
SELECT * FROM user WHERE username REGEXP '^l';
#查询用户名正好是三个字符的用户:^...$;
SELECT * FROM user WHERE username REGEXP '^...$';
正则的匹配模式,很容易出现,匹配量超过预期的情况。