这里介绍like和全文索引两种方式
%%形式, 不进行左like和右like
1.使用like
进行模糊查询的时候,很自然的会用到like语句,通常情况下,在数据量小的时候,不容易看出查询的效率,但在数据量达到百万级,千万级的时候,查询的效率就很容易显现出来。
以百万级数据表为例
表结构
总记录数
进行模糊查询
查询时间为6.69s
查询效率低,这不是我们想要的
2.使用全文索引(Full-Text Search)
什么是全文索引
全文索引,通过建立倒排索引,可以极大的提升检索效率,解决判断字段是否包含的问题。
倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。
举个栗子
用不同的数字索引不同的句子(比如以下三句在文本中是按照0,1,2的顺序排列的)
0: I like you
1: I like you very much
2: I love you
用单词作为索引,而句子的位置作为被索引的元素,那么索引就发生了倒置:
"I": {0,1,2}
"love": {2}
"like": {0,1}
"you": {0,1,2}
如果要检索 “I love you” 这句话,那么就可以这么计算 : {0,1,2} 交集 {2} 交集 {0,1,2}
这样就清晰了
注意
在MySQL 5.6版本以前,只有MyISAM存储引擎支持全文引擎,在5.6版本中,InnoDB加入了对全文索引的支持,但是不支持中文全文索引,在5.7.6版本,MySQL内置了ngram全文解析器,用来支持亚洲语种的分词,只能用于创建 char,varchar,text 类型的列。
创建全文索引
1.创建表时添加
CREATE TABLE `articles` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`title` varchar(200) DEFAULT NULL,
`body` text,
PRIMARY KEY (`id`),
KEY `title` (`title`) USING BTREE,
FULLTEXT KEY `title_body_index` (`title`,`body`) /*!50100 WITH PARSER `ngram` */
) ENGINE=InnoDB AUTO_INCREMENT=2890001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci COMMENT='文章表';
2.给字段添加
ALTER TABLE articles ADD FULLTEXT INDEX title_body_index (title,body) WITH PARSER ngram;
使用
自然语言的全文索引(Natural Language)
在不指定搜索模式的情况下,默认模式为自然语言搜索。
SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('like' IN NATURAL LANGUAGE MODE);
等于
SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('like');
进行查询
查询时间为0.006s
布尔全文索引(Boolean)和查询扩展搜索
在本文不做说明, 有需要请百度查资料