一、ngram and MeCab full-text parser插件
全文检索在MySQL里面很早就支持了,只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符,而对于中文来讲,显然用空格就不合适,需要针对中文语义进行分词。但从MySQL 5.7开始,MySQL内置了ngram全文检索插件,用来支持中文分词,并且对MyISAM和InnoDB引擎有效。
二、必要的参数设置
在使用中文检索分词插件ngram之前,先得在MySQL配置文件里面设置他的分词大小(默认是2),比如,[mysqld]
ngram_token_size=2
三、添加全文索引
创建表的时候添加CREATE TABLE article (
id BIGINT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body) WITH PARSER ngram
) ENGINE=InnoDB CHARACTER SET utf8mb4;
也可以修改表alter table 表名 add fulltext index 索引名(列1,列2...) with parser ngram;
四、全文搜索
1.按自然语言搜索模式查询 (默认)SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('关键词' IN NATURAL LANGUAGE MODE)
2.按布尔全文搜索模式查询
(1)匹配既有管理又有数据库的记录SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('+数据库 +管理' IN BOOLEAN MODE)
(2)匹配有数据库,但是没有管理的记录SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('+数据库 -管理' IN BOOLEAN MODE)
(3)匹配MySQL,但是把数据库的相关性降低SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('>数据库 +MySQL' IN BOOLEAN MODE)