MySQL5.7自带分词搜索使用

嗨皮螃

已于 2022-11-23 17:43:57 修改

阅读量2.1k

点赞数 2

分类专栏： MySQL 文章标签：数据库 sql sqlserver

于 2021-12-09 17:32:00 首次发布

本文链接：https://blog.csdn.net/shark_pang/article/details/121834582

版权

MySQL 专栏收录该内容

18 篇文章 1 订阅

订阅专栏

如果MySQL数据库是低于5.7版本的，需要备份数据库并且更新为5.7

原理：

ngram全文解析器

ngram就是一段文字里面连续的n个字的序列。

ngram全文解析器能够对文本进行分词，每个单词是连续的n个字的序列。

例如，用ngram全文解析器对“恭喜发财”进行分词:

n=1: '恭', '喜', '发', '财' 
n=2: '恭喜', '喜发', '发财' 
n=3: '恭喜发', '喜发财' 
n=4: '恭喜发财'

准备：

MySQL 中使用全局变量 ngram_token_size 来配置 ngram 中 n 的大小，它的取值范围是1到10，默认值是 2。通常ngram_token_size设置为要查询的单词的最小字数。如果需要搜索单字，就要把ngram_token_size设置为1。在默认值是2的情况下，搜索单字是得不到任何结果的。因为中文单词最少是两个汉字，推荐使用默认值2。

在修改MySQL配置文件 my.ini 中，末尾增加一行 ngram_token_size 的参数设置：

ngram_token_size=2

创建索引：

在原有的数据库上执行命令行添加full text索引，建议通过执行SQL语句的方式执行，部分数据库工具无法正常创建full text索引

创建fulltext索引语句为：

alter table `local` add fulltext index fulltext_intro(`intro`) WITH PARSER ngram;

使用：

SELECT
   MATCH (`name`) AGAINST ('设计') AS score,
   `name`
FROM
   `local`
WHERE
   MATCH (`name`) AGAINST ('设计网站' IN NATURAL LANGUAGE MODE);

参考资料：MySQL分词

嗨皮螃

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
MySQL5.7自带分词搜索使用

如果MySQL数据库是低于5.7版本的，需要备份数据库并且更新为5.7原理：ngram全文解析器ngram就是一段文字里面连续的n个字的序列。ngram全文解析器能够对文本进行分词，每个单词是连续的n个字的序列。例如，用ngram全文解析器对“恭喜发财”进行分词:n=1: '恭', '喜', '发', '财' n=2: '恭喜', '喜发', '发财' n=3: '恭喜发', '喜发财' n=4: '恭喜发财'准备：MySQL 中使用全局变量 ngram_token_
复制链接

扫一扫

专栏目录