mysql使用全文索引实现大字段的模糊查询

0.场景说明
centos7 mysql5.7 InnoDB引擎

0.1创建表

DROP TABLE IF EXISTS `tbl_article_content`;
CREATE TABLE `tbl_article_content` (
`id` bigint(40) NOT NULL AUTO_INCREMENT,
`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
`article_id` bigint(40) NOT NULL COMMENT '对应文章ID',
`create_by` datetime(0) NOT NULL COMMENT '创建时间',
`modifield_by` datetime(0) NOT NULL COMMENT '更新时间',
PRIMARY KEY (`id`) USING BTREE,
INDEX `artid`(`article_id`) USING BTREE,
FULLTEXT INDEX `content_word`(`content`) WITH PARSER `ngram`
) ENGINE = InnoDB AUTO_INCREMENT = 4 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

SET FOREIGN_KEY_CHECKS = 1;


0.2为什么要使用索引
因为有一个全局搜索的的需求,用户输入关键字对博客系统内所有含有该字段的文章(标题&简介&内容)进行展示,(上表只是文章内容表),由于要对文章内容进行搜素,而文章内容content在数据库中是以text存储的,所以为了查询效率,这里就需要使用索引,由于是查大文本,这里选择使用全文索引(fulltext).

1.创建索引(使用ngram解析器)
create fulltext index content_word on tbl_article_content(content) WITH PARSER `ngram`;
ngram是一个支持中文索引的分词引擎,
在这里我们对tbl_article_content表的content字段建一个叫content_word的全文索引.


2.mysql配置(my.cnf)
mysql默认是没有开启与配置ngram的,所以在建立索引后对mysql进行配置
打开mysql配置文件 vim /etc/my.cnf
在[mysqld]下加入

ft_min_word_len=1 //全文索引的最小搜索长度。默认是4
ngram_token_size=1 //分词的大小设置,这里设置越小,索引越大

重启mysql
systemctl restart mysqld
进入mysql,修复一下之前创的索引
repair table tbl_article_content

 


3.查询语句
select article_id FROM tbl_article_content WHERE MATCH(content) AGAINST('没有了');

4.总结问题
从MySQL 5.7开始,MySQL内置了ngram全文检索插件,用来支持中文分词,并且对MyISAM和InnoDB引擎有效,使用的时候注意自己版本号和配置

5.相关命令

show create table tbl_article_content; //查询当前表信息
SHOW VARIABLES LIKE '%ngram%'; //查询ngram引擎配置信息

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL模糊查询不走索引的原因有几个可能的情况: 1. 模糊查询使用通配符开头:如果模糊查询的字符串以通配符开头(如 %abc),MySQL无法使用索引进行优化,因为通配符开头的模糊查询无法利用B-tree索引的前缀匹配特性。 2. 模糊查询字符串太短:如果模糊查询的字符串长度过短(比如只有几个字符),那么MySQL可能会认为全表扫描比使用索引更高效,因为索引的开销可能会超过全表扫描。 3. 字符集问题:如果模糊查询字段使用了某些特殊字符集(比如UTF8),MySQL可能无法使用索引进行匹配,因为字符集的不同会导致索引无法正确匹配查询条件。 解决这些问题的方法有几种: 1. 使用索引前缀:如果模糊查询的字符串不以通配符开头,可以尝试创建一个前缀索引,只包含字符串的前几个字符,以便利用索引的前缀匹配特性。 2. 使用全文索引MySQL提供了全文索引(Full-Text Index),可以用于处理模糊查询全文索引可以更好地处理包含通配符的模糊查询。 3. 优化查询语句:可以对查询语句进行优化,如尽量避免在模糊查询使用通配符开头的字符串,或者使用更长的匹配字符串,以提高索引的利用率。 需要注意的是,优化模糊查询的方法可能因具体情况而异,需要根据实际场景进行测试和调整。可以使用MySQL的explain语句来查看查询执行计划,以确定是否使用了索引。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值