mysql 中文全文检索_MySQL中文全文检索

一、概述MySQL全文检索是利用查询关键字和查询列内容之间的相关度进行检索,可以利用全文索引来提高匹配的速度。二、语法例如:SELECT * FROM tab_name WHERE MATCH ('列名1,列名2...列名n') AGAINST('词1 词2 词3 ... 词m');即:MATCH 相当于要匹配的列,而 AGAINST 就是要找的内容。这里的table需要是MyISAM类型的表,c...
摘要由CSDN通过智能技术生成

一、概述

MySQL全文检索是利用查询关键字和查询列内容之间的相关度进行检索,可以利用全文索引来提高匹配的速度。

二、语法

例如:SELECT * FROM tab_name WHERE MATCH ('列名1,列名2...列名n') AGAINST('词1 词2 词3 ... 词m');

即:MATCH 相当于要匹配的列,而 AGAINST 就是要找的内容。

这里的table需要是MyISAM类型的表,col1、col2 必须是char、varchar或text类型,在查询之前需要在 col1 和 col2 上分别建立全文索引(FULLTEXT索引)。

三、检索方式

1、自然语言检索: IN NATURAL LANGUAGE MODE

2、布尔检索: IN BOOLEAN MODE

剔除一半匹配行以上都有的词,譬如说,每个行都有this这个字的话,那用this去查时,会找不到任何结果,这在记录条数特别多时很有用,原因是数据库认为把所有行都找出来是没有意义的,这时,this几乎被当作是stopword(中断词);但是若只有两行记录时,是啥鬼也查不出来的,因为每个字都出现50%(或以上),要避免这种状况,请用IN BOOLEAN MODE。

IN BOOLEAN MODE的特色:

·不剔除50%以上符合的row。

·不自动以相关性反向排序。

·可以对没有FULLTEXT index的字段进行搜寻,但会非常慢。

·限制最长与最短的字符串。

·套用Stopwords。

搜索语法规则:

+   一定要有(不含有该关键词的数据条均被忽略)。

-   不可以有(排除指定关键词,含有该关键词的均被忽略)。

>   提高该条匹配数据的权重值。

~   将其相关性由正转负,表示拥有该字会降低相关性(但不像 - 将之排除),只是排在较后面权重值降低。

*   万用字,不像其他语法放在前面,这个要接在字符串后面。

" " 用双引号将一段句子包起来表示要完全相符,不可拆字。

3、查询扩展检索: WITH QUERY EXPANSION

四、MySQL全文检索的条件限制

1、在MySQL5.6以下,只有MyISAM表支持全文检索。在MySQL5.6以上Innodb引擎表也提供支持全文检索。

2、相应字段建立FULLTEXT索引

五、与全文检索相关的系统变量:

ft_min_word_len = 全文检索的最小许可字符(默认4,通过 SHOW VARIABLES LIKE 'ft_min_word_len' 可查看),中文通常是两个字就是一个词,所以做中文的话需要修改这个值为2最好。

六、总结事项

1、预设搜寻是不分大小写,若要分大小写,columne 的 character set要从utf8改成utf8_bin。

2、预设 MATCH...AGAINST 是以相关性排序,由高到低。

3、MATCH(title, content)里的字段必须和FULLTEXT(title, content)里的字段一模一样。

如果只要单查title或content一个字段,那得另外再建一个 FULLTEXT(title) 或 FULLTEXT(content),也因为如此,MATCH()的字段一定不能跨table,但是另外两种搜寻方式好像可以。

4、MySQL不支持中文全文索引,原因很简单:与英文不同,中文的文字是连着一起写的,中间没有MySQL能找到分词的地方,截至目前MySQL5.6版本是如此,但是有变通的办法,就是将整句的中文分词,并按urlencode、区位码、base64、拼音等进行编码使之以“字母+数字”的方式存储于数据库中。

七、实验部分

◆ 步骤1 配置my.ini,在my.ini末尾添加如下:

# 修改全文检索的最小许可字符为2个字符或汉字 ft

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL全文检索是一种用于在文本数据中进行高效搜索的技术。在MySQL中,全文索引相关参数无法进行动态修改,只能通过修改配置文件来完成。你可以通过修改my.ini配置文件中的相关参数来调整全文检索的配置。比如,你可以通过设置innodb_ft_min_token_size和ft_min_word_len参数来修改最小搜索长度为1的配置。 在使用全文检索进行查询时,你需要使用match和against关键字。match中的列必须要与设置全文索引的列对应,而against中填写的是你要查询的内容。例如,你可以使用以下代码进行全文检索查询: SELECT * FROM emp WHERE MATCH(empName,empPass,empPhone) AGAINST('a'); 需要注意的是,全文检索主要应用于搜索引擎和大数据搜索等领域。在一般的数据库中,如小规模的数据库,通常不需要使用全文检索,普通的查询就能满足大部分需求。 使用MySQL进行全文检索的步骤如下: 1. 建立数据表。 2. 创建全文索引。可以使用ALTER TABLE语句来为表添加全文索引。 3. 进行全文检索查询。使用match和against关键字指定要查询的列和查询内容,执行相应的SQL语句即可。 在进行全文检索时,你还可以使用一些修饰符来自定义检索体的相关性,例如必须包含该词、必须不包含该词、提高词的相关性等。MySQL中常用的修饰符有必须包含该词(+)、必须不包含该词(-)、提高词的相关性(>)、降低词的相关性(<)和通配符(*)。更多解释可以参考相关资料进行学习。 综上所述,MySQL全文检索是一种用于在文本数据中进行高效搜索的技术,可以通过修改配置文件来调整相关参数,使用match和against关键字来进行查询,适用于搜索引擎和大数据搜索等场景。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值