MySql模糊匹配、全文检索、中文分词相关

因为要做一个对数据库进行简单匹配查询的搜索框,所以对 MySql 进行关键字匹配查询作了一些了解。


书上给出的匹配查询一般是这两种。
(1)精确匹配,使用等号(=).
例如:select * from table where item = ‘$value”;


(2)模糊匹配,使用 like ‘%$value%’。


例如:select * from table where item like ‘%$value%’;


在一般情况下,这两种查询就能完成任务了,甚至在使用多个关键字的时候也可以变通地使用 like ‘%$value_A%’ or like ‘%$value_B%’… 这样的组合语句完成,但如果数据库较大,


内容较多的时候就不得不考虑使用全文搜索了,因为使用 like 进行模糊匹配效率十分低下。


而MySQL对“全文搜索(又称:全文索引)”字段做了索引来优化搜索,同时MySQL使用自然语言来智能地对结果评级,以去掉不相关的项目。


“全文搜索”在 MySQL 中是一个 FULLTEXT 类型索引。FULLTEXT 索引用于 MyISAM 表。曾尝试在 InnoDB 表中创建FullText 索引出错。


修改表方法:


所以如果表所用的引擎非 MyISAM 可以先备份 MySql, 然后在 PHPMyAdmin 中使用操作菜单来更改表的引擎为 MyISAM。接下来在需要进行“全文搜索”的字段点击“全文搜索”创建。


如果已经确定了表的引擎是 MyISAM,也可直接在命令行模式下使用以下命令:


ALTER TABLE 表名 ADD FULLTEXT INDEX (表字段);


拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的“全文搜索”是带有MATCH…AGAINST语句的SELECT查询:


SELECT 表字段 FROM 表名 WHERE MATCH (全文搜索表字段) AGAINST (’搜索字符串’);


更多资料:


不过,MySQL对中文“全文搜索”的支持饱受争议,看这篇讨论( http://topic.csdn.net/t/20050118/19/3735846.html )就知道了,另外也有很多变通的方法,效率应该不会好到哪去。也有


人拿 dvBBS (http://www.phpx.com/happy/viewthread.php?tid=124691) 的实现方法进行了分析 ,这应该才算得是真正意义上的“全文搜索”,因为这些实现方法要考虑“中文分词技术”





当然,也发现了一个国人自己开发的插件[插件一 http://www.hightman.cn/ ][插件二 http://www.chedong.com/tech/lucene.html#demo ][ 插件三 http://www.jesoft.cn/ ],支持中文分


词,如果你不知道什么是中文分词,Google (谷歌)中国的博客网志的这篇《数学之美 系列二 — 谈谈中文分词》http://www.googlechinablog.com/2006/04/blog-post_10.html 可以对它


有个比较清楚的了解。


另外一篇《MYSQL-中文检索匹配与正则表达式》http://blog.chinaunix.net/u1/41728/showart_361500.html 也附上,以备不时之需。


其实我需要使用的查询在用 like 的状况下就能解决掉,因为数据量总体来说不会太大,所以不会出现很大的问题。不过,我还是准备改用“全文搜索”,毕竟功能放在那里。这篇文章中涉


及比较深 入的三篇文章(…插件..、..dvBBS…、…正则表达式…)都没怎么看,还是一句话,用到的时候再翻翻。


另外一个比较奇怪的问题就是,关于MySQL 全文搜索的文章大都是 2005 - 2006 年间的,一篇 2007 年的也没看着,邪乎!


主要参考了以下文章:
http://www.linwan.com/database/7/118546027646510.html
http://publish.it168.com/2005/0921/20050921026101.shtml?positioncode=1546


http://www.googlechinablog.com/2006/04/blog-post_10.html
http://topic.csdn.net/t/20050118/19/3735846.html


http://hi.baidu.com/monobao/blog/item/c561ddea4dd86ed3d539c98f.html 
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL中文分词全文索引是指在MySQL数据库中使用中文分词器对中文文本进行分词,并建立相应的全文索引,以支持对中文文本的全文搜索功能。在MySQL 5.7之前,全文索引只支持英文全文索引,不支持中文全文索引,需要借助分词器将中文文本进行预处理并拆分成单词后再存入数据库。而从MySQL 5.7.6开始,MySQL内置了ngram全文解析器,可以用来支持中文、日文、韩文等语言的分词,并通过全文索引实现对中文文本的语义分词检索功能。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [MySQL使用全文索引(fulltext index) 及中文全文索引使用](https://blog.csdn.net/weixin_38289885/article/details/124634441)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [mysql ---- 全文索引:中文语义分词检索](https://blog.csdn.net/weixin_44235759/article/details/124847638)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值