如何在MySQL中获得更好的全文搜索结果

转载 2006年06月23日 22:22:00
很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。

 

  MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然  语言来智能地对结果评级,以去掉不相关的项目。

  这篇文章将向您讲述在MySQL中如何进行全文搜索。

  1、设置基本表格

  从创建例子表格开始,使用以下的SQL命令:

 

  mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);

 

  以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:

 

mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
(1, 'Gingerboy has a new single out called Throwing Rocks. It/'s great!');
mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
(2, 'Hello all, I really like the new Madonna single.
One of the hottest tracks currently playing...I/'ve been listening to it all day');
mysql> INSERT INTO `reviews` (`id`, `data`)
VALUES (3, 'Have you heard the new band Hotter Than Hell?
They have five members and they burn their instruments when they play in concerts.
These guys totally rock! Like, awesome, dude!');

 

  验证数据的正确录入:

 

mysql> SELECT * FROM reviews;
+----+--------------------------------------------+
| id | data                                       |
+----+--------------------------------------------+
|  1 | Gingerboy has a new single out called ...  |
|  2 | Hello all, I really like the new Madon ... |
|  3 | Have you heard the new band Hotter Than... |
+----+--------------------------------------------+
3 rows in set (0.00 sec)
很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。

 

  MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然  语言来智能地对结果评级,以去掉不相关的项目。

  这篇文章将向您讲述在MySQL中如何进行全文搜索。

  1、设置基本表格

  从创建例子表格开始,使用以下的SQL命令:

 

  mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);

 

  以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:

 

mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
(1, 'Gingerboy has a new single out called Throwing Rocks. It/'s great!');
mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
(2, 'Hello all, I really like the new Madonna single.
One of the hottest tracks currently playing...I/'ve been listening to it all day');
mysql> INSERT INTO `reviews` (`id`, `data`)
VALUES (3, 'Have you heard the new band Hotter Than Hell?
They have five members and they burn their instruments when they play in concerts.
These guys totally rock! Like, awesome, dude!');

 

  验证数据的正确录入:

 

mysql> SELECT * FROM reviews;
+----+--------------------------------------------+
| id | data                                       |
+----+--------------------------------------------+
|  1 | Gingerboy has a new single out called ...  |
|  2 | Hello all, I really like the new Madon ... |
|  3 | Have you heard the new band Hotter Than... |
+----+--------------------------------------------+
3 rows in set (0.00 sec)

  在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看­-只需用逗号来分割字段列表。

  当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。

  想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:

 

mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;
+----+-------------------------------+
| id | MATCH (data) AGAINST ('rock') |
+----+-------------------------------+
|  1 |                             0 |
|  2 |                             0 |
|  3 |               1.3862514533815 |
+----+-------------------------------+

 

 

  3 rows in set (0.00 sec)

  4、使用逻辑搜索修饰符(Boolean search modifiers

  您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的IN BOOLEAN MODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:

 

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE);
+----+
| id |
+----+
|  1 |
+----+

  在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看­-只需用逗号来分割字段列表。

  当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。

  想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:

 

mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;
+----+-------------------------------+
| id | MATCH (data) AGAINST ('rock') |
+----+-------------------------------+
|  1 |                             0 |
|  2 |                             0 |
|  3 |               1.3862514533815 |
+----+-------------------------------+

 

 

  3 rows in set (0.00 sec)

  4、使用逻辑搜索修饰符(Boolean search modifiers

  您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的IN BOOLEAN MODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:

 

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE);
+----+
| id |
+----+
|  1 |
+----+

如何在MySQL中获得更好的全文搜索结果

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些 程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于...
  • fightplane
  • fightplane
  • 2006年12月21日 14:27
  • 919

在MySQL中获得更好的全文搜索结果

  很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个 SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但...
  • hdy007
  • hdy007
  • 2007年01月11日 13:20
  • 596

MySQL中获得更好的搜索结果

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全...
  • lgjlry
  • lgjlry
  • 2007年11月30日 23:26
  • 344

如何在NCBI实现大批量数据的一一对应

有时我们手头会有一批数据,或者是只有大量的某些id。比方说:accession number、gi、geneid、symbol、go、unigene、pubmed、taxid等等。事实大部分数据库...
  • blacklee123
  • blacklee123
  • 2014年07月30日 20:51
  • 908

在MySQL中获得更好的搜索结果

  【导读】很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询...
  • lucklrj
  • lucklrj
  • 2006年10月31日 12:07
  • 764

python获取其他程序录入信息---序

记录使用Python制作脚本,获取其他程序录入的信息过程中的步骤,以及遇到的困难。以防遗忘,以备查阅。...
  • czjwpby
  • czjwpby
  • 2017年03月29日 20:29
  • 181

mysql的全文搜索功能

12.7. 全文搜索功能 12.7.1. 布尔全文搜索12.7.2. 全文搜索带查询扩展12.7.3. 全文停止字12.7.4. 全文限定条件12.7.5. 微调MySQL全文搜索 ...
  • bravekingzhang
  • bravekingzhang
  • 2011年08月28日 22:22
  • 7600

测试博客编辑格式

这是黑体标题 这是斜体内容 加下划线 加删除线 字体 宋体 微软雅黑 大字体大字体字体颜色 public String getName(User user){ return u...
  • qq_35529682
  • qq_35529682
  • 2018年01月15日 16:01
  • 15

关于Mysql的全文本搜索功能

为什么要使用全文本搜索? 其实有类似于全文本搜索的功能: 1、LIKE关键字:利用通配符操作匹配文本,使用LIKE,能够查找包含特殊值或部分值的行(不管这些值在什么位置)。 2、...
  • baidu_30000217
  • baidu_30000217
  • 2015年12月04日 11:11
  • 4707

在MySQL中获得更好的搜索结果

【导读】很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中...
  • zjmood
  • zjmood
  • 2007年06月02日 11:48
  • 326
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:如何在MySQL中获得更好的全文搜索结果
举报原因:
原因补充:

(最多只允许输入30个字)