SQL Server 2000 全文检索

使用 CONTAINSTABLE 和 FREETEXTTABLE 赋值行集函数

CONTAINSTABLE 和 FREETEXTTABLE 函数用来指定返回每行的相对排名的全文查询。这两个函数与全文谓词 CONTAINS 和 FREETEXT 很相似,但是用法不同。

区分全文谓词与函数

虽然全文谓词和全文赋值行集函数都用于全文查询,而且二者用来指定全文检索条件的 Transact-SQL 语句是一样的,但是它们在使用方法上仍有主要差别:

  • CONTAINS 和 FREETEXT 都返回 TRUE 或 FALSE 值,因此它们一般在 SELECT 语句的 WHERE 子句中指定。

    CONTAINSTABLE 和 FREETEXTTABLE 都返回一个有 0、1 或多行的表,因此它们必须总是在 FROM 子句中指定。

  • CONTAINS 和 FREETEXT 只能用于指定选择条件,Microsoft® SQL Server™ 使用该条件确定结果集的成员资格。

    CONTAINSTABLE 和 FREETEXTTABLE 也用来指定选择标准。返回的表中有一个名为 KEY的列,其中包含全文键值。每个全文注册表均含有这样的列,该列中的值一定是唯一的。在 CONTAINSTABLE 或 FREETEXTTABLE 返回的全文注册表中,KEY 列中的值是匹配全文检索条件中所指定的选择条件的行的唯一值。

    不仅如此,CONTAINSTABLE 和 FREETEXTTABLE 产生的表中还有名为 RANK 的一列,其中包含从 0 到 1000 的值。这些值用来根据返回的行满足选择标准的程度对它们进行排序。

使用 CONTAINSTABLE 和 FREETEXTTABLE 函数的查询比那些使用 CONTAINS 和 FREETEXT 谓词的查询更复杂,因为函数返回的符合要求的行必须显式地与原始 SQL Server 表中的行联接起来。

对于包含位于词"sauces"或"candies"附近的"sweet and savory"的 Description 列,下面的示例返回其所有食品分类的描述和分类名称。所有具有"Seafood"分类名称的行都将被忽视。仅返回等级值为 2 或等级值更高的行。

USE Northwind
GO
SELECT FT_TBL.Description,
FT_TBL.CategoryName,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)'
) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK > 2
AND FT_TBL.CategoryName <> 'Seafood'
ORDER BY KEY_TBL.RANK DESC

对于包含位于词"sauces"或"candies"附近的"sweet and savory"的 Description 列,下面的示例返回其前 10 种食品的描述和分类名称。

SELECT FT_TBL.Description, 
FT_TBL.CategoryName,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)'
, 10
) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
CONTAINSTABLE 和 CONTAINS 之间的比较

CONTAINSTABLE 函数和 CONTAINS 谓词使用相似的检索条件。

但是,在 CONTAINSTABLE 中指定将进行全文检索的表、要在表中检索的某列(或所有列)以及检索条件。还有一个参数是可选参数,使用户可以指出只返回最大指定数目的匹配项。有关更多信息,请参见"限制结果集"部分。

CONTAINSTABLE 返回包含一个名为 RANK 的列的表。这个 RANK 列包含表示行与选择条件匹配程度的每行的值。

此查询使用 CONTAINSTABLE 指定返回每行的排名值。

USE Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9)
)
'
) AS K
ON C.CustomerID = K.[KEY]

下面是结果集:

RANK CompanyName          ContactName       address            
---- ------------ ----------- -------
123 Bon app' Laurence Lebihan 12, rue des Bouchers
65 Du monde entier Janine Labrune 67, rue des Cinquante Otages
15 France restauration Carine Schmitt 54, rue Royale
15 La maison d'Asie Annette Roulet 1 rue Alsace-Lorraine
15 Maison Dewey Catherine Dewey Rue Joseph-Bens 532
15 M
ère Paillarde Jean Fresnière 43 rue St. Laurent
15 Sp
écialités du monde Dominique Perrier 25, rue Lauriston
15 Vins et alcools Paul Henriot 59 rue de l'Abbaye
Chevalier
15 Victuailles en stock Mary Saveley 2, rue du Commerce
FREETEXTTABLE 和 FREETEXT 之间的比较

下面的查询将 FREETEXTTABLE 查询扩展为先返回排名最高的行,并将每行的等级加到选择列表中。要指定该查询,必须知道 CategoryIDCategories 表的唯一键列。

USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories AS FT_TBL
INNER JOIN
FREETEXTTABLE(Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
GO

FREETEXTTABLE 与 FREETEXT 在语法上的唯一区别是插入表名作为第一个参数。

下面是同一个查询的扩充,此查询只返回排名值为 10 或更大的行:

USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories FT_TBL
INNER JOIN
FREETEXTTABLE (Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
GO
标识唯一键列名

使用赋值行集函数的查询很复杂,因为必须知道唯一键列的名称。每个启用全文查询的表都有 TableFulltextKeyColumn 属性,其中包含为在该表实施唯一行而选择的列的 ID 号。此例显示了如何以编程方式获得和使用键列名。

USE Northwind
GO
DECLARE @key_column sysname
SET @key_column = Col_Name(Object_Id('Categories'),
ObjectProperty(Object_id('Categories'),
'TableFulltextKeyColumn')
)
print @key_column
EXECUTE ('SELECT Description, KEY_TBL.RANK
FROM Categories FT_TBL
INNER JOIN
FreetextTable (Categories, Description,
''How can I make my own beers and ales?'') AS KEY_TBL
ON FT_TBL.'
+
@key_column
+
' = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
')
GO

可以编写接受关于查询的一些事实的存储过程,以避免使用 CONTAINSTABLE 和 FREETEXTTABLE 的复杂性,然后可以创建并执行相应的查询。下面是一个简化的过程,它提交一个 FREETEXTTABLE 查询。下表显示了过程参数(所有输入)。

参数必需描述
@additional_predicates可选如果有的话,用 AND 加在 FREETEXT 谓词后面。KEY_TBL.RANK 可以用于表达式内部。
@freetext_column 
@freetext_search检索条件。
@from_table 
@order_by_list可选KEY_TBL.RANK 可以是指定的列之一。
< select_list >KEY_TBL.RANK 可以是指定的列之一。

该过程的代码如下:

CREATE PROCEDURE freetext_rank_proc
@select_list nvarchar(1000),
@from_table nvarchar(517),
@freetext_column sysname,
@freetext_search nvarchar(1000),
@additional_predicates nvarchar(500) = '',
@order_by_list nvarchar(500) = ''
AS
BEGIN
DECLARE @table_id integer,
@unique_key_col_name sysname,
@add_pred_var nvarchar(510),
@order_by_var nvarchar(510)

-- Get the name of the unique key column for this table.
SET @table_id = Object_Id(@from_table)
SET @unique_key_col_name =
Col_Name( @table_id,
ObjectProperty(@table_id, 'TableFullTextKeyColumn') )

-- If there is an additional_predicate, put AND() around it.
IF @additional_predicates <> ''
SET @add_pred_var = 'AND (' + @additional_predicates + ')'
ELSE
SET @add_pred_var = ''

-- Insert ORDER BY, if needed.
IF @order_by_list <> ''
SET @order_by_var = 'ORDER BY ' + @order_by_var
ELSE
SET @order_by_var = ''

-- Execute the SELECT statement.
EXECUTE ( 'SELECT '
+ @select_list
+ ' FROM '
+ @from_table
+ ' AS FT_TBL, FreetextTable('
+ @from_table
+ ','
+ @freetext_column
+ ','''
+ @freetext_search
+ ''') AS KEY_TBL '
+ 'WHERE FT_TBL.'
+ @unique_key_col_name
+ ' = KEY_TBL.[KEY] '
+ @add_pred_var
+ ' '
+ @order_by_var
)
END

此过程可以用来提交该查询:

USE Northwind
GO
EXECUTE freetext_rank_proc
'Description, KEY_TBL.RANK', -- Select list
'Categories', -- From
'Description', -- Column
'How can I make my own beers and ales?', -- Freetext search
'KEY_TBL.RANK >= 10', -- Additional predicate
'KEY_TBL.RANK DESC' -- Order by
GO
限制结果集

在许多全文查询中,符合检索条件的项有很多。为了防止查询返回太多的匹配值,可以在 CONTAINSTABLE 和 FREETEXTTABLE 中使用可选参数 top_n_by_rank,根据想返回的排名指定匹配数量。

有了这些信息,Microsoft® SQL Server™ 将按等级值对匹配项进行排序,然后只返回达到指定数目的匹配项。这种选择可以大幅度提高性能。例如,对于正常情况下会从一个一百万行的表中返回 100,000 行的查询而言,如果只要求返回前 100 行,则查询处理速度将会更快。

如果在前面使用 CONTAINSTABLE 的示例中,只想返回前 3 个匹配项,则查询形式如下:

USE   Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9))', 3) AS K
ON C.CustomerID = K.[KEY]

下面是结果集:

RANK CompanyName          ContactName       address            
---- ------------ ----------- -------
123 Bon app' Laurence Lebihan 12, rue des Bouchers
65 Du monde entier Janine Labrune 67, rue des Cinquante Otages
15 France restauration Carine Schmitt 54, rue Royale
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值