oracle数据库filter,oracle全文索引之FILTER_4_PROCEDURE_FILTER

这篇文章继续介绍全文索引的FILTER属性,介绍全文索引的PROCEDURE_FILTER属性。

对于一些复杂的需求,Oracle

自定义的FILTER可能并不合适,Oracle支持用户自己编写用于FILTER的程序。Oracle提供两种方式,一种是USER_FILTER一种

是PROCEDURE_FILTER。USER_FILTER是用户编译好的命令行程序,而PROCEDURE_FILTER是调用用户编写的存储过程。[@more@]下面举一个PROCEDURE_FILTER的例子,在例子中被索引的文档为纯文本格式,要求是不索引文档中注释部分的内容。这种要求是预定义FILTER无法达到的,只能通过PROCEDURE_FILTER的方式来解决,下面看这个例子:

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(4000));

表已创建。

SQL> INSERT INTO T VALUES (1, 'This is a example for procedure filter.

2 In the this example, the words in comments are not indexed.');

已创建1 行。

SQL> INSERT INTO T VALUES (2, '--This line should not be indexed.

2 /* And this two lines

3 should not be indexed too. */

4 Only this line is the real context.');

已创建1 行。

SQL> COMMIT;

提交完成。

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT;

索引已创建。

SQL> SELECT ID FROM T WHERE CONTAINS(DOCS, 'INDEXED') > 0;

ID

----------

2

1

对于普通的索引,是不会区分注释内容和正文内容的。

SQL> DROP INDEX IND_T_DOCS;

索引已丢弃。

SQL> CREATE OR REPLACE FUNCTION F_COMMENTS (P_STR IN VARCHAR2, P_FLAG IN NUMBER) RETURN VARCHAR2 AS

2 V_POSITION1 NUMBER;

3 V_POSITION2 NUMBER;

4 BEGIN

5 IF P_FLAG = 0 THEN

6 V_POSITION1 := INSTR(P_STR, '/*');

7 V_POSITION2 := INSTR(P_STR, '--');

8 IF V_POSITION1 = 0 THEN

9 V_POSITION1 := 40000;

10 END IF;

11 IF V_POSITION2 = 0 THEN

12 V_POSITION2 := 40000;

13 END IF;

14 IF V_POSITION1 < V_POSITION2 THEN

15 RETURN SUBSTR(P_STR, 1, V_POSITION1 - 1) || F_COMMENTS(SUBSTR(P_STR, V_POSITION1 + 2), 1);

16 ELSIF V_POSITION2 < V_POSITION1 THEN

17 RETURN SUBSTR(P_STR, 1, V_POSITION2 - 1) || F_COMMENTS(SUBSTR(P_STR, V_POSITION2 + 2), 2);

18 ELSE

19 RETURN P_STR;

20 END IF;

21 ELSIF P_FLAG = 1 THEN

22 RETURN F_COMMENTS(SUBSTR(P_STR, INSTR(P_STR, '*/') + 2), 0);

23 ELSIF P_FLAG = 2 THEN

24 V_POSITION2 := INSTR(P_STR, CHR(10));

25 IF V_POSITION2 != 0 THEN

26 RETURN F_COMMENTS(SUBSTR(P_STR, V_POSITION2 + 1), 0);

27 ELSE

28 RETURN NULL;

29 END IF;

30 END IF;

31 END;

32 /

函数已创建。

SQL> CREATE OR REPLACE PROCEDURE P_MYFILTER (P_INSTR IN VARCHAR2, P_OUTSTR IN OUT VARCHAR2) AS

2 BEGIN

3 P_OUTSTR := F_COMMENTS(P_INSTR, 0);

4 END;

5 /

过程已创建。

SQL> CONN CTXSYS/CTXSYS@YANGTK

已连接。

SQL> CREATE OR REPLACE PROCEDURE P_TESTFILTER(P_INSTR IN VARCHAR2, P_OUTSTR IN OUT VARCHAR2) AS

2 BEGIN

3 YANGTK.P_MYFILTER(P_INSTR, P_OUTSTR);

4 END;

5 /

过程已创建。

SQL> GRANT EXECUTE ON P_TESTFILTER TO YANGTK;

授权成功。

SQL> BEGIN

2 CTX_DDL.CREATE_PREFERENCE('TEST_PROCEDURE_FILTER', 'PROCEDURE_FILTER');

3 CTX_DDL.SET_ATTRIBUTE('TEST_PROCEDURE_FILTER', 'PROCEDURE', 'P_TESTFILTER');

4 CTX_DDL.SET_ATTRIBUTE('TEST_PROCEDURE_FILTER', 'INPUT_TYPE', 'VARCHAR2');

5 CTX_DDL.SET_ATTRIBUTE('TEST_PROCEDURE_FILTER', 'OUTPUT_TYPE', 'VARCHAR2');

6 END;

7 /

PL/SQL 过程已成功完成。

SQL> CONN YANGTK/YANGTK@YANGTK

已连接。

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT

2 PARAMETERS ('FILTER CTXSYS.TEST_PROCEDURE_FILTER');

索引已创建。

SQL> SELECT ID FROM T WHERE CONTAINS(DOCS, 'INDEXED') > 0;

ID

----------

1

PROCEDURE_FILTER属性的设置方法和USER_DATASTORE属性的设置方法十分类似,都是必须使用CTXSYS用户来调用用户编译的过程。且CTXSYS用户封装的过程还必须授权给建立索引的用户。

使用自定义的过程来进行过滤,将文档内容中的注释内容过滤掉,索引查询的内容已经不包含注释的内容了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值