这篇文章继续介绍全文索引的FILTER属性,介绍对不同类型的数据采用不同类型的FILTER属性的方法。
如果Oracle索引的文档包括多种类型,比如doc文件、html文件、pdf文件、纯文本文件等等。由于Oracle不建议对HTML、XML和纯文本文件使用INSO_FILTER,因此没有一个统一适用的FILTER属性适合所有的文档。
Oracle提供了一种FORMAT列的方法,通过设置FORMAT列的内容可以通知Oracle建立何种FILTER甚至是不建立索引。
下面看一个简单的例子:
SQL> CREATE TABLE T (ID NUMBER, TYPE VARCHAR2(6), DOCS VARCHAR2(100));
表已创建。
SQL> INSERT INTO T VALUES (1, 'BINARY', 'Oracle920 Text Application Developer''s Guide.pdf');
已创建 1 行。
SQL> INSERT INTO T VALUES (2, 'TEXT', 'readme.txt');
已创建 1 行。
SQL> INSERT INTO T VALUES (3, 'IGNORE', 'Oracle920 Text Reference.pdf');
已创建 1 行。
SQL> COMMIT;
提交完成。
SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_FILE', 'FILE_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_FILE', 'PATH', 'D:databaseoracleoracle docoracle 9i;D:databaseoracleoracle docdocOracle920B10501_01');
4 END;
5 /
PL/SQL 过程已成功完成。
SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> CREATE INDEX IND_T_DOCS ON T (DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_FILE FILTER CTXSYS.INSO_FILTER FORMAT COLUMN TYPE');
索引已创建。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'ORACLE') > 0;
ID TYPE DOCS
---------- ------ --------------------------------------------------
2 TEXT readme.txt
1 BINARY Oracle920 Text Application Developer's Guide.pdf
设置COLUMN列的值,设置为BINARY的文档使用INST_FILTER,设置为TEXT的文档