这篇文章继续讨论全文索引的DATASTORE属性,介绍FILE_DATASTORE。
全文索引的对象一般是篇幅较大的文章,除了保存在数据库中的情况,另外一种常见的情况是以文件的形式保存在操作系统中。
Oracle的FILE_DATASTORE属性就可以索引这种类型的文档。这个例子主要是讨论DATASTORE属性,因此索引的文章都是文本格式的,对于其他类型需要设置FILTER属性,会在以后的例子单独讨论。
SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));
表已创建。
SQL> INSERT INTO T VALUES (1, 'OUTPUT.TXT');
已创建 1 行。
SQL> INSERT INTO T VALUES (2, 'LOGEMPXT_000_2012_2680.LOG');
已创建 1 行。
SQL> COMMIT;
提交完成。
SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_FILE', 'FILE_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_FILE', 'PATH', 'F:TEST');
4 END;
5 /
PL/SQL 过程已成功完成。
SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> CREATE INDEX IND_T_DOCS ON T (DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_FILE');
索引已创建。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'ORACLE') > 0;
ID DOCS
---------- ------------------------------
1 OUTPUT.TXT
这个例子也是首先创建一个FILE_DATASTORE的PREFERENCE,并设置文件存储的路径,然后在建立索引的时候指定新建的参数。
但是,Oracle似乎只支持在FILE_DATASTORE中设置的路径中进行搜索,即使像上面这个例子中第2条记录,文档存储在指定路径下的子目录中,这种情况也是没有办法进行索引的。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;
未选定行
如果将文件位置从F:TESTLOG挪到F:TEST目录下,则可以进行索引:
SQL> HOST MOVE F:TESTLOGEMPXT_000_2012_2680.LOG F:TESTEMPXT_000_2012_2680.LOG
SQL> UPDATE T SET DOCS = 'EMPXT_000_2012_2680.LOG' WHERE ID = 2;
已更新 1 行。
SQL> COMMIT;
提交完成。
SQL> BEGIN
2 CTX_DDL.SYNC_INDEX('IND_T_DOCS');
3 END;
4 /
PL/SQL 过程已成功完成。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;
ID DOCS
---------- ------------------------------
2 EMPXT_000_2012_2680.LOG
测试还发现,只有将文件置于F:TEST目录下即可,即使DOCS中存储的文件位置包含了子目录信息。
下面不改变文件的存储位置,只是修改保存在数据库中的文档的地址:
SQL> UPDATE T SET DOCS = 'LOGEMPXT_000_2012_2680.LOG' WHERE ID = 2;
已更新 1 行。
SQL> COMMIT;
提交完成。
SQL> BEGIN
2 CTX_DDL.SYNC_INDEX('IND_T_DOCS');
3 END;
4 /
PL/SQL 过程已成功完成。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;
ID DOCS
---------- ------------------------------
2 LOGEMPXT_000_2012_2680.LOG
对于这种情况,可以通过在设置路径属性时设置多个路径的方式:
SQL> HOST MOVE F:TESTEMPXT_000_2012_2680.LOG F:TESTLOGEMPXT_000_2012_2680.LOG
SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.DROP_PREFERENCE('TEST_FILE');
3 END;
4 /
PL/SQL 过程已成功完成。
SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_FILE', 'FILE_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_FILE', 'PATH', 'F:TEST;F:TESTLOG');
4 END;
5 /
PL/SQL 过程已成功完成。
SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> DROP INDEX IND_T_DOCS;
索引已丢弃。
SQL> CREATE INDEX IND_T_DOCS ON T (DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_FILE');
索引已创建。
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'ORACLE') > 0;
ID DOCS
---------- ------------------------------
1 OUTPUT.TXT
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;
ID DOCS
---------- ------------------------------
2 LOGEMPXT_000_2012_2680.LOG
这种文档保存在Oracle之外的方式,如果文件发生了变化,必须通过修改索引列的方式来通知Oracle,被索引数据已经发生了变化。