关闭

ORACLE TEXT DATASTORE PREFERENCE(三)

标签: oraclesqlfileparameters文档insert
674人阅读 评论(0) 收藏 举报
分类:

这篇文章继续讨论全文索引的DATASTORE属性,介绍FILE_DATASTORE。


全文索引的对象一般是篇幅较大的文章,除了保存在数据库中的情况,另外一种常见的情况是以文件的形式保存在操作系统中。

Oracle的FILE_DATASTORE属性就可以索引这种类型的文档。这个例子主要是讨论DATASTORE属性,因此索引的文章都是文本格式的,对于其他类型需要设置FILTER属性,会在以后的例子单独讨论。

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));

表已创建。

SQL> INSERT INTO T VALUES (1, 'OUTPUT.TXT');

已创建 1 行。

SQL> INSERT INTO T VALUES (2, 'LOGEMPXT_000_2012_2680.LOG');

已创建 1 行。

SQL> COMMIT;

提交完成。

SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_FILE', 'FILE_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_FILE', 'PATH', 'F:TEST');
4 END;
5 /

PL/SQL 过程已成功完成。

SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> CREATE INDEX IND_T_DOCS ON T (DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_FILE');

索引已创建。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'ORACLE') > 0;

ID DOCS
---------- ------------------------------
1 OUTPUT.TXT

这个例子也是首先创建一个FILE_DATASTORE的PREFERENCE,并设置文件存储的路径,然后在建立索引的时候指定新建的参数。

但是,Oracle似乎只支持在FILE_DATASTORE中设置的路径中进行搜索,即使像上面这个例子中第2条记录,文档存储在指定路径下的子目录中,这种情况也是没有办法进行索引的。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;

未选定行

如果将文件位置从F:TESTLOG挪到F:TEST目录下,则可以进行索引:

SQL> HOST MOVE F:TESTLOGEMPXT_000_2012_2680.LOG F:TESTEMPXT_000_2012_2680.LOG

SQL> UPDATE T SET DOCS = 'EMPXT_000_2012_2680.LOG' WHERE ID = 2;

已更新 1 行。

SQL> COMMIT;

提交完成。

SQL> BEGIN
2 CTX_DDL.SYNC_INDEX('IND_T_DOCS');
3 END;
4 /

PL/SQL 过程已成功完成。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;

ID DOCS
---------- ------------------------------
2 EMPXT_000_2012_2680.LOG

测试还发现,只有将文件置于F:TEST目录下即可,即使DOCS中存储的文件位置包含了子目录信息。

下面不改变文件的存储位置,只是修改保存在数据库中的文档的地址:

SQL> UPDATE T SET DOCS = 'LOGEMPXT_000_2012_2680.LOG' WHERE ID = 2;

已更新 1 行。

SQL> COMMIT;

提交完成。

SQL> BEGIN
2 CTX_DDL.SYNC_INDEX('IND_T_DOCS');
3 END;
4 /

PL/SQL 过程已成功完成。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;

ID DOCS
---------- ------------------------------
2 LOGEMPXT_000_2012_2680.LOG

对于这种情况,可以通过在设置路径属性时设置多个路径的方式:

SQL> HOST MOVE F:TESTEMPXT_000_2012_2680.LOG F:TESTLOGEMPXT_000_2012_2680.LOG

SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.DROP_PREFERENCE('TEST_FILE');
3 END;
4 /

PL/SQL 过程已成功完成。

SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_FILE', 'FILE_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_FILE', 'PATH', 'F:TEST;F:TESTLOG');
4 END;
5 /

PL/SQL 过程已成功完成。

SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> DROP INDEX IND_T_DOCS;

索引已丢弃。

SQL> CREATE INDEX IND_T_DOCS ON T (DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_FILE');

索引已创建。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'ORACLE') > 0;

ID DOCS
---------- ------------------------------
1 OUTPUT.TXT

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'SOURCE') > 0;

ID DOCS
---------- ------------------------------
2 LOGEMPXT_000_2012_2680.LOG

这种文档保存在Oracle之外的方式,如果文件发生了变化,必须通过修改索引列的方式来通知Oracle,被索引数据已经发生了变化。

0
0
查看评论

ORACLE TEXT DATASTORE PREFERENCE(四)

这篇文章继续讨论全文索引的DATASTORE属性,介绍URL_DATASTORE。 全文索引可以很方便的索引存储在INTERNET上的信息。在数据库中只需要存储需要索引的文章的URL就可以了。 由于目前讨论的是DATASTORE属性,因此这个例子只索引HTML文章,对于其他需...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:27
  • 584

ORACLE TEXT DATASTORE PREFERENCE(六)

这篇文章继续讨论全文索引的DATASTORE属性,介绍NESTED_DATASTORE。 全文索引支持将数据存储在多个列中或存储在主子表中,全文索引还支持将数据存储在嵌套表中。嵌套表的例子和主子表比较类似: 首先创建嵌套表对象,并建立嵌套表: SQL> C...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:36
  • 551

ORACLE TEXT DATASTORE PREFERENCE(二)

这篇文章继续讨论全文索引的DATASTORE属性,介绍MULTI_COLUMN_DATASTORE。 如果被索引的文章是保存在数据库中,但是内容分布在多个列中,那么可以通过建立一个MULTI_COLUMN_DATASTORE来索引完整的文章: SQL> CREATE T...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:25
  • 1060

ORACLE TEXT DATASTORE PREFERENCE(一)

Oracle Text功能十分强大,可是文档上给出的例子总是过于简单,而且可能是为了减少篇幅,不少例子只给出了其中关键的几步,但是对于初学者而言,阅读这样的例子很难对全文索引的创建有一个清晰的了解,而更多的时候可能会使初学者更加迷茫。 打算通过一系列的文章对Oracle全文索引做一个比较详细的...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:20
  • 667

ORACLE TEXT DATASTORE PREFERENCE(七)

这篇文章讨论全文索引DATASTORE的最后一种属性,介绍USER_DATASTORE。 Oracle功能的强大体现在很多方面,除了很多Oracle预定义好的接口以外,Oracle还提供了强大的自定义功能。USER_DATASTORE就是一个例子。如果上面几篇文章介绍的DATAST...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:36
  • 612

ORACLE TEXT DATASTORE PREFERENCE(五)

这篇文章继续讨论全文索引的DATASTORE属性,介绍DETAIL_DATASTORE。 全文索引运行将被索引的数据存储在子表的多条记录中,下面看一个简单的例子: SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, A...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:32
  • 582

ORACLE TEXT FILTER PREFERENCE(三)

这篇文章继续介绍全文索引的FILTER属性,介绍对不同类型的数据采用不同类型的FILTER属性的方法。 如果Oracle索引的文档包括多种类型,比如doc文件、html文件、pdf文件、纯文本文件等等。由于Oracle不建议对HTML、XML和纯文本文件使用INSO...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 14:39
  • 548

ORACLE TEXT LEXER PREFERENCE(三)

本文继续介绍Oracle全文索引的LEXER属性,这篇文章介绍Oracle多语言全文索引MULTI_LEXER。 如果在Oracle中存储多种语言,那么在建立全文索引的时候就不能只是简单的指定一个LEXER,而是要通过LANGUAGE COLUMN设置MULTI_LEXER...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 15:04
  • 763

oracle全文索引之datastore

 Oracle Text功能十分强大,开始学习,主要参考yangtingkun的blog和文档进行。第一步先搞清楚datastore的类型。DATASTORE的类型如下:DIRECT_DATASTOREMULTI_COLUMN_DATASTOREDETAIL_DATASTOREFILE_D...
  • leminsky
  • leminsky
  • 2010-01-08 14:30
  • 700

ORACLE TEXT LEXER PREFERENCE(二)

介绍完Oracle全文索引的BASIC_LEXER属性,这篇介绍Oracle中文语法属性CHINESE_LEXER和CHINESE_VGRAM_LEXER。 Oracle全文索引的BASIC属性主要是针对西方英语语系,英语语系的单词是通过空格、标点和回车来分隔的。而中文则需要索引来...
  • liqfyiyi
  • liqfyiyi
  • 2012-03-31 15:03
  • 714
    个人资料
    • 访问:2421926次
    • 积分:22105
    • 等级:
    • 排名:第392名
    • 原创:158篇
    • 转载:639篇
    • 译文:1篇
    • 评论:52条
    最新评论