第一种方法:


一、创建示例表

CREATE TABLE T_FULLTEXT_DEMO

(

ID NUMBER NOT NULL,

TITLE VARCHAR2(100) NULL,

REMARK VARCHAR2(200) NULL,

FILE_NAME VARCHAR2(200) NULL,

CONSTRAINT T_FULLTEXT_DEMO_PK PRIMARY KEY ( ID )

);

二、对TITLE和REMARK建立索引

BEGIN

CTXSYS.CTX_DDL.CREATE_PREFERENCE('MYMDS','MULTI_COLUMN_DATASTORE');
CTXSYS.CTX_DDL.SET_ATTRIBUTE('MYMDS', 'COLUMNS', 'TITLE, REMARK');
END;

CREATE INDEX T_FULLTEXT_DEMO_IDX ON T_FULLTEXT_DEMO(TITLE) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS('DATASTORE MYMDS');

三、建立存储选项参数、语法分析器

BEGIN
--CTX_DDL.DROP_PREFERENCE('MY_LEXER');

--CTX_DDL.DROP_PREFERENCE('MY_DATASTORE_PREFS');

CTX_DDL.CREATE_PREFERENCE ('MY_LEXER', 'CHINESE_VGRAM_LEXER');
CTX_DDL.CREATE_PREFERENCE ('MY_DATASTORE_PREFS', 'FILE_DATASTORE');
CTX_DDL.SET_ATTRIBUTE ('MY_DATASTORE_PREFS', 'PATH', 'E:\Projects\My_Documents; E:\Projects\My_Documents\UML_DOC');
END;

四、对文档建立全文检索索引

CREATE INDEX T_FULLTEXT_DEMO_FILE_IDX ON T_FULLTEXT_DEMO(FILE_NAME) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS('DATASTORE MY_DATASTORE_PREFS LEXER MY_LEXER');

五、插入测试数据

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(1,'德鲁克的《管理:任务、责任、实践》','管理类书籍','德鲁克的《管理:任务、责任、实践》.doc');

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(2,'PB控件的属性事件和函数','PB技术书籍','PB控件的属性事件和函数.pdf');

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(3,'微软产品报价','微软软件产品报价','微软产品报价.xls');

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(4,'JavaScript 5.5','JavaScript语言帮助文档','JavaScript 5.5.CHM');

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(5,'ASCII码','ASCII码的各种进制表示方式和代表的意思','ASCII码.htm');

INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(6,'UML数据库建模','UML数据库建模的相关知识','UML数据库建模.ppt');

六、同步索引和优化索引

若此时检索,应没有数据。

select * from T_FULLTEXT_DEMO
where contains(TITLE,'管理')>0;

需要将索引同步

BEGIN
CTXSYS.CTX_DDL.SYNC_INDEX('T_FULLTEXT_DEMO_FILE_IDX');
CTXSYS.CTX_DDL.SYNC_INDEX('T_FULLTEXT_DEMO_IDX');
END;

七、测试全文索引

select * from T_FULLTEXT_DEMO
where contains(TITLE,'管理')>0;

select * from T_FULLTEXT_DEMO
where contains(FILE_NAME,'德鲁克')>0;

八、优化索引

BEGIN

CTXSYS.CTX_DDL.OPTIMIZE_INDEX('T_FULLTEXT_DEMO_FILE_IDX','FULL');
CTXSYS.CTX_DDL.OPTIMIZE_INDEX('T_FULLTEXT_DEMO_IDX','FULL');
END;

第二种方法:


一、创建示例表

CREATE TABLE T_FULLTEXT_DEMO

(

ID NUMBER NOT NULL,

TITLE VARCHAR2(100) NULL,

REMARK VARCHAR2(200) NULL,

FILE_NAME BFILE NULL,

CONSTRAINT T_FULLTEXT_DEMO_PK PRIMARY KEY ( ID )

);

二、创建虚拟目录并授权(使用SYSTEM帐号)

CREATE DIRECTORY LOCAL_DIR AS 'E:\Projects\My_Documents';

GRANT READ ON DIRECTORY LOCAL_DIR TO JK_DANGAN;

三、插入示例数据

INSERT INTO T_FULLTEXT_DEMO

VALUES (1, '微软产品报价', '微软产品报价',BFILENAME('LOCAL_DIR','微软产品报价.xls'));

INSERT INTO T_FULLTEXT_DEMO

VALUES (2, '电子商务的瓶颈之我见', '电子商务的瓶颈之我见',BFILENAME(''LOCAL_DIR','电子商务的瓶颈之我见.doc'));

四、创建索引

CREATE INDEX T_FULLTEXT_DEMO_FILE_IDX ON T_FULLTEXT_DEMO(FILE_NAME) INDEXTYPE IS CTXSYS.CONTEXT;

五、测试

select * from T_FULLTEXT_DEMO
where contains(file_name,'数据库')>0

 

 

 

 

如何使用Oracle全文检索功能?

作者:eygle | English Version 【转载时请以超链接形式标明文章和作者信息及本声明
链接:


站内相关文章|Related Articles

本文简要说明全文检索功能的使用,不做太多的具体说明。
仅供参考使用方法。
1.授权
对具体使用全文检索的用户授权.

$ sqlplus "/ as sysdba"

SQL*Plus: Release 9.2.0.4.0 - Production on Sun May 15 20:00:10 2005

Copyright (c) 1982, 2002, Oracle Corporation.  All rights reserved.

Connected to:
Oracle9i Enterprise Edition Release 9.2.0.4.0 - 64bit Production
With the Partitioning, OLAP and Oracle Data Mining options
JServer Release 9.2.0.4.0 - Production

SQL> grant ctxapp to club;

Grant succeeded.

SQL> connect ctxsys/password
Connected.
SQL> grant execute on ctx_ddl to club;

Grant succeeded.

2.使用应用用户连接
创建域索引
SQL> connect club/password
Connected.

SQL> begin ctx_ddl.create_preference('club_lexer','chinese_vgram_lexer'); end;
  2  /

PL/SQL procedure successfully completed.

Elapsed: 00:00:00.03

SQL> create index id_cont_msg 
  2  on jivemessage ( SUBJECT ) indextype is ctxsys.context parameters('lexer club_lexer'); 

Index created.

Elapsed: 00:01:22.42

SQL> select count(*) from jivemessage where contains(subject,'幸福')>0;

  COUNT(*)
----------
      1847

Elapsed: 00:00:00.17
SQL> select count(*) from jivemessage where subject like '%幸福%';

  COUNT(*)
----------
      1841

Elapsed: 00:00:02.89

3.检索比较
以下是一个全文检索的示例,我们检索'abc',那么全文检索可以把包含'abc'的任何变化组合都查询出来,包括大小写、全半角,而如果用单纯的SQL实现同样的结果,则需要多次like之后union all,其性能差距是不可想象的。
全文检索在类似文本模糊查询上具有极大的优势。当然也可能存在问题,即词法分析器是否准确,会否漏掉部分内容等。
总的说来, 满足需求的技术就是好的技术,是否使用一项技术应该通过实践来检验.<br>
SQL> select subject from jivemessage where contains(subject,'abc') >0;

SUBJECT
--------------------------------------------------------------------------------
【游戏】 把你的名字的首字母用智能ABC打出,看能出来什么?
游戏——把你的名字首字母用智能ABC打出来
智能ABC暗藏杀机
ABC
ABC
ABC
ABC
ABC
ABC
哈哇abc
abc

SUBJECT
--------------------------------------------------------------------------------
abc
ABC
振奋爱的激情方案ABC
智能ABC的错吗?
ABC全选
瓜果美容ABC
经典英文歌曲ABC,不好你拿版砖砍我,好就回帖顶一下!
×××abc
Re: abc
Re: abc
Re: abc

SUBJECT
--------------------------------------------------------------------------------
abc
测试发贴""abc
abc

25 rows selected.

Elapsed: 00:00:00.04

3.定时优化同步域索引 
创建定时任务,定期优化和同步域索引

SQL> create or replace procedure hsp_sync_index as
  2  begin
  3  ctx_ddl.sync_index('id_cont_msg');
  4  end;
  5  /

Procedure created.

Elapsed: 00:00:00.08
SQL> VARIABLE jobno number;  
SQL> BEGIN
   2 DBMS_JOB.SUBMIT(:jobno,'hsp_sync_index();',  
   3 SYSDATE, 'SYSDATE + (1/24/4)');  
   4 commit;  
   5 END;  
   6 /

PL/SQL procedure successfully completed.

Elapsed: 00:00:00.27
SQL> create or replace procedure hsp_optimize_index as
  2  begin
  3  ctx_ddl.optimize_index('id_cont_msg','FULL');
  4  end;
  5  /

SQL> VARIABLE jobno number;  
SQL> BEGIN
   2 DBMS_JOB.SUBMIT(:jobno,'hsp_optimize_index();',  
   3 SYSDATE, 'SYSDATE + 1');  
   4 commit; 
   5 END;
   6 /
Procedure created.

Elapsed: 00:00:00.03

PL/SQL procedure successfully completed.

Elapsed: 00:00:00.02
SQL>