第一种方法:
一、创建示例表
CREATE TABLE T_FULLTEXT_DEMO
(
ID NUMBER NOT NULL,
TITLE VARCHAR2(100) NULL,
REMARK VARCHAR2(200) NULL,
FILE_NAME VARCHAR2(200) NULL,
CONSTRAINT T_FULLTEXT_DEMO_PK PRIMARY KEY ( ID )
);
二、对TITLE和REMARK建立索引
BEGIN
CTXSYS.CTX_DDL.CREATE_PREFERENCE('MYMDS','MULTI_COLUMN_DATASTORE');
CTXSYS.CTX_DDL.SET_ATTRIBUTE('MYMDS', 'COLUMNS', 'TITLE, REMARK');
END;
CREATE INDEX T_FULLTEXT_DEMO_IDX ON T_FULLTEXT_DEMO(TITLE) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS('DATASTORE MYMDS');
三、建立存储选项参数、语法分析器
BEGIN
--CTX_DDL.DROP_PREFERENCE('MY_LEXER');
--CTX_DDL.DROP_PREFERENCE('MY_DATASTORE_PREFS');
CTX_DDL.CREATE_PREFERENCE ('MY_LEXER', 'CHINESE_VGRAM_LEXER');
CTX_DDL.CREATE_PREFERENCE ('MY_DATASTORE_PREFS', 'FILE_DATASTORE');
CTX_DDL.SET_ATTRIBUTE ('MY_DATASTORE_PREFS', 'PATH', 'E:\Projects\My_Documents; E:\Projects\My_Documents\UML_DOC');
END;
四、对文档建立全文检索索引
CREATE INDEX T_FULLTEXT_DEMO_FILE_IDX ON T_FULLTEXT_DEMO(FILE_NAME) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS('DATASTORE MY_DATASTORE_PREFS LEXER MY_LEXER');
五、插入测试数据
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(1,'德鲁克的《管理:任务、责任、实践》','管理类书籍','德鲁克的《管理:任务、责任、实践》.doc');
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(2,'PB控件的属性事件和函数','PB技术书籍','PB控件的属性事件和函数.pdf');
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(3,'微软产品报价','微软软件产品报价','微软产品报价.xls');
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(4,'JavaScript 5.5','JavaScript语言帮助文档','JavaScript 5.5.CHM');
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(5,'ASCII码','ASCII码的各种进制表示方式和代表的意思','ASCII码.htm');
INSERT INTO T_FULLTEXT_DEMO(ID,TITLE,REMARK,FILE_NAME) VALUES(6,'UML数据库建模','UML数据库建模的相关知识','UML数据库建模.ppt');
六、同步索引和优化索引
若此时检索,应没有数据。
select * from T_FULLTEXT_DEMO
where contains(TITLE,'管理')>0;
需要将索引同步
BEGIN
CTXSYS.CTX_DDL.SYNC_INDEX('T_FULLTEXT_DEMO_FILE_IDX');
CTXSYS.CTX_DDL.SYNC_INDEX('T_FULLTEXT_DEMO_IDX');
END;
七、测试全文索引
select * from T_FULLTEXT_DEMO
where contains(TITLE,'管理')>0;
select * from T_FULLTEXT_DEMO
where contains(FILE_NAME,'德鲁克')>0;
八、优化索引
BEGIN
CTXSYS.CTX_DDL.OPTIMIZE_INDEX('T_FULLTEXT_DEMO_FILE_IDX','FULL');
CTXSYS.CTX_DDL.OPTIMIZE_INDEX('T_FULLTEXT_DEMO_IDX','FULL');
END;
第二种方法:
一、创建示例表
CREATE TABLE T_FULLTEXT_DEMO
(
ID NUMBER NOT NULL,
TITLE VARCHAR2(100) NULL,
REMARK VARCHAR2(200) NULL,
FILE_NAME BFILE NULL,
CONSTRAINT T_FULLTEXT_DEMO_PK PRIMARY KEY ( ID )
);
二、创建虚拟目录并授权(使用SYSTEM帐号)
CREATE DIRECTORY LOCAL_DIR AS 'E:\Projects\My_Documents';
GRANT READ ON DIRECTORY LOCAL_DIR TO JK_DANGAN;
三、插入示例数据
INSERT INTO T_FULLTEXT_DEMO
VALUES (1, '微软产品报价', '微软产品报价',BFILENAME('LOCAL_DIR','微软产品报价.xls'));
INSERT INTO T_FULLTEXT_DEMO
VALUES (2, '电子商务的瓶颈之我见', '电子商务的瓶颈之我见',BFILENAME(''LOCAL_DIR','电子商务的瓶颈之我见.doc'));
四、创建索引
CREATE INDEX T_FULLTEXT_DEMO_FILE_IDX ON T_FULLTEXT_DEMO(FILE_NAME) INDEXTYPE IS CTXSYS.CONTEXT;
五、测试
select * from T_FULLTEXT_DEMO
where contains(file_name,'数据库')>0
如何使用Oracle全文检索功能?
作者:eygle | English Version 【转载时请以超链接形式标明文章出处和作者信息及本声明】
链接:http://www.eygle.com/archives/2005/06/ecieoaoracleeia.html
本文简要说明全文检索功能的使用,不做太多的具体说明。
仅供参考使用方法。
1.授权
对具体使用全文检索的用户授权.
$ sqlplus "/ as sysdba" SQL*Plus: Release 9.2.0.4.0 - Production on Sun May 15 20:00:10 2005 Copyright (c) 1982, 2002, Oracle Corporation. All rights reserved. Connected to: Oracle9i Enterprise Edition Release 9.2.0.4.0 - 64bit Production With the Partitioning, OLAP and Oracle Data Mining options JServer Release 9.2.0.4.0 - Production SQL> grant ctxapp to club; Grant succeeded. SQL> connect ctxsys/password Connected. SQL> grant execute on ctx_ddl to club; Grant succeeded. |
2.使用应用用户连接
创建域索引
SQL> connect club/password Connected. SQL> begin ctx_ddl.create_preference('club_lexer','chinese_vgram_lexer'); end; 2 / PL/SQL procedure successfully completed. Elapsed: 00:00:00.03 SQL> create index id_cont_msg 2 on jivemessage ( SUBJECT ) indextype is ctxsys.context parameters('lexer club_lexer'); Index created. Elapsed: 00:01:22.42 SQL> select count(*) from jivemessage where contains(subject,'幸福')>0; COUNT(*) ---------- 1847 Elapsed: 00:00:00.17 SQL> select count(*) from jivemessage where subject like '%幸福%'; COUNT(*) ---------- 1841 Elapsed: 00:00:02.89 |
3.检索比较
以下是一个全文检索的示例,我们检索'abc',那么全文检索可以把包含'abc'的任何变化组合都查询出来,包括大小写、全半角,而如果用单纯的SQL实现同样的结果,则需要多次like之后union all,其性能差距是不可想象的。
全文检索在类似文本模糊查询上具有极大的优势。当然也可能存在问题,即词法分析器是否准确,会否漏掉部分内容等。
总的说来, 满足需求的技术就是好的技术,是否使用一项技术应该通过实践来检验.<br>
SQL> select subject from jivemessage where contains(subject,'abc') >0; SUBJECT -------------------------------------------------------------------------------- 【游戏】 把你的名字的首字母用智能ABC打出,看能出来什么? 游戏——把你的名字首字母用智能ABC打出来 智能ABC暗藏杀机 ABC ABC ABC ABC ABC ABC 哈哇abc abc SUBJECT -------------------------------------------------------------------------------- abc ABC 振奋爱的激情方案ABC 智能ABC的错吗? ABC全选 瓜果美容ABC 经典英文歌曲ABC,不好你拿版砖砍我,好就回帖顶一下! ×××abc Re: abc Re: abc Re: abc SUBJECT -------------------------------------------------------------------------------- abc 测试发贴""abc abc 25 rows selected. Elapsed: 00:00:00.04 |
3.定时优化同步域索引
创建定时任务,定期优化和同步域索引
SQL> create or replace procedure hsp_sync_index as 2 begin 3 ctx_ddl.sync_index('id_cont_msg'); 4 end; 5 / Procedure created. Elapsed: 00:00:00.08 SQL> VARIABLE jobno number; SQL> BEGIN 2 DBMS_JOB.SUBMIT(:jobno,'hsp_sync_index();', 3 SYSDATE, 'SYSDATE + (1/24/4)'); 4 commit; 5 END; 6 / PL/SQL procedure successfully completed. Elapsed: 00:00:00.27 SQL> create or replace procedure hsp_optimize_index as 2 begin 3 ctx_ddl.optimize_index('id_cont_msg','FULL'); 4 end; 5 / SQL> VARIABLE jobno number; SQL> BEGIN 2 DBMS_JOB.SUBMIT(:jobno,'hsp_optimize_index();', 3 SYSDATE, 'SYSDATE + 1'); 4 commit; 5 END; 6 / Procedure created. Elapsed: 00:00:00.03 PL/SQL procedure successfully completed. Elapsed: 00:00:00.02 SQL> |
转载于:https://blog.51cto.com/1311321/441620