这篇文章开始介绍Oracle全文索引的STOPLIST属性。首先介绍的是BASIC_STOPLIST。[@more@]Oracle的全文索引允许用户建立停用词,来屏蔽那些包含信息量比较小且出现概率比较高的词语。
比如英文中的a、this、are、the等词语,几乎每篇文章中都会包含这些常用词,因此对这些词语进行索引的意义不大。
SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));
表已创建。
SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));
Table created.
SQL> INSERT INTO T VALUES (1, 'THIS IS A STOPLIST EXAMPLE.');
1 row created.
SQL> COMMIT;
Commit complete.
SQL> exec CTX_DDL.CREATE_STOPLIST('TEST_BASIC', 'BASIC_STOPLIST');
PL/SQL procedure successfully completed.
SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');
Index created.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
建立了一个BASIC_STOPLIST后,由于并没有添加停用词,这个BASIC_STOPLIST停用词表是空的。这个时候不会屏蔽任何词语。
SQL> exec CTX_DDL.ADD_STOPWORD('TEST_BASIC', 'A');
PL/SQL procedure successfully completed.
SQL> drop index IND_T_DOCS
2 ;
Index dropped.
SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');
Index created.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;
no rows selected
在上面的例子中,将单词’a’添加到了停用词表中,重新建立索引后,发现停用词已经生效。
比如英文中的a、this、are、the等词语,几乎每篇文章中都会包含这些常用词,因此对这些词语进行索引的意义不大。
SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));
表已创建。
SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));
Table created.
SQL> INSERT INTO T VALUES (1, 'THIS IS A STOPLIST EXAMPLE.');
1 row created.
SQL> COMMIT;
Commit complete.
SQL> exec CTX_DDL.CREATE_STOPLIST('TEST_BASIC', 'BASIC_STOPLIST');
PL/SQL procedure successfully completed.
SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');
Index created.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
建立了一个BASIC_STOPLIST后,由于并没有添加停用词,这个BASIC_STOPLIST停用词表是空的。这个时候不会屏蔽任何词语。
SQL> exec CTX_DDL.ADD_STOPWORD('TEST_BASIC', 'A');
PL/SQL procedure successfully completed.
SQL> drop index IND_T_DOCS
2 ;
Index dropped.
SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');
Index created.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.
SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;
no rows selected
在上面的例子中,将单词’a’添加到了停用词表中,重新建立索引后,发现停用词已经生效。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/271283/viewspace-1022468/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/271283/viewspace-1022468/