全文检索技术

原创 2004年09月27日 17:35:00

Oracle9i全文検索技術<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

作成者:徐峰       

作成日:2004/03/11    

説明

Oracle9i Databaseに高速全文検索機能を付加し、データベースの利用価値を飛躍的に高める機能です。他の全文検索システムとは異なり、Oracle Textの検索エンジンはデータベース・カーネルに組み込まれていますので、高い管理性、信頼性、拡張性、整合性などOracle9i Databaseの持つメリットをそのまま受け継いだシステムの構築が可能です。

また、Microsoft Office文書やPDFファイルからも日本語文字列を抽出して高速検索用のテキスト索引を作成する機能が実装されていますので、普段使用している文書ファイルやプレゼンテーションファイルのすべてでOracle Textの提供する検索機能を利用可能です。

簡単な手順書

1.      表を作成する

バイナリー・ファイルはBLOBを利用する、テキスト・ファイルはCLOBを利用する。

    例:CREATE TABLE docs (id NUMBER PRIMARY KEY, text BLOB)

2.       ファイルをロードする

INSERT 文に加え、Oracle では次のような自動化された方法を使用して、ファイル・システムから表にテキスト・データ(ドキュメント、ドキュメントへのポインタおよびURL など)をロードできます。

l         SQL*Loader

l         BFILE からLOB をロードするためのPL/SQL プロシージャDBMS_LOB.LOADFROMFILE()

l         Oracle Call Interface

関連項目:

l         DBMS_LOB パッケージの詳細は、『Oracle9i PL/SQL パッケージ・プロシージャおよびタイプ・リファレンス』を参照してください。

l         LOB の使用方法の詳細は、『Oracle9i アプリケーション開発者ガイド-ラージ・オブジェクト』を参照してください。

l         Oracle Call Interface の詳細は、『Oracle Call Interface プログラマーズ・ガイド』を参照してください。

3.       索引を作成する

テキスト・データを表にロードした後、CREATE INDEX 文を使用してCONTEXT 索引を作成できます。索引の作成時にPARAMETERS 句を指定しないと、索引はデフォルトのパラメーたとえば、次のコマンドによって、docs 表内のtext 列にmyindex というCONTEXT 索引

例:CREATE INDEX myindex ON docs(text) INDEXTYPE IS CTXSYS.CONTEXT;

4.       検索の操作を行う

例:select id from docs where contains (text, ‘検索内容’)

5.       索引のメンテナンス

索引のメンテナンスは、アプリケーションが元表のドキュメントを挿入、更新または削除した後に必要です。索引のメンテナンスには、索引の同期化と最適化が含まれます。

Lucene技术---Solr实现全文检索技术

借用百度对solr和lucenen技术的了解.百度百科是这样解释的Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务...
  • elsery
  • elsery
  • 2015年06月13日 23:29
  • 1720

全文检索技术学习(一)——Lucene的介绍

本文我将为大家讲解全文检索技术——Lucene,现在这个技术用到的比较多,我觉得大家还是应该掌握一下,不说多精通,但是应该有所了解。在讲解之前,我们先来看一个案例,通过该案例引出全文检索技术——Luc...
  • yerenyuan_pku
  • yerenyuan_pku
  • 2017年05月20日 18:26
  • 906

全文检索技术与Lucene的使用

概念 在谈全文检索之前,首先让我们来了解一下什么是信息检索。信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们只讨论文本信息的检索...
  • happylee6688
  • happylee6688
  • 2014年05月28日 16:58
  • 3835

全文检索Lucene和Solr简介

在电商项目中,经常会遇到的是海量数据的查询。如果在海量数据中进行查询的话,使用sql语句进行查询的话,效率非常的低。        使用Lucene和Solr就是为了解决这种问题的。首先,Lucen...
  • zc474235918
  • zc474235918
  • 2016年04月25日 19:49
  • 1319

《自然语言处理技术在中文全文检索中的应用》笔记

全文检索技术 全文检索 是一种面向全文和提供全文的检索技术, 其核心技术是将文档中所有基本元素的出现信息记录到索引库中, 检索时允许用户采用自然语言表达其检索需求, 并借助截词、邻词等匹配方法直...
  • riverflowrand
  • riverflowrand
  • 2015年11月02日 15:32
  • 609

Oracle的全文检索技术

Oracle的全文检索技术Oracle一直致力于全文检索技术的研究,当Oracle9i Rlease2发布之时,Oracle数据库的全文检索技术已经非常完美,Oracle Text使Oracle9i具...
  • VCtea
  • VCtea
  • 2005年05月27日 11:26
  • 3068

Elasticsearch概述、ES概念、什么是搜索、全文检索、Elasticsearch功能(来自网络+学习资料)

1.Elasticsearch概述Elasticsearch是一个分布式、高性能、高可用、可伸缩的搜索和分析系统。 以下是来自百度百度的介绍: ElasticSearch是一个基于Lu...
  • toto1297488504
  • toto1297488504
  • 2017年07月19日 15:59
  • 628

全文检索技术---solr

1       Solr介绍 1.1   什么是solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr可以独立运行在Jetty、T...
  • xjy9266
  • xjy9266
  • 2017年07月19日 14:11
  • 112

oracle9i的全文检索技术

 关键词 oracle text 全文检索  oracle一直致力于全文检索技术的研究,当oracle9i rlease2发布之时,oracle数据库的全文检索技术已经非常完美,oracle text...
  • baggio785
  • baggio785
  • 2005年10月08日 13:17
  • 474

Lucene 全文检索技术入门

一、 搜索引擎的历史          萌芽:Archie、Gopher          起步:Robot(网络机器人)的出现与spider(网络爬虫)          发展:e...
  • aideyi
  • aideyi
  • 2014年05月23日 17:26
  • 375
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:全文检索技术
举报原因:
原因补充:

(最多只允许输入30个字)