全文检索lucence(一)——基本原理

Lucene是Java的全文检索引擎框架,常用于嵌入式应用系统中提供检索功能。它能处理结构化、非结构化和半结构化数据,并通过建立索引来提升检索速度。MongoDB则侧重于大型文件的管理,而Lucene基于索引进行检索。Lucene的核心概念包括索引管理和分词器。未来将从代码层面深入学习Lucene。
摘要由CSDN通过智能技术生成

一、什么是Lucence:

    是java的一个全文检索的引擎框架框架,可以像jbpm工作流一样,嵌入到各种应用系统中,提供检索的功能。


二、数据处理概览:

     结构化数据:

       具有固定长度、固定格式:sql、mysql、Oracle处理的数据。

    非结构化数据:

        没有固定的格式、长度:Word、邮件等

    半结构化数据:

        xml、html等,可以抽离出后,按照结构化数据处理。

    因为关系数据具有稳定结构的关系,所以,可以统一进行管理,而且效率也比较高&#

评论 38
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值