Lucene的概述

一.作用

全文检索。

二.数据分类

1.结构化数据

格式固定,长度固定,数据类型固定。

例如:数据库

2.非结构化数据

格式不固定,长度不固定,数据类型不固定。

例如:word文档,pdf文档,邮件,html

三.数据的查询

1.结构化查询

sql语句。查询结构化数据的方法。简单、查询数据快。

2.非结构化查询

(1)方式一

使用程序将文档读取到内存中,然后匹配字符串,称之为顺序扫描。

(2)方式二

先将字符串以空格进行分隔,得到一个单词列表,基于单词列表创建一个索引。然后查询索引,根据单词和文档的对应关系找到文档列表。这就叫做全文检索。

四.全文检索的概念

先创建索引,然后再查询索引的过程就是全文检索。

索引创建一次,可以多次使用。每次查询数据很快。

五.全文检索的应用场景

1.搜索引擎

百度、谷歌、搜狗。

2.站内搜索

论坛搜索、微博、文章搜索。

3.电商搜索

淘宝、京东。

4.总结

只要有搜索的地方,就可以用全文检索。

六.什么是Lucene

Lucene是一个基于Java开发全文检索工具包。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值