关于lucene全匹配检索的问题

最新推荐文章于 2022-01-15 11:12:40 发布

mbgmbg

最新推荐文章于 2022-01-15 11:12:40 发布

阅读量1.7k

点赞数

文章标签： lucene 数据库

本文链接：https://blog.csdn.net/mbgmbg/article/details/4310181

版权

lucene的分词检索自然不用说，可是我们的日常程序中还是经常会用到类似于数据库的等于操作。

应用中发现如果关键字为我们平时的数字ID，那么一般是没有问题的，但碰到英文和中文的时候就产生了麻烦。也就是说索引中的关键字不是数字，而是字符串（可能包含任意字符）

最近有一次的应用我是这样实现的

首先建立索引的时候需要进行等于操作的字段应为“建立索引但不分词”也就是Field.Index.UN_TOKENIZED。

检索的时候输入的信息不能分词，用到的分词器为KeywordAnalyzer

这样实现类似于数据库的等于操作。

但当输入的字符中间带有空格是，又产生了麻烦。结果我在建立索引时加了一个域，把所有含空格的都换成了加号，检索时输入的字符同样换成了加号，这样也对付实现了。

此种实现总感觉不伦不类，看来lucene用的时间太短了，还需要深入研究啊

今天写下自己博客中的第一篇日志，庆祝一下^_^

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mbgmbg

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lucene TermQuery搜索英文有结果，中文无结果

OOxianxian的博客

04-21

1225

今天lucene项目中，精确搜索用了TermQuery，然而很失望，搜索不出来任何结果。后来寻找原因，经过查找，发现可能是TermQuery只识别英文，对中文识别支持度不够好。我特意在数据库中插入了一条英文记录，然后再次运行代码，发现的确仅插入的那条记录被搜索到了，验证了我上述猜测。以前用的标准分词器 QueryParser queryParser = new QueryParser("c...

全文检索 Lucene

weixin_35994859的博客

02-04

772

全文检索 Lucene 网上学习黑马课程后，在原有笔记的基础上进行总结课程计划 lucene入门什么是lucene Lucene的作用使用场景优点和缺点 lucene应用索引流程搜索流程 field域的使用索引库维护分词器高级搜索实战案例 Lucene高级 Lucene底层存储结构词典排序算法 Lucene优化 Lucene使用的一些注意事项 1 搜索技术理论基础 1.1 为什么要学习Lucene 原来的方式实现搜索功能，我们的搜索流程如下图：上

参与评论您还未登录，请先登录后发表或查看评论

lucene 关键词完全匹配和分词匹配

a704397849的博客

09-16

1560

原文 https://ask.csdn.net/questions/271535?utm_medium=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link 默认

小议lucene搜索表达式中的AND和OR以及+和空格

pwlazy的专栏

03-15

7221

在构造搜索表达式的时候你可以使用+(与AND相当,当不完全相同) 和空格(与OR相当),也可以使用AND和OR,当然也可以都混在一起,个人感觉最好不要构造复杂的表达式的时候千万要注意,特别是使用AND OR的时候,搜索引擎解析表达式的时候并非按照常规的先AND后OR比如tag:a AND tag:b OR title:a AND title:b 初看下来以为这个表达式与下面的等价 (ta

lucene完全匹配

sinat_34080511的博客

05-25

3516

{ //QueryParser parser = new QueryParser("entity", analyzer); //Query Query; /* Term term = new Term("entity", query); System.out.println("ter

lucene：索引 -不分词

weixin_30556959的博客

12-19

426

package com.capinfotech.faq.classifier; import java.util.*; import java.io.File; import java.io.IOException; import org.apache.lucene.document.Field; import org.apache.lucene.document.Field.I...

Lucene实现全文检索

淮右布衣的博客

09-29

272

一、什么是全文检索 1、数据的分类 1)结构化数据格式固定、长度固定、数据类型固定。例如数据库中的数据 2)非结构化数据 word文档、pdf文档、邮件、html、txt 格式不固定、长度不固定、数据类型不固定。 2、数据的查询 1）结构化数据的查询 SQL语句，查询结构化数据的方法。简单、速度快。 2）非结构化数据的查询从文本文件中找出包含spring单词的文件。 1、目测 2、使用程序吧文档读取到内存中，然后匹配字符串。顺序扫描。 3、把非结构化数据变成结构化数据先跟根据

lucene.net+盘古分词多条件全文检索并匹配度排序

04-27

并按照lucene的得分算法进行多条件检索并按照得分算法计算匹配度排序。可以输入一句话进行检索。 lucene.net的版本为2.9.2 盘古分词的版本为2.3.1 并实现了高亮功能。高亮上使用的是盘古分词的高亮算法。有点小bug...

基于Lucene的语段模糊匹配中文检索系统设计与实现 (2009年)

04-27

### 基于Lucene的语段模糊匹配中文检索系统设计与实现 #### 一、引言随着信息技术的发展，信息检索技术在图书馆等领域的应用变得越来越重要。然而，在实际应用过程中，用户经常面临的问题是：能够记住文章或书籍...

人工智能-项目实践-检索系统-基于lucene全文检索引擎实现的短文本匹配系统

最新发布

02-27

基于lucene全文检索引擎实现的短文本匹配系统 ajax什么时候执行success，什么时候执行error 简单的说Ajax请求通过XMLHttpRequest对象发送请求，该对象有四个状态（readyState）： 0-未初始化、1-正在初始化、2-发送...

Lucene—全文检索工具包

许久

01-15

1189

一、Lucene简介 Lucene是Apache Jakarta家族中的⼀个开源项目，是⼀个开放源代码的全文检索引擎工具包，但它不是⼀个完整的全文检索引擎，而是⼀个全文检索引擎的架构，提供了完整的查询引擎、索引引擎和部分文本分析引擎。 Lucene提供了⼀个简单却强大的应用程式接口，能够做全文索引和搜寻。在Java开发环境⾥Lucene是⼀个成熟的免费开源工具，是⽬前最为流行的基于 Java 开源全文检索工具包。数据总体分为两种：结构化数据：指具有固定格式或有限长度的数据，如数据库、元数据等

lucene 搜索不到中文

TIANDIZHUSHEN的专栏

07-30

1144

public class TestQuery { static Hits hits = null; static Query query = null; static String queryString = "放得开"; static DataOperator db = new DataOperator(); static

Java lucene上传文档后搜索不到

tmaczt的博客

11-19

404

现象：线上环境突然出现文档上传后搜索不到。原因：索引目录中生成了write.lock文件解决方案：删除write.lock文件

lucene-检索文本内容失败问题

gsy_yang的博客

03-03

1981

问题描述： ①通过创建索引库，将源文件夹中的文件，通过document文档对象，创建索引存储在索引库中检索，发现当查询 Field域为content（文件内容时），发现检索不到。分析原因： ①在创建索引的时候，指定了中文分词器IKAnalyzer，希望通过中文分词器进行分词，通过luke查询可以发现如下：所以，排除BUG关键词未分词，既然已经分词，为什么通过代码查询不到呢？查询

搜索引擎（Lucene介绍、分词器详解）

weixin_34248023的博客

01-17

1853

2019独角兽企业重金招聘Python工程师标准>>> ...

Lucene空格查询为并且关系

闲谈

09-08

285

默认空格两边的词为或者关系改为并且关系，执行： QueryParser parser = new QueryParser("fieldName" , Analyzer); parser.serDefaultOperation(QueryParser.AND_OPERATOR); 就搞定了。...

lucene IK分词器 +不分词

weixin_43147226的博客

03-22

1230

需求名字东方朔 IK :东方朔当我查询索引东方朔的时候并没有出现我所需要的结果，是因为没有东方朔这个词因此我需要不分词。寻找不分词的方法寻找了很久，首先是自定义扩展的词，但是这个问题我遇到了版本不合适，听说IK2012分词器不支持4.0以上的版本，不过当我把lucene版本降到3.6的时候，并且还把编码弄为utf-8 no Bom 了，我最终结果还是不行。你们可以先试试先看： https://blog.csdn.net/whzhaochao/article/details/5013

lucene4.6 StringField默认不分词

乱七八糟

12-17

749

document.add(new StringField("name", user.getName(), Store.YES)); 改成 document.add(new TextField("name", user.getName(), Store.YES)); TextField默认分词

Lucene：全文检索核心技术与应用

而全文检索则更关注精确的文本匹配，避免这种问题。总结来说，Lucene作为全文检索的核心技术，为应用程序提供了强大的搜索功能，使得非结构化的文本数据能够快速、准确地进行检索，从而满足用户在信息爆炸时代高效...