lucene 关键词完全匹配和分词匹配

最新推荐文章于 2022-10-06 19:14:12 发布

无、涯

最新推荐文章于 2022-10-06 19:14:12 发布

阅读量1.5k

点赞数 2

分类专栏： java 文章标签： lucene

原文链接：https://ask.csdn.net/questions/271535?utm_medium=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link

版权

java 专栏收录该内容

37 篇文章 2 订阅

订阅专栏

本文介绍了Lucene查询解析的两种方式：默认的分词匹配和使用双引号实现的完全匹配。在不使用双引号时，关键词如'律师事务所'可以匹配到包含该词的部分内容；而当关键词被双引号包围时，如"律师事务所"，则只会匹配精确的完整短语。了解这一查询机制对于精准搜索至关重要。

摘要由CSDN通过智能技术生成

原文

https://ask.csdn.net/questions/271535?utm_medium=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant_t0.none-task-ask-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link

默认是分词匹配(不完全匹配)

query.parse(keyword);

举例：keyword 是 “律师事务所”
可以匹配查询到 “XX律师事务所xxx” ，也能匹配查询到 “XX律师XX事务所XX”

给关键字加上双引号，可以实现完全匹配

query.parse("\""+keyword+"\"");

举例：keword 是 “律师事务所”
可以匹配 “XX律师事务所xxx” ，但不能匹配查询到 “XX律师XX事务所XX”

stack overflow答案地址：
http://stackoverflow.com/questions/36418334/how-to-use-lucene-to-search#

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

无、涯

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Lucene分词原理与代码实例讲解

程序员光剑

07-25

282

Lucene分词原理与代码实例讲解 1. 背景介绍 1.1 问题的由来在信息检索和自然语言处理领域中,分词(Tokenization)是一个基础且关键的预处理步骤。分词的目的是将连续的文本流拆分为一个个有意义的词元(Token),以便后续的

Lucene+分词器精确提取用户自定义关键词(Lucene版本3.6)

热门推荐

EchoYY的博客

10-20

1万+

Lucene+分词器精确提取用户自定义关键词

参与评论您还未登录，请先登录后发表或查看评论

lucene完全匹配

sinat_34080511的博客

05-25

3516

{ //QueryParser parser = new QueryParser("entity", analyzer); //Query Query; /* Term term = new Term("entity", query); System.out.println("ter

Lucene全面匹配

hannaqq的专栏

04-01

1023

当想要完全匹配某个词，而且当词中又有特殊字符时，该怎么做呢？ 在create index时，create Field的时候可以设置Field的第三个参:Field.Index。 Field.Index告诉IndexWriter怎么样去对Field做索引。 Field.Index.TOKENIZED：我们把字符串利用支持IndexWriter的Analyzer进行分词生成索引 Field.I

关于lucene全匹配检索的问题

mbgmbg的专栏

06-30

1737

lucene的分词检索自然不用说，可是我们的日常程序中还是经常会用到类似于数据库的等于操作。应用中发现如果关键字为我们平时的数字ID，那么一般是没有问题的，但碰到英文和中文的时候就产生了麻烦。也就是说索引中的关键字不是数字，而是字符串（可能包含任意字符）最近有一次的应用我是这样实现的首先建立索引的时候需要进行等于操作的字段应为“建立索引但不分词”也就是Field.Index.UN

使用Lucene.net进行全文查找多关键字匹配

diaoque0768的博客

12-17

129

Lucene是一个开源的搜索引擎，开发语言是Java，Lucene.net是它的.NET版本。可以在C#中方便的调用。 Lucene.net目前最新版本是3.0.3，你可以从官方网站下载到最新版本：http://lucenenet.apache.org/ 使用Lucene.net进行全文查找首先要根据数据创建索引，然后再根据索引来查找关键字。本文不做任何原理性的解释，需要深入研究的请...

基于Lucene的语段模糊匹配中文检索系统设计与实现 (2009年)

04-27

在这种情况下，传统的基于关键字/词的检索方法往往无法满足用户的需求，因为这些方法要求输入条件与文档内容完全匹配，或者查询结果不能很好地对应用户感兴趣的内容。 #### 二、系统设计与实现 ##### 2.1 开放源码...

Lucene关于几种中文分词的总结

05-05

Lucene作为一款强大的全文检索库，虽然内置了StandardAnalyzer，但其对中文分词的支持并不完全满足所有应用需求。因此，开发者们开发了一系列专门针对中文分词的Analyzer，以提升搜索效率和准确度。以下是对几种常见...

.Net Lucene+盘古分词站内搜索

04-24

《.Net Lucene+盘古分词：打造高效站内搜索解决方案》在现代网站和应用程序中，提供精准、快速的站内搜索...同时，不断学习和掌握Lucene.NET和盘古分词的最新特性和最佳实践，将有助于我们持续提升搜索系统的效能。

lucene 中文完全匹配不是top1

Talk Is Cheap

12-11

779

你是谁和你是谁啊和你爸爸是谁的lucene分数一样解决方案：把SmartChineseAnalyzer换成StandardAnalyzer，其实的其实，按字（而不是词）搜本来就挺好 SmartChineseAnalyzer还有其他问题，比如一串英文数字混合的string用作ID，不能完全匹配的搜，会误搜出其他接近的string ...

使用lucene搜索引擎实现对关键字的简单查询

Kobe Bryant的专栏

03-19

1759

最近闲来无事，就摸索着在之前做的社区论坛课程设计上，实现一个对发表帖子进行搜索的功能。通过百度查询，接触并初步学习了一下lucene，也是新手，写出来当做总结吧。 lucene是一个非常优秀的全文检索引擎，使用lucene需要用到apache开源组织提供的lucene-core jar包，可以在官网http://www.apache.org/dyn/closer.cgi/lucene/

浅谈lucene中文检索

ergouy's blog

05-23

1029

最近学习了Lucene，做一些必要的笔记，一来是对自己学习的知识的巩固，二来对有同样问题的人有参考作用文章目录一 lucene简介二 lucene优势三开发思路四中文检索举例五总结一 lucene简介 Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检索的功能，或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库，由Apache软件基金会支持和提供。二 lucene优势 .

搜索引擎技术Lucene

最新发布

zhyy-ang的博客

10-06

1113

Lucene是一套用于全文检索和搜寻的开源程序库，由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口（API），能够做全文索引和搜寻，在Java开发环境里Lucene是一个成熟的免费开放源代码工具。Lucene并不是现成的搜索引擎产品，但可以用来制作搜索引擎产品。Lucene 这个开源项目，使得 Java开发人员可以很方便地得到像搜索引擎google baidu那样的搜索效果。

Lucene 常用关键字简单解释

fishhappy365的专栏

08-24

235

lucene最主要就是做两件事:建立索引和进行搜索来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西，叫搜索。 IndexWriter:lucene中最重要的的类之一，它主要是用来将文档加入索引，同时控制索引过程中的一些参数使用。 Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有StandardAna...

Lucene学习-创建索引、关键词查询

Bart_G的博客

04-03

567

Lucene是一个全文检索的开源软件，对需要查询的关键词进行检索 1. 需要的jar包 lucene-analyzers-3.0.2.jar lucene-core-3.0.2.jar lucene-highlighter-3.0.2.jar lucene-memory-3.0.2.jar 2. 编码步骤2.1 准备Article文章类public class Article { priva

lucene 按照匹配度排序_Lucene搜索详解

weixin_39843738的博客

12-04

704

上篇说了Lucene索引，建好了索引，后面就是需要查询搜索了。Lucene搜索代码示例public class SearchBaseFlow { public static void main(String[] args) throws IOException, ParseException { // 使用的分词器 Analyzer analyzer = new IKAnalyz...

Lucene之——获取索引关键字给Jquery自动填充框架使用

冰河的专栏

11-04

1753

通过Lucene的lukeall-1.0.0.jar 通过 java –jar lukeall-1.0.0.jar 可以通过界面的方式可以看到索引库的所有信息截图如下：但是现在我们需要获取合适的Term,然后通过命中率排序, 最后的结果转化为 JSON格式交给Jquery的自动填充框架如何实现呢? Lucene中有个IndexSearcher：此类是用来根据Query查询语句来查

lucene 按照匹配度排序_开源项目——基于EntityFrameworkCore和Lucene.NET实现的全文搜索引擎库...

weixin_39696665的博客

12-04

239

在迁我的博客项目从.NET Framework到.NET Core的时候，发现http://Lucene.NET的API已经完全变了，之前的LuceneHelper自然就不能用了，于是临时使用了SearchExtensions这个库来解决，但是用过几天之后自然也就发现了问题，那就是搜索不能按结果匹配度进行排序，而且还慢，所以博客搜索页的搜索结果自然也就不是那么尽人意，比如搜索“会声会影”，这样的搜...

Lucene分词器

Winyar的博客

07-19

297

介绍历史: 创始人Doug Cutting(hadoop); lucene:是搜索引擎的工具包基于java编写的特点稳定,索引性能高(倒排索引) 现代硬盘每小时索引150G数据(索引:创建索引文件) java运行时要求的堆内存1MB 增量索引和批量索引一样快提供排名支持多种主流的搜索功能:短语,通配符,模糊,近似,范围,此项,多义词等查询功能 lucene的分词计算分词:分词的过程就...

Java全文索引引擎Lucene详解：性能优化与分词原理

3. 功能丰富：Lucene提供了更灵活的查询语法和分词能力，支持多关键字查询、短语匹配等，使得搜索体验更加精准和友好。 4. 安全性考虑：与数据库查询不同，直接基于文件系统的检索不会涉及SQL注入等安全问题。在...

lucene 关键词完全匹配 和 分词匹配

默认是分词匹配(不完全匹配)

给关键字加上双引号，可以实现完全匹配

lucene 关键词完全匹配和分词匹配