Lucene.NET介绍

最新推荐文章于 2024-09-12 14:03:22 发布

.NET跨平台

最新推荐文章于 2024-09-12 14:03:22 发布

阅读量647

点赞数 1

分类专栏： Lucene.NET框架

原文链接：https://blog.csdn.net/WuLex

版权

Lucene.NET框架专栏收录该内容

5 篇文章 3 订阅

订阅专栏

Lucene.Net只是一个全文检索开发包，不是一个成型的搜索引擎

功能就是负责将文本数据按照某种分词算法进行切词,分词后的结果存储在索引库中,从索引库检索数据的速度灰常快

文本数据：Lucene.Net只能对文本信息进行检索，所以非文本信息要么转换成为文本信息,要么你就死了这条心吧！
分词算法：将一句完整的话分解成若干词汇的算法常见的一元分词(Lucene.Net内置就是一元分词,效率高,契合度低),二元分词,基于词库的分词算法(契合度高,效率低)…
切词:将一句完整的话,按分词算法切成若干词语
- 比如：“不是所有痞子都叫一毛” 这句话,如果根据一元分词算法则被切成: 不是所有痞子都叫一毛
- 如果二元分词算法则切成: 不是是所所有有痞痞子子都都叫叫一一毛
- 如果基于词库的算法有可能:不是所有痞子都叫一毛具体看词库
索引库:简单的理解成一个提供了全文检索功能的数据库

Lucene.Net是一个C#开发的开源全文索引库，其源码包括“核心”与“外围”两部分。外围部分实现辅助功能，而核心部分包括：

Lucene.Net.Index 提供索引管理，词组排序。
Lucene.Net.Search 提供查询相关功能。
Lucene.Net.Store 支持数据存储管理，主要包括I/O操作。
Lucene.Net.Util 公共类。
Lucene.Net.Documents 负责描述索引存储时的文件结构管理。
Lucene.Net.QueryParsers 提供查询语法。
Lucene.Net.Analysis 负责分析文本。

依赖

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。