JAVA菜鸟学习总结：Lucene的搜索

最新推荐文章于 2024-03-27 15:38:45 发布

zw1129159168

最新推荐文章于 2024-03-27 15:38:45 发布

阅读量346

点赞数

文章标签： JAVA菜鸟学习总结：Lucene的搜索

本文链接：https://blog.csdn.net/zw1129159168/article/details/82732587

版权

小号
**

搜索Lucene的学习:

**
搜索按功能分为：垂直搜索（细分搜索），综合搜索，还此外包括站网站内搜索软件状语从句：搜索内部搜索的关键字：索引搜索引擎的英文通过网络爬虫从互联网电子杂志|网页放在临时库中，然后通过过滤筛选出符合规则并且索引库没有的网页，放入索引库，根据用户就索引可以电子杂志这些|网页倒排索引技术（反向索引）：将文档内容划分为多个词条，每个词条就是索引，词条独一无二，包含这些词条的文档就放在该词条的关联列表中，使用该索引就可以得到包含该词条的多个文档内容的Lucene的的是开发搜索引擎的工具包，Solr的是基于Lucene的开发的企业级搜索引擎产品，根据实现原理就是分词建立索引库：数据 - >文档对象 - >索引写入器（索引写入器配置对象（分词词）器，Lucene的版本），索引库地址） - >索引库maven工程导入依赖出现jre版本对的错，右键 - > maven->更新项目建立索引库：数据 - >文档对象 - >索引写入器（索引写入器配置对象，分词器） - >库索引新建索引库，向索引库添加索引的案例：

——————————- @SuppressWarnings（“resource”）public static void main（String [] args）抛出IOException {//创建文档对象Document doc = new Document（）; //添加字段，Store.YES表示存储，NO表示不存储// LongField IntField DoubleField // StringField TextField LongField id = new LongField（“id”，11L，Store.YES）; doc.add（ID）; StringField title = new StringField（“title”，“谷歌地图之父跳槽Facebook”，Store.YES）; doc.add（标题）; //指定索引库位置目录dir = FSDirectory.open（新文件（“D：\ index”））; //索引写入器的配置1配置Lucene的版本2指定分词器IndexWriterConfig iwc = new IndexWriterConfig（Version.LATEST，new StandardAnalyzer（））; //创建索引写入器indexwriter对象IndexWriter indexWriter = new IndexWriter（dir，iwc）; //将数据写入到索引库indexWriter.addDocument（DOC）; //提交indexWriter.commit（）; //关闭索引写入器indexWriter.close（）; }}

索引写入器记得提交后要关闭，不然其他索引写入器不能访问索引库StringField字段类默认不使用分词器，所以词条只有一个，文本字段字段类使用提供的分词器，词条项有多个Store.YES表示将数据存储在索引的文档列表，NO表示不储存Version.LATEST表示的Lucene的版本索引写入器支持批量提交（参数是一个集合）：Lucene的的默认的中文分词已经被弃用，现在IK的分类器（IKanalyzer）自定义分词器：在资源放入IKAnakyzer.cfg.xml配置文件，创建分词文件，写进自定义分词<？xml version =“1.0”编码=“UTF-8”？ > <！DOCTYPE属性SYSTEM“ http://java.sun.com/dtd/properties.dtd ”> < properties > < comment > IK Analyzer扩展配置 <！ - 用户可以在这里配置自己的扩展字典- > < dict“> ext.dic; <！ - 用户可以在这里配置自己的扩展停止词字典 - >

快捷键 - 加粗 `按按按按按按按按按按按按按按按按按按按按按按按按按按按按按Ctrl + B` - 斜体 `CTRL +我`- 引用`CTRL + Q` - 在一个面前 - 和 - `- - 和` `- 顺时针` `- 顺时针` `-`- 插入代码 `按下按下按下按下按下按+ +` `- 插图-横线-撤销-重做` $\Gamma（n）=（n-1）！\ quad \ foall n \ in \ mathbb N$ `flow st => start：开始e =>结束：结束操作=>操作：我的操作cond => condition：确认？st-> op - > cond cond（是） - > e cond（no） - >运算`

离线写博客即使用户在没有网络的情况下，也可以通过本编辑器离线写博客（直接在曾经使用过的浏览器中输入[write.blog.csdn.net/mdeditor](HTTP://写。 blog.csdn.net / mdeditor）即可。* Markdown编辑器使用浏览器离线存储将内容保存在本地。用户写博客的过程中，内容实时保存在浏览器缓存中，在用户关闭用户可以选择<我类别=浏览器或者其他异常情况下，内容不会丢失“icon-disk”>把正在写的博客保存到服务器草稿箱，即使换浏览器或者清除缓存，内容也不会丢失。>注意：虽然浏览器存储大部分时候都比较可靠，但为了你的数据安全，在联网后，请务必及时发表或者保存到服务器草稿箱*。

浏览器兼容1.目前，本编辑器对铬浏览器支持最为完整。建议大家使用较新版本的铬.3.IE9以下不支持4.IE9,10,11存在以下问题1.不支持离线功能1 .IE9不支持文件导入导出1.IE10不支持拖载文件导入--- [1]：HTTP：//math.stackexchange.com/ [2]：https：//开头github上的.com / jmcmanus /下页-额外“Pagedown Extra”[3]：http：//meta.math.stackexchange.com/questions/5020 / mathjax-basic-tutorial-and-quick-reference [4]：http：// bramp .github.io / js -sequence-diagrams / [5]：http：//adrai.github.io/flowchart.js/ [6]：https：//github.com/benweet/stackedit

zw1129159168

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JAVA菜鸟学习总结：Lucene的搜索

小号 **搜索Lucene的学习:** 搜索按功能分为：垂直搜索（细分搜索），综合搜索，还此外包括站网站内搜索软件状语从句：搜索内部搜索的关键字：索引搜索引擎的英文通过网络爬虫从互联网电子杂志|网页放在临时库中，然后通过过滤筛选出符合规则并且索引库没有的网页，放入索引库，根据用户就索引可以电子杂志这些|网页倒排索引技术（反向索引）：将文档内容划分为多个词条，每个词条就是索引，词条独...
复制链接

扫一扫