JAVA菜鸟学习总结:Lucene的搜索

小号
**

搜索Lucene的学习:

**
搜索按功能分为:垂直搜索(细分搜索),综合搜索,还此外包括站网站内搜索软件状语从句:搜索内部搜索的关键字:索引搜索引擎的英文通过网络爬虫从互联网电子杂志|网页放在临时库中,然后通过过滤筛选出符合规则并且索引库没有的网页,放入索引库,根据用户就索引可以电子杂志这些|网页倒排索引技术(反向索引):将文档内容划分为多个词条,每个词条就是索引,词条独一无二,包含这些词条的文档就放在该词条的关联列表中,使用该索引就可以得到包含该词条的多个文档内容的Lucene的的是开发搜索引擎的工具包,Solr的是基于Lucene的开发的企业级搜索引擎产品,根据实现原理就是分词建立索引库:数据 - >文档对象 - >索引写入器(索引写入器配置对象(分词词)器,Lucene的版本),索引库地址) - >索引库maven工程导入依赖出现jre版本 对的错,右键 - > maven->更新项目建立索引库:数据 - >文档对象 - >索引写入器(索引写入器配置对象,分词器) - >库索引新建索引库,向索引库添加索引的案例:

——————————- @SuppressWarnings(“resource”)public static void main(String [] args)抛出IOException {//创建文档对象Document doc = new Document(); //添加字段,Store.YES表示存储,NO表示不存储// LongField IntField DoubleField // StringField TextField LongField id = new LongField(“id”,11L,Store.YES); doc.add(ID); StringField title = new StringField(“title”,“谷歌地图之父跳槽Facebook”,Store.YES); doc.add(标题); //指定索引库位置目录dir = FSDirectory.open(新文件(“D:\ index”)); //索引写入器的配置1配置Lucene的版本2指定分词器IndexWriterConfig iwc = new IndexWriterConfig(Version.LATEST,new StandardAnalyzer()); //创建索引写入器indexwriter对象IndexWriter indexWriter = new IndexWriter(dir,iwc); //将数据写入到索引库indexWriter.addDocument(DOC); //提交indexWriter.commit(); //关闭索引写入器indexWriter.close(); }}

索引写入器记得提交后要关闭,不然其他索引写入器不能访问索引库StringField字段类默认不使用分词器,所以词条只有一个,文本字段字段类使用提供的分词器,词条项有多个Store.YES表示将数据存储在索引的文档列表,NO表示不储存Version.LATEST表示的Lucene的版本索引写入器支持批量提交(参数是一个集合):Lucene的的默认的中文分词已经被弃用,现在IK的分类器(IKanalyzer)自定义分词器:在资源放入IKAnakyzer.cfg.xml配置文件,创建分词文件,写进自定义分词<?xml version =“1.0”编码=“UTF-8”? > <!DOCTYPE属性SYSTEM“ http://java.sun.com/dtd/properties.dtd ”> < properties > < comment > IK Analyzer扩展配置 <! - 用户可以在这里配置自己的扩展字典- > < dict“> ext.dic; <! - 用户可以在这里配置自己的扩展停止词字典 - >

快捷键 - 加粗 按按按按按按按按按按按按按按按按按按按按按按按按按按按按按Ctrl + B - 斜体 CTRL +我- 引用CTRL + Q - 在一个面前 - 和 - - - 和 - 顺时针 - 顺时针 -- 插入代码 按下按下按下按下按下 按+ + - 插图-横线-撤销-重做 Γn=n1 quad foalln in mathbbN Γ ( n ) = ( n − 1 ) !   q u a d   f o a l l n   i n   m a t h b b N flow st => start:开始e =>结束:结束操作=>操作:我的操作cond => condition:确认?st-> op - > cond cond(是) - > e cond(no) - >运算

离线写博客即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入[write.blog.csdn.net/mdeditor](HTTP://写。 blog.csdn.net / mdeditor)即可。* Markdown编辑器使用浏览器离线存储将内容保存在本地。用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭用户可以选择<我类别=浏览器或者其他异常情况下,内容不会丢失“icon-disk”>把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。>注意:虽然浏览器存储大部分时候都比较可靠,但为了你的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱*

浏览器兼容1.目前,本编辑器对铬浏览器支持最为完整。建议大家使用较新版本的铬.3.IE9以下不支持4.IE9,10,11存在以下问题1.不支持离线功能1 .IE9不支持文件导入导出1.IE10不支持拖载文件导入--- [1]:HTTP://math.stackexchange.com/ [2]:https://开头github上的.com / jmcmanus /下页-额外“Pagedown Extra”[3]:http://meta.math.stackexchange.com/questions/5020 / mathjax-basic-tutorial-and-quick-reference [4]:http:// bramp .github.io / js -sequence-diagrams / [5]:http://adrai.github.io/flowchart.js/ [6]:https://github.com/benweet/stackedit

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值