全文检索
wangyunpeng0319
这个作者很懒,什么都没留下…
展开
-
lucene全文检索案例
最近工作中使用到的全文检索案例,分享下。使用lucene最新版本为3.6,该案例是从磁盘文档建立索引,如下介绍:lucene简介Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在原创 2012-12-05 14:25:22 · 908 阅读 · 0 评论 -
ElasticSearch 倒排索引、分词
es使用称为倒排索引的结构达到快速全文搜索的目的。 一个倒排索引包含一系列不同的单词,这些单词出现在任何一个文档,对于每个单词,对应着所有它出现的文档。 比如说,我们有2个文档,每个文档有一个conteng字段。内容如下:“ The quick brown fox jumped over the lazy dog”“ Quic转载 2017-10-15 22:43:42 · 1427 阅读 · 0 评论 -
倒排索引
常规的索引是文档到关键词的映射:文档——>关键词但是这样检索关键词的时候很费力,要一个文档一个文档的遍历一遍。(这事不能忍~)于是人们发明了倒排索引~倒排索引是关键词到文档的映射关键词——>文档这样,只要有关键词,立马就能找到她在那个文档里出现过,剩下的事就是把她揪出来了~~~可能是因为将正常的索引倒过来了吧,所以大家叫他倒排索引,可我依然喜欢叫他反向索引~转载 2017-10-15 18:07:49 · 201 阅读 · 0 评论 -
ElasticSearch java API - 聚合查询
以球员信息为例,player索引的player type包含5个字段,姓名,年龄,薪水,球队,场上位置。index的mapping为:[plain] view plain copy"mappings": { "quote": { "properties": { "adj转载 2017-10-15 17:59:12 · 2571 阅读 · 0 评论 -
elasticsearch 编程api 1
https://www.elastic.co/guide/en/elasticsearch/client/java-api/index.html 我这里,elasticsearch用的是2.4.X版本。 https://www.elastic.co/guide/en/elasticsearch/client/java-转载 2017-10-15 17:29:53 · 761 阅读 · 0 评论 -
elasticsearch 编程api 2
我们继续。 test13测试(查询类型searchType)https://www.elastic.co/guide/en/elasticsearch/reference/2.4/search-request-search-type.htmlElasticsearch之四种查询类型和搜索原理(博主推荐) 1 package zh转载 2017-10-15 17:28:51 · 812 阅读 · 0 评论 -
elasticsearch使用心得
1、分页搜索中from/size:搜索请求一次请求最大量为[10000]。我们的请求量已经超标,因此报错,异常信息提示我们请求大数据量的情况下使用Scroll API。2、scroll api 可以获取所有的文档信息,而from/size有数量限制3、原创 2017-10-14 23:30:16 · 271 阅读 · 0 评论 -
Elasticsearch之四种查询类型和搜索原理
Elasticsearch Client发送搜索请求,某个索引库,一般默认是5个分片(shard)。 它返回的时候,由各个分片汇总结果回来。 官网APIhttps://www.elastic.co/guide/en/elasticsearch/client/java-api/2.4/inde转载 2017-10-12 18:43:57 · 34412 阅读 · 3 评论 -
Elasticsearch与Solr
Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。转载 2017-10-12 10:07:52 · 221 阅读 · 0 评论 -
Elasticsearch segments merge
这两周主要看了下 Elasticsearch(其实是Lucene)的 segments 的 merge 流程。事情起因是,线上的ES有些大索引,其中的segments 个数几十个,每个大小100M+,小 segments 若干,而遇到问题就是这些大的 segments 不再做 merge 了,除非强制进行forceMerge 操作,由于我们第一次ES上线,其实也不清楚这究竟是个问题还是本来 Luc转载 2017-11-06 11:01:07 · 2633 阅读 · 0 评论