搜索引擎
卜大伟
自由自在
展开
-
lucene 简单实现
lucene 简单实现public class TestLucene { /** * * 使用indexWriter 对数据建立索引.. * @throws IOException */ @Test public void testCreateIndex() throws IOException{ //索引存放的位置.... 1 Directory原创 2017-04-17 19:44:43 · 396 阅读 · 0 评论 -
搜索引擎选择: Elasticsearch与Solr
Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。转载 2017-06-05 16:11:52 · 1247 阅读 · 0 评论 -
ElasticSearch集群服务器配置
标签:一、安装简单的安装与启动于前文ElasticSearch初探(一)已有讲述,这里不再重复说明。二、启动1.自带脚本启动1)bin/elasticsearch,不太任何参数,默认在前端启动2)bin/elasticsearch-d,带参-d,表示在后台作为服务线程启动还可以设置更多的参数:bin/elasticsearch-X转载 2017-06-12 11:39:35 · 527 阅读 · 0 评论 -
词频、逆向文件频率
tf-idf TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。外文名term frequency–inverse document frequency缩写tf-idf用于信息检索数据挖掘的常用加权技术类别统计方法转载 2018-01-08 18:18:01 · 4096 阅读 · 0 评论 -
solrcloud 分片、建索引、查询的算法
Solr4.0包含了分布式的sorl解决方案solrCloud,可以做sharding切分,每个sharding中节点支持选举算法(leader,replica),在sharding里面支持query的负载均衡。在集群启动时,就需要声明当shard、collection等信息,启动过程中把集群的状态信息维护在zookeeper节点里。集群中的任何一台server都可以响应客户端的请求,包括索引操作...转载 2018-03-14 21:10:43 · 1395 阅读 · 0 评论 -
11
Exception in thread "main" NoNodeAvailableException[None of the configured nodes are available: [{#transport#-1}{fnXsQzMSThmJ_s8pKVnZng}{localhost}{127.0.0.1:9300}]] at org.elasticsearch.client.transp...原创 2018-06-12 17:39:17 · 348 阅读 · 0 评论