搜索引擎
文章平均质量分 80
Garry1115
关注微信公众号“虾米聊吧”,获取更多技术知识干货,一起交流,一起学习~
展开
-
elasticsearch的分布式架构原理
对于全文检索,lucene是目前最流行的搜索库。以前我们都需要学习使用lucene,基于lucene做相关的开发,学习倒排索引的原理,而现在,我们可以直接使用现成的搜索框架了,因为现在很多这种搜索框架底层都是直接基于lucene的分布式搜索引擎,例如elasticsearch就是其中最典型的代表,我们亲切的简称其为es。现在分布式搜索基本已经成为大部分互联网行业的java体系的标配,其中尤为流行的就是es,记得我2014年的时候还在用用solr,估计那个时候大部分小伙伴也是一样。但是最近几年基本都.原创 2020-06-28 17:40:00 · 678 阅读 · 0 评论 -
elasticsearch索引结构和配置优化
elasticsearch索引结构和配置简单调优.1.搜索时对特定字段设置更高权值,以弱化相关性低的字段例如:我们在搜索时认为标题对我们更重要就可以对标题提高匹配权重boolQuery.must( QueryBuilders.matchQuery(HouseIndexKey.TITLE, rentSearch.getKeywords()) ...原创 2019-11-15 15:57:43 · 651 阅读 · 0 评论 -
elasticsearch搜素关键字自动补全(suggest)
elasticsearch搜素关键字自动补全顾名思义 在搜索框搜索时能有提示列表可供选择。最终效果如下:该搜索优化功能是elasticsearch自带的即suggest,suggest即存储一个词库,每次搜索发送请求去词库中检索,匹配到即返回。接下来我们一步一步实现上述功能。1.建立索引我这预先准备了一个房屋信息的索引house{ "settings": { ...原创 2019-11-15 10:53:08 · 3688 阅读 · 2 评论 -
elasticsearch 5.6.x单机环境构建(集成head插件和IK中文分词)
elasticsearch近几年版本更新迭代的速度之已经超出了我的想象,想着我2016,2017年还在用着2.4.x版本,最近几年直接5.x,6.x,7.x版本了,看了一下下更新迭代的小版本时间几乎几个月一个小版本,简直不要太迅速了,不过也能理解,毕竟最近几年elasticsearch火热程度大幅上升,所谓是需求所致。此处我并没有直接跳转到最新版本,因为我看了一下说明,2.x版本是不能直接升级...原创 2019-11-13 15:59:39 · 1390 阅读 · 0 评论 -
don't run elasticsearch as root
Elasticsearch日志全文搜索环境配置好后,执行bin/elasticsearch命令运行后,出现java.lang.RuntimeException: don't run elasticsearch as root异常。显然这是提示不能使用root用户直接运行,可以通过使用普通用户登录。[root@localhost bin]# ./elasticsearchEx原创 2017-03-12 16:35:04 · 902 阅读 · 0 评论 -
ElasticSearch入门 —— 集群搭建
Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但是,Lucene只是一个库。想要使用它,你必须使用Java来作为开发语言并将其直接集成到你的应用中,更糟糕的是,Lucene非常复杂,你需要深入了解检索的相关知识来理解它是如何工作的。Elastic原创 2017-03-12 16:30:35 · 1481 阅读 · 0 评论 -
solr定时实时重建索引和增量更新
Solr Data Import Hander Scheduler 说明: Solr官方提供了很强大的Data Import Request Handler,同时提供了一个简单的 Scheduler, 示例中的 Scheduler 只支持增量更新,不支持定期重做索引,因此我做了一个简单的封装,增加了重做索引的定时器. (原定时器作者是:Marko Bonaci, 在此表示转载 2015-01-26 14:40:08 · 41081 阅读 · 2 评论 -
solrExecption : org.apache.solr.common.SolrException: undefined field text
org.apache.solr.common.SolrException: undefined field text at org.apache.solr.schema.IndexSchema.getDynamicFieldType(IndexSchema.java:1241) at org.apache.solr.schema.IndexSchema$SolrQueryAnaly原创 2015-01-26 10:25:09 · 8563 阅读 · 0 评论 -
Solr全量索引
Solr DIH(Data Import Handler)组件的实现类为org.apache.solr.handler.dataimport.DataImportHandler,在Solr的solrconfig.xml中配置两个handler,配置分别说明如下:solrconfig.xml配置如下:<requestHandler name="/dataimport" clas原创 2015-01-26 14:09:15 · 5358 阅读 · 0 评论 -
solr4.8单机部署(solr4.8+tomcat7)
所需软件:solr4.8.1、Tomcat7下载完相应软件后开始单机部署(windows下)在F盘根目录创建solr文件夹,并解压solr4.8和tomcat7到该文件夹在F盘根目录创建solrhome文件夹,将F:\solr\solr-4.8.1\example\solr下的所有文件复制到solrhome文件夹中将F:\solr\solr-4.8.1\dist下的solr-4.8原创 2015-01-22 14:48:14 · 4112 阅读 · 0 评论 -
Solr+Hbase多条件查(优劣互补)
为什么要使用solr+hbase组合:某电信项目中采用HBase来存储用户终端明细数据,供前台页面即时查询。HBase无可置疑拥有其优势,但其本身只对rowkey支持毫秒级的快速检索,对于多字段的组合查询却无能为力。针对HBase的多条件查询也有多种方案,但是这些方案要么太复杂,要么效率太低,本文只对基于Solr的HBase多条件查询方案进行测试和验证。solr+habse组合的原理:原创 2014-12-09 10:26:28 · 22640 阅读 · 6 评论 -
Solr增量索引
注:全量索引和增量索引data-config.xml和delta-data-config.xml配置文件默认放在和solrconfig.xml同级目录solrconfig.xml配置如下:<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">原创 2015-01-26 14:37:38 · 6473 阅读 · 2 评论 -
SolrCloud 分布式集群安装部署(solr4.8.1 + zookeeper +tomcat)
SolrCloud分布式集群部署步骤安装软件包准备· apache-tomcat-7.0.54· jdk1.7· solr-4.8.1· zookeeper-3.4.5注:以上软件都是基于 Linux环境的 64位软件,以上软件请到各自的官网下载。服务器准备为搭建这个集群,准备三台服务器,分别为19原创 2014-08-08 00:10:37 · 16007 阅读 · 1 评论 -
Linux(CentOS6.4)Solr4.8.1中文分词配置(IK分词)
1、环境准备C原创 2014-06-21 15:47:36 · 1953 阅读 · 0 评论 -
Linux(CentOS6.4)下简单部署Solr4.8.1
1、环境准备Cent原创 2014-06-21 00:19:19 · 4906 阅读 · 0 评论 -
Solr操作中新手常见问题
solr 4添加索引是新手容易遇到的问题异常一.Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/http/NoHttpResponseExceptionCaused by: java.lang.ClassNotFoundException: org.apache.http.NoHttpRespo原创 2014-06-21 13:31:05 · 4863 阅读 · 0 评论