solr (索引自己的数据集)

概要

Solr是一个建立在Apache Lucene 之上的搜索服务器,它是一个开源的,基于Java的信息检索库。它旨在驱动强大的文档检索应用程序 - 无论您需要根据用户的查询向用户提供数据,Solr都可以为您服务。


由于Solr基于开放标准,因此具有高度的可扩展性。Solr查询是简单的HTTP请求URL,响应是结构化文档:主要是JSON,但也可以是XML,CSV或其他格式。这意味着各种各样的客户端将能够使用Solr,从其他Web应用程序到浏览器客户端,富客户端应用程序和移动设备。任何有HTTP能力的平台都可以和Solr对话。

一个比较常见的情况是,你有太多的数据,或者太多的查询,以至于一台Solr服务器无法处理你的整个工作负载。在这种情况下,您可以使用SolrCloud扩展应用程序的功能,以便更好地在多台服务器上分布数据和处理请求。根据您需要的可扩展性类型,可以混合和匹配多个选项。

“分片”是一种缩放技术,其中一个集合被分割成多个逻辑分片,称为“分片”,以便扩大集合中的文档数量,使其超出实际适合单个服务器的数量。传入查询分发到集合中的每个分片,这些分片响应合并的结果。另一种可用的技术是增加集合的“复制因子”,这允许您通过将请求分散到多个机器来添加具有集合的其他副本的服务器,以处理较高的并发查询负载。分片和复制不是相互排斥的,它们一起使Solr成为一个非常强大和可扩展的平台。



更新数据

numDocs表示索引中可搜索文档的数量(由于某些文件包含多个文档,因此将大于XML,JSON或CSV文件的数量)。maxDoc值可能会更大,因为maxDoc计数包括尚未从索引中物理删除的逻辑删除文档。你可以重新张贴样本文件一遍又一遍,只要你想,numDocs永远不会增加,因为新的文件将不断取代旧的。

删除数据


执行以下命令删除特定的文档:

bin/post -c localDocs -d "<delete><id>SP2514N</id></delete>"

要删除所有文档,可以使用“删除查询”命令:

bin/post -c localDocs -d "<delete><query>*:*</query></delete>"



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Solr基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎 课程特点毕业后接触的第一个中间件就是Solr,在工作中用处广泛,为了便于大家快速掌握该技能,开始录制相关课程,该专栏特点如下:1.采用Solr最新版本视频录制,全网最新课程(Solr8.1于2019年5月16日发布)2.技能点全网最全,会结合工作经验,项目中用到的技能点都会有所涉及,更新章节比较全面3.适用范围广,从零基础到高级架构以及分布式集群都涵盖,适用初级、高级、项目实战等多个层次开发者4.多种维度辅助学习,采用独立solr粉丝群辅助教学,学员问题会及时得到解决,程序员突破圈 打卡制度,督促学员学习关注后再购买、 关注后再购买、 关注后再购买课程能得到什么1.快速学习到最新版本的全文检索技术,从视频、文章、圈子、粉丝交流等快速促进学习2.通过该技术,获得面试进阶指导3.结交人脉(庞大的粉丝群)..End初期学员100人,价格不会太高,也是为了帮助更多的开发者但是个人精力有限,所以限制条件如下1.求知欲强,有想向技术更深一层了解的2.乐于交流,喜欢探讨技术者3.学习惰性者慎入,购买后会督促大家学习,购买不是目的,学习到该技能才是该专栏的主要目的正式进入学习状态了吗,专栏群见。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值