搜索引擎 Apache Solr

主要讨论一种特殊的 NoSQL 技术,即 Apache Solr 。和她的其他非关系型兄弟们一样, Solr 也为一类特定问题的处理做了优化。具体来说,Solr  是一个可扩展的,可快速部署的,对搜索海量文本中心的数据和对返回结果做相关性排序方面做了优化的企业级搜索引擎。

这句话读上去有点拗口,不过没关系,我们把这个定义中的亮点分解出来看:

•可扩展性 : Solr 可以把建立索引和查询处理的运算分布到一个集群内的多台服务器上。

•快速部署 : Solr 是开源软件,安装和配置都很方便,可以根据安装包内的 Sample 配置直接上手。

•优化的搜索功能 : Solr 搜索够快。对于复杂的搜索查询, Solr 可以做到亚秒级的处理,通常几十毫秒就能处理完一次复杂查询

•海量文本 : Solr 是针对百万级以上的海量文本处理而设计的,可以很好地处理海量数据。

•文本中心的数据 : Solr 为搜索包含自然语言的文本内容做了优化,比如电子邮件,网页,简历, PDF 文档,或是推特、微博、博客这些社交内容等等,都适合用 Solr 来处理。

•结果是按相关性排序的 : Solr 的搜索返回结果是按照结果文档与用户查询之间的相关程度度做排序的,保证最相关的结果会优先返回。

我们就不浪费时间来揣度你到底是为什么开始考虑用 Solr 的了,我们直接来讨论点干货。先从讨论一下哪些数据属性是搜索引擎适合处理的。

l 文本中心的数据

l 读取远多于写入的数据

l 面向文档的数据

l 灵活的 Schema

也许在这儿应该加上第五个数据特性,即:海量的数据量,也就是” 大数据 “ ,但是我们主要关注的是 Solr 区别于其他 NoSQL 技术的主要特性,而可以处理海量的数据并不是它们的主要区别之一。

虽然这里列出了类似 Solr 这样的搜索引擎可以有效处理的数据类型的 4 个主要特点,但是这只是一个粗略的准则,并不是一个严格的标准。后面我们来深入的讨论一下这些数据特性,看看为什么它们对于搜索来说这么重要。我们现在只关注概念,具体的实现细节在后续的发布章节中讨论。

本博客持续更新。。。
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值