搜索引擎 Apache Solr

最新推荐文章于 2023-07-24 08:03:16 发布

大数据交流官方群

最新推荐文章于 2023-07-24 08:03:16 发布

阅读量1k

点赞数 2

分类专栏： solr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HADOOP_83425744/article/details/49364085

版权

solr 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

主要讨论一种特殊的 NoSQL 技术，即 Apache Solr 。和她的其他非关系型兄弟们一样， Solr 也为一类特定问题的处理做了优化。具体来说，Solr 是一个可扩展的，可快速部署的，对搜索海量文本中心的数据和对返回结果做相关性排序方面做了优化的企业级搜索引擎。

这句话读上去有点拗口，不过没关系，我们把这个定义中的亮点分解出来看：

•可扩展性： Solr 可以把建立索引和查询处理的运算分布到一个集群内的多台服务器上。

•快速部署： Solr 是开源软件，安装和配置都很方便，可以根据安装包内的 Sample 配置直接上手。

•优化的搜索功能： Solr 搜索够快。对于复杂的搜索查询， Solr 可以做到亚秒级的处理，通常几十毫秒就能处理完一次复杂查询

•海量文本： Solr 是针对百万级以上的海量文本处理而设计的，可以很好地处理海量数据。

•文本中心的数据： Solr 为搜索包含自然语言的文本内容做了优化，比如电子邮件，网页，简历， PDF 文档，或是推特、微博、博客这些社交内容等等，都适合用 Solr 来处理。

•结果是按相关性排序的： Solr 的搜索返回结果是按照结果文档与用户查询之间的相关程度度做排序的，保证最相关的结果会优先返回。

我们就不浪费时间来揣度你到底是为什么开始考虑用 Solr 的了，我们直接来讨论点干货。先从讨论一下哪些数据属性是搜索引擎适合处理的。

l 文本中心的数据

l 读取远多于写入的数据

l 面向文档的数据

l 灵活的 Schema

也许在这儿应该加上第五个数据特性，即：海量的数据量，也就是” 大数据 “ ，但是我们主要关注的是 Solr 区别于其他 NoSQL 技术的主要特性，而可以处理海量的数据并不是它们的主要区别之一。

虽然这里列出了类似 Solr 这样的搜索引擎可以有效处理的数据类型的 4 个主要特点，但是这只是一个粗略的准则，并不是一个严格的标准。后面我们来深入的讨论一下这些数据特性，看看为什么它们对于搜索来说这么重要。我们现在只关注概念，具体的实现细节在后续的发布章节中讨论。

本博客持续更新。。。

大数据交流官方群

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
搜索引擎 Apache Solr

主要讨论一种特殊的 NoSQL 技术，即 Apache Solr 。和她的其他非关系型兄弟们一样， Solr 也为一类特定问题的处理做了优化。具体来说，Solr 是一个可扩展的，可快速部署的，对搜索海量文本中心的数据和对返回结果做相关性排序方面做了优化的企业级搜索引擎。这句话读上去有点拗口，不过没关系，我们把这个定义中的亮点分解出来看：•可扩展性： Solr 可以把建立索引和查询处理的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。