【Solr】深入浅出Solr（一）——搜索系统介绍

最新推荐文章于 2024-08-30 04:45:00 发布

置顶你个佬六

最新推荐文章于 2024-08-30 04:45:00 发布

阅读量2.3k

点赞数 1

分类专栏： ➤ 框架篇 ------【Solr】文章标签： solr 搜索搜索引擎互联网百度

本文链接：https://blog.csdn.net/kisscatforever/article/details/76703780

版权

➤ 框架篇同时被 2 个专栏收录

54 篇文章 4 订阅

订阅专栏

------【Solr】

3 篇文章 0 订阅

订阅专栏

一、前言

为什么要写这篇博客呢？

我们都知道，我们遇到不会的东西都会查百度，查谷歌。他是一个搜索引擎，这个搜索引擎非常的强大，根据搜索关键字进行查询。退一步来说，我们都在淘宝和京东买过东西，这些互联网网站也自带了搜索系统，对用户搜索的字段进行很迅速的查询。

所以，要搞清楚京东或者百度他们的所有机制是什么样的？就是这篇博客的重点。

二、搜索系统的特点

小编总结了一下搜索系统的特点：

1.数量大

搜索系统要访问问的数据是非常庞大的，他需要在对搜索简历索引，提高搜索的速度。百度搜索引擎拥有目前世界上最大的中文信息库，总量达到6000万页以上，并且还在以每天几十万页的速度快速增长。

2.搜索速度快

搜索引擎为了达到迅速的反应，就会搭建服务器集群，并且就那百度而言，在中国各地和美国均设有服务器，搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。

3.合适的搜索技术

不同的搜索技术会有不同的性能表现。百度搜索引擎使用了高性能的”网络蜘蛛”程序自动的在互联网中搜索信息，可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。

三、Solr服务介绍

这里写图片描述

【solr 名称来源】

Search On Lucene Replication

【solr 基本概况】

Apache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发，主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成，每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性，默认情况下这个属性的名字是 id，在 Schema 配置文件中使用：id进行描述。

Solr是一个高性能，采用Java开发，基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括：高效、灵活的缓存功能，垂直搜索功能，高亮显示搜索结果，通过索引复制来提高可用性，提供一套强大Data Schema来定义字段，类型和设置文本分析，提供基于Web的管理界面等。

【solr 历史】

2004年 CNET 开发 Solar，为 CNET 提供站内搜索服务
2006年1月捐献给 Apache ，成为 Apache 的孵化项目
一年后 Solr 孵化成熟，发布了1.2版，并成为 Lucene 的子项目
2010年6月，solr 发布了的1.4.1版，这是1.4的 bugfix 版本，1.4.1的solr使用的lucene是2.9版本的
solr 从1.4.x版本以后，为了保持和lucene同步的版本，solr直接进入3.0版本。

这里写图片描述