【Solr】深入浅出Solr(一)——搜索系统介绍

一、前言

      为什么要写这篇博客呢?

      我们都知道,我们遇到不会的东西都会查百度,查谷歌。他是一个搜索引擎,这个搜索引擎非常的强大,根据搜索关键字进行查询。退一步来说,我们都在淘宝和京东买过东西,这些互联网网站也自带了搜索系统,对用户搜索的字段进行很迅速的查询。

      所以,要搞清楚京东或者百度他们的所有机制是什么样的?就是这篇博客的重点。

二、搜索系统的特点

      小编总结了一下搜索系统的特点:

1.数量大

搜索系统要访问问的数据是非常庞大的,他需要在对搜索简历索引,提高搜索的速度。百度搜索引擎拥有目前世界上最大的中文信息库,总量达到6000万页以上,并且还在以每天几十万页的速度快速增长。

2.搜索速度快

搜索引擎为了达到迅速的反应,就会搭建服务器集群,并且就那百度而言,在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。

3.合适的搜索技术

不同的搜索技术会有不同的性能表现。百度搜索引擎使用了高性能的”网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。

三、Solr服务介绍

这里写图片描述

【solr 名称来源】

Search On Lucene Replication

【solr 基本概况】

      Apache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用:id进行描述。

      Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

【solr 历史】

2004年 CNET 开发 Solar,为 CNET 提供站内搜索服务
2006年1月捐献给 Apache ,成为 Apache 的孵化项目
一年后 Solr 孵化成熟,发布了1.2版,并成为 Lucene 的子项目
2010年6月,solr 发布了的1.4.1版,这是1.4的 bugfix 版本,1.4.1的solr使用的lucene是2.9版本的
solr 从1.4.x版本以后,为了保持和lucene同步的版本,solr直接进入3.0版本。

这里写图片描述

四、小结

      这篇博客就是对Solr做了一个简单的开头,还简单的说明了一下,下一篇博客就会向大家介绍如何使用Solr。敬请期待。

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

你个佬六

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值