solr搜索引擎特性

最新推荐文章于 2020-09-02 17:06:21 发布

damoqingquan

最新推荐文章于 2020-09-02 17:06:21 发布

阅读量209

点赞数

分类专栏：搜索引擎技术文章标签：搜索引擎 Solr lucene 配置管理 XML

搜索引擎技术专栏收录该内容

9 篇文章 0 订阅

订阅专栏

英语原文（官方）翻译

Solr 简介

Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引，通过http协议进行查询，返回结果为xml格式。

* 先进的全文搜索能力

* 优化的web流量

* 基于开放接口（xml&http）的标准

* 集成的HTML管理界面

* 可扩展性-与其它Solr 服务器的高效结合

* 通过xml配置实现的灵活性和适应性

* 可扩展的插件体系结构

Solr使用Lucene查询库并对其进行了扩展

* 带有动态Field(Dynamic Field)和唯一键（Unique Key）的实数据模式

* 对lucene查询语言的强大扩展

* 支持动态层面浏览和过滤

* 高级可配置的文本分析

* 高度可配置和用户可扩展的缓存（Caching）

* 性能优化

* 通过xml的外部配置

* 管理界面

* 日志功能

* 快速增加的更新和快照功能

细节特征

Schema(模式) ，在Solr里面的一个xml文件

* 定义可用的field类型和document中可以使用的field

* 驱动更加智能处理过程

* Lucene分析器的说明

* 动态Field(Dynamic Fields)使得field的增加更快速

* CopyField 功能对某单个的field进行多种方式的索引或者将多种field结合到某个field（目的是加快搜索的速度）

* 模糊类型（Explicit types）省略了对field类型的猜测

* 基于文件的停用词，同义词，保护词外部配置

查询（Query）

* 带有返回格式可配置（XML/XSLT, JSON, Python, Ruby）的HTTP接口

* 高亮文本片段显示

* 基于field值和明晰查询的层面搜索（Faceted Searching）

* 添加到查询语言中的排序说明

* 函数查询—通过filed的数值和顺序值的函数影响得分

* 性能优化

* 前缀查询，得分范围查询

Core

* 可插入的查询处理器（query handlers）和可扩展的xml数据格式

* 基于单键值field(unique key field)的强制的document唯一性

* 批量更新和删除

* 用户可配置的索引改变触发命令

* 搜索并发控制

* 正确的数值类型处理，以支持排序和范围查询

* 对没有用于排序的 field的document的正确处理

* 查询结果的动态分组

缓存（Caching）

* 可配置的查询结果、过滤器、Document缓存实例

* 可添加的缓存实现

* 后台缓存“预热”

当一个新的查询器打开，可配置的查询就开始运行，以避免首次查询返回结果较慢，“预热”期间，当前查询继续进行

* 后台自动“预热”

当前的搜索器的缓存中包含经常访问的元素，当新的搜索器建立时自动将其加入，以提高缓存的命中率

* 快速/小型过滤器的实现

* 使用自动“预热”的用户级缓存

复制（Replication）

* 对通过同步传输改变的索引的高效异步处理

* “前拉策略”使得搜索器的添加更加容易

* 可配置的分布间隔获得了缓存使用和时效性之间的平衡

管理界面（Admin Interface）

* 全面的缓存使用，查询，更新统计

* 文本分析调试器，展示文本在分析器中每个阶段的结果

* Web查询接口/调试输出

1. 查询输出的分析细节

2. Lucene 计算文档评分细节

3. 显示查询范围外的文档评分，以调试为什么给定的文档没有获得较高的评分

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。