英语原文(官方)翻译
Solr 简介
Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引,通过http协议进行查询,返回结果为xml格式。
* 先进的全文搜索能力
* 优化的web流量
* 基于开放接口(xml&http)的标准
* 集成的HTML管理界面
* 可扩展性-与其它Solr 服务器的高效结合
* 通过xml配置实现的灵活性和适应性
* 可扩展的插件体系结构
Solr使用Lucene查询库并对其进行了扩展
* 带有动态Field(Dynamic Field)和唯一键(Unique Key)的实数据模式
* 对lucene查询语言的强大扩展
* 支持动态层面浏览和过滤
* 高级可配置的文本分析
* 高度可配置和用户可扩展的缓存(Caching)
* 性能优化
* 通过xml的外部配置
* 管理界面
* 日志功能
* 快速增加的更新和快照功能
细节特征
Schema(模式) ,在Solr里面的一个xml文件
* 定义可用的field类型和document中可以使用的field
* 驱动更加智能处理过程
* Lucene分析器的说明
* 动态Field(Dynamic Fields)使得field的增加更快速
* CopyField 功能对某单个的field进行多种方式的索引或者将多种field结合到某个field(目的是加快搜索的速度)
* 模糊类型(Explicit types)省略了对field类型的猜测
* 基于文件的停用词,同义词,保护词外部配置
查询(Query)
* 带有返回格式可配置(XML/XSLT, JSON, Python, Ruby)的HTTP接口
* 高亮文本片段显示
* 基于field值和明晰查询的层面搜索(Faceted Searching)
* 添加到查询语言中的排序说明
* 函数查询—通过filed的数值和顺序值的函数影响得分
* 性能优化
* 前缀查询,得分范围查询
Core
* 可插入的查询处理器(query handlers)和可扩展的xml数据格式
* 基于单键值field(unique key field)的强制的document唯一性
* 批量更新和删除
* 用户可配置的索引改变触发命令
* 搜索并发控制
* 正确的数值类型处理,以支持排序和范围查询
* 对没有用于排序的 field的document的正确处理
* 查询结果的动态分组
缓存(Caching)
* 可配置的查询结果、过滤器、Document缓存实例
* 可添加的缓存实现
* 后台缓存“预热”
当一个新的查询器打开,可配置的查询就开始运行,以避免首次查询返回结果较慢,“预热”期间,当前查询继续进行
* 后台自动“预热”
当前的搜索器的缓存中包含经常访问的元素,当新的搜索器建立时自动将其加入,以提高缓存的命中率
* 快速/小型过滤器的实现
* 使用自动“预热”的用户级缓存
复制(Replication)
* 对通过同步传输改变的索引的高效异步处理
* “前拉策略”使得搜索器的添加更加容易
* 可配置的分布间隔获得了缓存使用和时效性之间的平衡
管理界面(Admin Interface)
* 全面的缓存使用,查询,更新统计
* 文本分析调试器,展示文本在分析器中每个阶段的结果
* Web查询接口/调试输出
1. 查询输出的分析细节
2. Lucene 计算文档评分细节
3. 显示查询范围外的文档评分,以调试为什么给定的文档没有获得较高的评分