Solr 6.3.0 入门教程(开篇)Solr特性

原文:http://lucene.apache.org/solr/features.html

Solr是一个具有类似REST的API的独立企业搜索服务器。 您通过JSON,XML,CSV或二进制通过HTTP在其中放置文档(称为“索引”)。 您通过HTTP GET查询它并接收JSON,XML,CSV或二进制结果。

  • 高级全文搜索能力
    由Lucene™提供支持,Solr支持强大的匹配功能,包括短语,通配符,连接,分组和更多跨任何数据类型

  • 针对大量流量进行了优化
    Solr在世界各地的超大规模被证明

  • 基于标准的开放接口 - XML,JSON和HTTP
    Solr使用您用来使应用程序构建快照的工具

  • 综合管理接口
    Solr附带一个内置的响应式管理用户界面,以便于控制您的Solr实例

  • 轻松监控
    需要更深入了解您的执行个体吗? Solr通过JMX发布指标数据

  • 高度可扩展和容错
    建立在经过战斗测试的Apache Zookeeper上,Solr可以轻松扩展和缩小。 Solr开箱即用的复制,分发,重新平衡和容错功能。

  • 灵活和适应与容易配置
    Solr旨在适应您的所有需求,同时简化配置

  • 近实时索引
    想要立即查看您的更新吗? Solr利用Lucene的近实时索引功能,确保您在看到您的内容时看到它

  • 可扩展插件架构
    Solr发布了许多定义良好的扩展点,可以方便地插入索引和查询时间插件。 当然,由于它是Apache授权的开源,你可以改变任何你想要的代码!

更多功能

除了厨房的水槽。
Solr使用Lucene搜索库并扩展它。

  • 模式当你想要的时候,模式少时你不需要
    开始使用Solr数据驱动的无模式模式,然后在生产的时候将其锁定。

  • 强大的扩展
    Solr附带可选插件,用于索引丰富内容(例如PDF,Word),语言检测,搜索结果集群等

  • 分面搜索和过滤
    使用大量的faceting算法,您可以看到合适的切片和切片数据

  • 地理空间搜索
    启用基于位置的搜索很简单,Solr内置对空间搜索的支持

  • 高级可配置文本分析
    Solr支持世界上大多数广泛使用的语言(英语,汉语,日语,德语,法语等)和许多其他分析工具,旨在尽可能灵活地编制索引和查询您的内容

  • 高度可配置和用户可扩展的缓存
    Solr的内置缓存的细粒度控制使得轻松优化性能

  • 性能优化
    Solr一直致力于处理世界上最大的网站

  • 安全内置
    具有SSL,身份验证和基于角色的授权的安全解决方案。 可插拔,当然!

  • 高级存储选项
    基于Lucene的高级存储功能(编解码器,目录等),Solr可以轻松调整您的数据存储需求,以适应您的应用程序

  • 可监视日志记录
    从管理界面轻松访问Solr日志文件

  • 查询建议,拼写等
    Solr具有自动完成(预先搜索),拼写检查等功能的高级功能

  • 您的数据,您的方式!
    支持开箱即用的JSON,CSV,XML等。 不要浪费宝贵的时间将所有的数据转换成一个共同的表示,只是发送给Solr!

  • 富文档解析
    Solr内置了Apache Tika,可以轻松地索引丰富的内容,例如Adobe PDF,Microsoft Word等。

  • Apache UIMA
    准备好使用高级注释引擎增强您的内容? Solr集成到Apache UIMA中,使得轻松地利用NLP和其他工具作为应用程序的一部分。

  • 多个搜索索引
    Solr支持多租户架构,可以轻松隔离用户和内容。

详细特点—数据处理

减少模式或模式,轻松定义字段类型,分析过程和文档结构,使您的搜索应用程序成功

  • 无模式(数据驱动模式)使得易于开始,而切换到已配置的模式可以实现一个稳定的生产环境。
    Solr支持无模式和模式模式,具体取决于您的目标

  • Solr的字段类型使得可以轻松地声明性地混合和匹配Lucene分析器,而无需编写代码
    char过滤器在标记化之前编辑文本
    分词器将文本分解成词
    令牌过滤器转换术语

  • 动态字段启用即时添加基于字段名自动映射到字段类型的新字段

  • 使用Solr的复制字段功能,以不同的方式轻松地分析相同的内容

  • 显式类型消除了猜测字段类型和引入噪声的需要

  • 禁用词列表,同义词列表和受保护词列表的基于文件的外部配置

  • 许多额外的文本分析组件,包括分词,正则表达式,词干和更多

  • 可扩展以允许应用程序轻松处理专有格式和不支持的数据类型

文档,字段和模式设计

详细特点—查询

具有灵活IO格式的HTTP接口和广泛的查询解析支持使添加和查找数据变得快捷

  • REST接口提供与任何语言的轻松集成。
    还提供本机客户端

  • 按任意数量的字段排序,并通过数字字段的复杂函数排序
    具有缺失值的文档可以配置为排序最后(或第一)

  • 函数查询提供基于您的数据的强大的相关性调整功能

  • 高级相关性调整选项允

  • Solr支持多种查询解析方法,可以轻松找到您的数据
    几十种查询类型(布尔,短语,术语,数字,字段等)在搜索时提供了令人难以置信的力量

  • 良好的开箱默认值使得很好的结果容易,而广泛的配置选项使其易于微调
    可以轻松地配置请求处理,以提供服务器端控制和简化应用程序请求结果的方式

  • 丰富的过滤功能允许应用程序控制搜索的内容和时间

  • 多评分(相似性)方法允许容易的实验和相关性调整

  • 可插入的查询解析器意味着每个应用程序都可以提供一个对其用户有意义的查询接口

  • 用于捕获文档和收集级别统计信息的定义明确的API可以轻松地启用自定义相似性模型

  • 游标(又名“深页面”)支持下一代NoSQL数据存储和分析选项

  • 近实时(NRT)搜索允许几乎立即访问文档添加和更新

Solr参考指南-搜索

详细特点—方面

从星期日六个方面切片和骰子数据

  • 强大的faceting功能支持以多种方式对数据进行分组和组织

  • 数据透视面可以询问复杂的“假设”问题

  • 细粒度的性能控制使得在刻面时可以权衡竞争的CPU和内存资源
  • 术语,查询,范围,日期和数据透视分面实施使数据调查简单和强大
  • 范围分面允许在易于理解的分组中分组时间和数字内容
  • 基于查询的faceting使得通过任意查询更容易
  • 多选择面参数可以精确控制面如何与原始结果集交互

    Solr参考指南-方面

详细特点—发现

群集,拼写检查,自动完成等更容易帮助用户发现内容

  • 字体,自动完成,自动建议,无论你叫什么,Solr支持强大和可扩展的机制,为用户输入查询时提供建议

  • 集成Carrot2功能启用动态搜索结果集群

  • 拼写建议可以帮助用户更正查询以获得更好的结果

  • 可配置的匹配高亮功能可帮助用户准确了解匹配发生的位置

提议者 结果集群 拼写检查 高亮显示

详细特点—插件和扩展

开源和良好的文档使Solr高度可扩展

  • 用于语言检测,聚类,数据导入,UIMA,Apache Velocity等的插件在需要时提供可选功能

  • 定义良好的扩展点,用于索引,分析,请求处理,查询解析和更多的集中扩展容易写和启用

  • 由Apache软件基金会启用的开源和开放开发方法为Solr做出了很大贡献

  • 不喜欢Solr实现什么东西? 发现错误? 检查从SVN或Git的代码,并进行更改,你认为合适。 补丁欢迎!

如何贡献

详细特点—统计和聚合

  • Solr支持对结果集进行复杂的数学分析,实现下一代基于搜索的商业智能

  • 分组,嵌套和其他方法使应用程序能够表示内容类型之间的复杂关系

  • 函数查询结果可以返回命中,并用于排序或提高命中

  • 字段统计信息可以与嵌套Pivot Faceting组合使用

  • stats组件可以计算min,max,sum,mean,distinct值等

统计组件

详细特点—空间

使用高级空间集成的位置感知搜索

  • 开箱即用的支持位置感知搜索(认为移动搜索)使应用程序可以基于位置查找和过滤内容

  • 广泛支持表示复杂的空间数据,如多边形,纬度/经度等

  • 高级查询功能允许边界框,多边形和其他复杂的查询功能

  • 与Java Topological Suite库的集成提供了高级的空间功能

空间搜索

详细特点—丰富内容

你的数据,你的方式。 PDF,Word,Powerpoint等

  • 与Apache Tika的集成支持提取和处理丰富的内容类型,而无需编写单行代码

  • 数据不在JSON中? 没问题。 Solr处理各种各样的数据类型,包括JSON,XML,许多Office文档,CSV和更多

  • 灵活和可扩展的输入和输出格式允许您的应用程序与Solr交谈的方式

  • 高级处理选项可以轻松控制提取的内容的索引方式以及索引

索引和基本数据操作

详细特点—性能

Solr在世界级组织中再次证明,Solr可以执行和扩展以处理最苛刻的应用程序

  • 良好的测试默认值提供良好的性能开箱即用微调

  • 高级选项可对多个性能方面进行细粒度控制

  • 强大的单节点和分布式功能简化了从一个节点到多个节点的过程

  • 大量的智能缓存选项使对重复结果的精确控制变得轻而易举

  • 总是建立在最新和最伟大的Lucene,Solr利用了许多Lucene性能增强

  • 支持编解码器,备用目录实现等,提供高级性能调优选项

配置良好的Solr实例

详细特点—缩放

基于Apache Zookeeper构建的高度可扩展,容错的分布式基础设施

  • 根据需要添加和删除计算能力,同时让Solr执行负载平衡等工作

  • 碎片拆分使得容易增量增加容量,而不需要重新索引整个内容

  • 建立在试验和真正的Apache Zookeeper,Solr喜欢一致性,并避免毛刺裂脑的问题与其他方法共同

  • 内置用户界面提供对集群状态的深入了解

  • 高级事务日志,复制和故障转移功能有助于最大限度地减少数据丢失,同时仍然提供结果

  • 定期测试以处理成百上千的计算节点和数十亿的具有非常高的查询量的文档

Solr云

详细特点—管理界面

丰富而强大的用户界面可以深入了解Solr状态,无需额外安装

  • 大量的报告和控制接口使得易于理解和改变Solr中发生的情况

  • 现代的,基于Javascript的实现提供即时反馈

  • 深入了解核心,集合,碎片等

  • 探索日志,线程和系统属性,而无需离开浏览器

  • 想要探索替代查询吗? 尝试查询界面,并立即探索您的数据,而无需编写代码

  • 使用高级界面探索和调试您的数据和查询,以进行分析,数据探索等

  • 直接从浏览器索引内容,包括通过文件上传丰富的内容

  • 立即在浏览器中即时查看关键效果指标

使用Solr管理用户界面

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值