Solr综述

2021SC@SDUSC

项目名称:Solr

Solr简单介绍:Solr 是一个基于 Apache Lucene 之上的搜索服务器,它是一个开源的、基于 Java 的信息检索库,它的底层的核心技术是使用Lucene来实现的,而Lucene本质上是一个搜索库,Solr是一个独立的应用程序,也可以理解为Solr是Lucene面向企业搜索应用的扩展。

以下为官方参考指南以及中文翻译后的指南。

Solr Tutorial | Apache Solr Reference Guide 8.10

关于Apache Solr参考指南_w3cschool

安装说明:Solr 可从 Solr 网站获取。您可以在此下载最新版本的Solr 8.10.0。

Solr:Solr Downloads - Apache Solr

 

solr-8.10.0-src.tgz:Solr 源代码包。如果您想在 Solr 上开发而不使用官方的 Git 存储库,这将非常有用。本次课程中所需要下载的就是Solr源代码包。

下载之后进行解压即可,目录内容如图。

点击solr文件夹后的目录

 bin:启动相关。

contrib:插件包,以供solr使用。

core:进入该文件夹后有一个packge-info.java的文件,打开后显示如下注释。

 意思是该文件夹包含常用的重用类和接口(已经弃用的包,并且不要新建类)。

docs:Solr版本更新后的内容。

solrj:Solr的Java客户端。

安装完成后使用ant及idea进行环境配置。

配置期间由于需要下载各种依赖包所以所需时间较长。

使用说明:

 菜单栏功能如图。

Analysis:官方文档给出的解释----通过 Solr 的“分析”界面,您可以根据模式中的字段、字段类型和动态字段配置来检查数据的处理方式。您可以分析在索引期间或在查询处理过程中如何处理内容,以及如何单独或同时查看结果。

简而言之此功能可以用于查看分词的效果。

Documents:官方文档给出的解释----文档界面提供了一个简单的表单,允许您直接从浏览器以各种格式执行各种 Solr 索引命令。

1.以 JSON、CSV 或 XML 格式复制文档并将其提交给索引;

2.上传文件(使用 JSON、CSV 或 XML 格式)

3.通过选择字段和字段值来构建文档

简而言之此功能可以根据指定格式上传数据。

Query:您可以使用查询界面将搜索查询提交给 Solr 集合并分析结果。

Solr简要工作流程:首先通过Documents界面提交文档数据以及进行增删改查操作,数据在通过分词等操作之后将会以倒排表的结构来组织,之后按照索引条件进行索引查找。

所以总的来说solr主要功能分为文档管理,数据分析过滤,查询处理。需要分析的主要代码也集中于此。

根据文件目录,这些部分的代码分布于core文件夹中的子文件夹,例如分词器。

 

组内分工:我的主要任务是对数据分析过滤功能的源码进行分析。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值