Solr6.3安装包解压缩后进入其文件夹,其中包含的目录及问价如下图所示:
bin:solr的运行脚本,使用solr操作的命令都在这里
CHANGES.txt:顾名思义,新版本的一些改变和新功能的简介
contrib:solr的一些扩展包,包括分词器,聚类,语言识别,数据导入处理,非结构化内容分析等,在以后的项目中,可能需要的扩展包都可以在这里寻找
nalysis-extras:该目录下面包含一些相互依赖的文本分析组件。
clustering:该目录下有一个用于集群检索结果的引擎。
dataimporthandler:DIH是solr中一个重要的组件,该组件可以从数据库或者其他数据源导入数据到Solr中。
dataimporthandler-extras:这里面包含了对DIH的扩展。
extraction:集成Apache Tika,用于从普通格式文件中提取文本。
langid:该组件使得Solr拥有在建索引之前识别和检测文档语言的能力。
map-reduce:提供一些和Hadoop Map-Reduce协同工作的工具。
morphlines-cell:为solr Cell类型的功能提供Kite Morphlines的特性。
morphlines-core:为solr提供Kite Morphlines的特性。
uima:该目录包含用于集成Apache UIMA的库。
velocity:包含一个基于Velocity模板语言简单检索UI框架。
dist:solr的核心JAR包和扩展JAR包。当我们试图把solr嵌入到某个应用程序的时候会用到核心JAR包。
solrj-lib:包含构建基于solr的客户端时会用到的JAR包。
test-framework:包含测试solr时候会用到的JAR包。
docs:solr的文档,包括离线的静态HTML文件和API的描述
example:solr项目的例子所在的目录,
licenses:solr的协议和许可信息
LICENSE.txt LUCENE_CHANGES.txt NOTICE.txt README.txt
server:solr搜索引擎框架,基于jetty web服务器开发的。包含jetty服务器的配置。(这个目录就类似于一个包含了tomcat服务器,里面有一个基于solr的web工程),solr作为服务运行的必要文件都存放在这里。
contexts:启动solr的Jetty网页的上下文配置。
etc:Jetty服务器配置文件,在这里可以把默认的8983端口改成其他的。
lib:Jetty服务器程序对应的可执行JAR包和响应的依赖包。
logs:默认情况下,日志将被输出到这个文件夹。
modules:http\https\server\ssl等配置模块。
resources:存放着Log4j的配置文件。这里可以改变输出日志的级别和位置等设置。
scripts:solr运行的必要脚本。
solr:运行solr的配置文件都保存在这里。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的时候有用。 子文件夹/configsets存放着solr的示例配置文件。
solr-webapp:前面已经提到过的管理界面的站点就存放在这里。
tmp:存放临时文件。