仅仅作为个人的学习记录,英文原地地址来自官方的入门https://lucene.apache.org/solr/guide/7_5/installing-solr.html#check-if-solr-is-running
在开始使用Solr时,您只需要将Solr发行版归档提取到您选择的目录中。作为初始开发环境,这已经足够了,但是在设置真正的开发和生产环境之前,请注意不要对这个“玩具”安装负担过重。
当您完成了对Solr的初步评估之后,您将需要注意计划您的实现。您可能需要在另一台服务器上重新安装Solr,或者创建一个集群化的SolrCloud环境。
当您准备为生产环境设置Solr时,请参阅“将Solr带到生产”页上提供的说明。地址:https://lucene.apache.org/solr/guide/7_5/taking-solr-to-production.html#taking-solr-to-production
我需要多大的服务器?
如何确定Solr安装的大小是一个复杂的问题,它取决于许多因素,包括文档的数量和结构、要存储多少字段、用户数量等。
强烈建议您花一点时间考虑影响Solr实现的硬件大小的因素。一个非常好的博客文章,讨论了要考虑的问题是尺寸硬件在摘要:为什么我们没有一个确定的答案。https://lucidworks.com/2012/07/23/sizing-hardware-in-the-abstract-why-we-dont-have-a-definitive-answer/
在计划安装时,需要注意的一点是,Lucene对单个索引中的文档数量存在硬限制:大约21.4亿个文档(确切地说是2147483647)。实际上,这样的大量文档不太可能适合单个索引,并且在接近这个数字之前,您可能需要跨集群分发索引。如果您知道在开始索引之前将超过文档的总数,那么最好从一开始就计划使用SolrCloud作为设计的一部分进行安装。
SOLR目录布局:
安装Solr之后,您将在其中看到以下目录和文件
Bin/ :
这个目录包括几个重要的脚本,这些脚本将使使用Solr更加容易。
solr and solr.cmd
这是Solr的控制脚本,也称为bin/solr(*nix)/bin/solr.cmd(Windows)。这个脚本是启动和停止SOLR的首选工具。在SolrCloud模式下运行时,还可以创建集合或内核、配置身份验证和使用配置文件。
post
PostTool,它提供了一个简单的命令行接口,用于将内容POSTing到Solr。
solr.in.sh and solr.in.cmd
这些是分别用于*NIX和Windows系统的属性文件。这里配置了Java、JETY和SOLR的系统级属性。当使用bin/solr/bin/solr.cmd时,可以重写这些设置中的许多设置,但是这允许您将所有属性设置到一个地方。
install_solr_services.sh
该脚本用于*NIX系统安装SOLR作为服务。在SOLR到生产的部分中更详细地描述了它。https://lucene.apache.org/solr/guide/7_5/taking-solr-to-production.html#taking-solr-to-production
contrib/
Solr的contrib目录包括用于Solr专门特性的插件。
dist/
DIST目录包含主要的Solr jar文件。
docs/
DOCS目录包括一个链接到Solr的在线JavaDoc。
example/
示例目录包括几种类型的示例,它们演示了各种Solr功能。有关此目录中的内容的详细信息,请参阅下面的Solr示例部分。
licenses/
许可证目录包括Solr使用的第三方库的所有许可证。
server/
这个目录是SOLR应用程序的心脏所在的地方。这个目录中的README提供了详细的概述,但是以下是一些重点:
Solr’s Admin UI (server/solr-webapp)
Jetty libraries (server/lib)
Log files (server/logs) and log configurations (server/resources). See the section Configuring Logging for more details on how to customize Solr’s default logging.
Sample configsets (server/solr/configsets)
Solr例子
Solr包括许多示例文档和配置,在启动时使用。如果您浏览了Solr教程,您已经与这些文件中的一些进行了交互。
https://lucene.apache.org/solr/guide/7_5/solr-tutorial.html#solr-tutorial
Exampledocs
这是一小组简单的CSV、XML和JSON文件,在开始使用Solr时可以与bin/post一起使用。有关使用这些文件使用bin/post的更多信息,请参见POST TOOL。https://lucene.apache.org/solr/guide/7_5/post-tool.html#post-tool
example-DIH
这个目录包括几个示例数据导入处理程序(DIH)配置,以帮助您开始导入数据库、电子邮件服务器甚至Atom提要中的结构化内容。每个示例将索引一组不同的数据;有关这些示例的详细信息,请参阅那里的README。
files
文件目录提供了基本的搜索UI,用于搜索您在本地存储的文档,如Word或PDF。有关如何使用此示例的详细信息,请参阅自述文件。
films
电影目录包含一组关于电影的健壮数据,其格式有三种:CSV、XML和JSON。有关如何使用此数据集的详细信息,请参阅自述文件。
启动SOLR
Solr包括名为bin/solr(Linux/MacOS)或binsolr.cmd(Windows)的命令行接口工具。这个工具允许您启动和停止Solr,创建内核和集合,配置身份验证,以及检查系统的状态。
使用它来启动SOLR,您可以简单地输入:
bin/solr start
如果运行Windows,则可以通过运行bin \solr.cmd 来启动Solr。
bin\solr.cmd start
这将在后台启动SOLR,在端口8983上进行侦听。
当您在后台启动Solr时,脚本将等待以确保Solr在返回到命令行提示符之前正确启动。
All of the options for the Solr CLI are described in the section Solr Control Script Reference.
以特定的捆绑实例开始SOLR
Solr还提供了许多有用的示例来帮助您了解关键特性。可以使用-e标志来启动示例。例如,要启动“techproducts”示例,您可以这样做:
bin/solr -e techproducts
目前,可以运行的示例有:techproducts, dih, schemaless, and cloud。有关每个示例的详细信息,请参阅示例配置运行的部分。
从SolrCloud开始
运行云示例在SolrCloud模式中启动SOLR。有关在云模式下启动Solr的更多信息,请参阅“从SolrCloud开始”一节。
检查SOLR是否运行
如果您不确定SOLR是否在本地运行,则可以使用状态命令:
bin/solr status
这将搜索计算机上运行的Solr实例,然后收集关于它们的基本信息,例如版本和内存使用情况。
就是这样!solr正在运行。如果您需要说服力,请使用Web浏览器查看管理控制台。
如果Solr没有运行,您的浏览器将抱怨它无法连接到服务器。检查您的端口号,然后再试一次。
如果没有使用示例配置启动Solr,则需要创建核心(core)以便能够进行索引和搜索。你可以通过下面的方式做到这一点:
bin/solr create -c <name>
比如我创建了一个 helloword 的core.
这将创建一个内核,该内核使用数据驱动模式,当您将文档添加到索引中时,该模式尝试猜测正确的字段类型。
若要查看创建新内核的所有可用选项,请执行:
bin/solr create -help
仅仅开始,一步一步来。