- solr介绍 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。 - solr环境
Solr是java开发的所以需要部署java的环境。下载jdk,tomcat,solr,这里我下载的都是官网最新版本jdk8,tomcat9,solr5.4.1。首先安装jdk,因为安装tomcat时需要指定jdk的位置。然后安装tomcat(建议将端口号设置为8983),有一点需要注意,最好不要把tomcat安装到C盘(系统盘),因为在配置solr的时候需要修改配置文件,会涉及到文件修改的权限问题,如果不是管理员很麻烦。
这里需要记录一下Tomcat的目录D:\Apache\Tomcat 9.0。 - solr配置
1、解压Solr包,得到以下文件
2、打开server将webapp拷贝到Tomcat目录下的webapps,重命名为solr
3、将server\lib\ext目录下的全部jar包拷贝到tomcat\webapps\solr\libs目录
4、将solr\contrib\velocity\lib全部拷贝到tomcat\webapps\solr\libs目录
5、将solr\dist全部拷贝到tomcat\webapps\solr\libs目录
6、运行http:\\localhost:8983/solr/index.html就可以看到solr界面
7、设置solr_home目录D:\solr_home,将solr\server\solr目录拷贝到solr_home下
8、设置D:\Apache\Tomcat 9.0\webapps\solr\WEB-INF\web.xml的env-entry节点,默认情况下是注释掉的需要修改为:
9、在solr_home下创建core(MyFirstSolr)文件夹,将solr\example\example-DIH\solr\solr拷贝到MyFirstSolr下,并修改conf目录下的solrconfig.xml的lib节点<env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>D:/solr_home</env-entry-value><!--solr_home目录--> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
修改前(相对路径):
修改后(使用绝对路径):
10、本人使用的是mssql,solr-data-config.xml配置如下:
这里需要SQL Server Driver,我使用的是sqlserver2008r2,需要用到sqljdbc4.jar包,之前版本的sqlserver需用到sqljdbc.jar。将包放到tomcat\webapps\solr\libs下。<dataConfig> <dataSource driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://111.111.111.111:1433;databaseName=basename;responseBuffering=adaptive;selectMethod=cursor" batchSize="100" user="sa" password="sa" readOnly="true"/> <document> <entity name="t_email_act" query="select top 1000 ea_email_id,ea_email_title,ea_send_email,ea_email_body,ea_create_date,ea_sales_id,ea_recv_email from t_email_act" transformer="HTMLStripTransformer" > <field column="ea_email_id" name="email_id" /> <field column="ea_email_title" name="email_title"/> <field column="ea_send_email" name="send_email"/> <field column="ea_email_body" name="email_body" stripHTML="true"/> <field column="ea_create_date" name="email_date"/> <field column="ea_sales_id" name="sales_id"/> <field column="ea_recv_email" name="recv_email"/> </entity> </document> </dataConfig>
11、修改schema.xml的field节点。删除所有field节点只保留name=“_version_”和name="_root_"的节点,添加solr-data-config.xml中对应的field节点。
12、执行full-import命令<!-- If you remove this field, you must _also_ disable the update log in solrconfig.xml or Solr won't start. _version_ and update log are required for SolrCloud --> <field name="_version_" type="long" indexed="true" stored="true"/> <!-- points to the root document of a block of nested documents. Required for nested document support, may be removed otherwise --> <field name="_root_" type="string" indexed="true" stored="false"/> <field name="email_id" type="string" indexed="true" stored="true" /> <field name="email_title" type="string" indexed="true" stored="false" /> <field name="send_email" type="string" indexed="true" stored="false" /> <field name="email_body" type="string" indexed="true" stored="false" /> <field name="email_date" type="tdate" indexed="true" stored="false" /> <field name="sales_id" type="string" indexed="true" stored="false" /> <field name="recv_email" type="string" indexed="true" stored="false" /> <uniqueKey>email_id</uniqueKey><!--对应主键-->