一、下载solr安装包:
http://lucene.apache.org/solr/;
二、在cmd中进入solr安装目录的bin文件夹,启动solr:
solr start //启动solr
solr stop -all //关闭solr
三、在浏览器中进入solr控制台:localhost:8983/solr:
四、创建solr实例(类似于数据库db文件)
1、在solr安装目录下的/server/solr下创建hotel3_core文件夹,用于存储solr实例的配置信息;
2、在相同的目录下,创建hotel3_data文件夹,用于存储从数据库中导入的数据相关信息;
3、将solr的安装目录下的/server/solr/configsets/_default下的conf文件夹复制到hotel3_core文件夹:
4、导入jar包:
首先,在solr安装目录下的dist文件夹中,找到:
solr-dataimporthandler-7.3.0.jar
solr-dataimporthandler-extras-7.3.0.jar
将其复制到/server/solr-webapp/webapp/WEB-INF/lib文件夹下(还需导入mysql的驱动包)。
其次,将:
ik-analyzer-solr5-5.x.jar和solr-analyzer-ik-5.1.0.jar(中文分词器,网上可以下载)
也复制到上述文件夹下。
5、将分词规则文件(可从网上下载)放到/server/solr-webapp/webapp/WEB-INF/classes文件夹中:
6、修改/server/solr/hotel3_core/conf中的配置文件:
(1)在solrconfig.xml中添加如下内容:
<requestHandler name="/dataimport3" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
其中,requestHandler的name属性自定义。
(2)在/server/solr/hotel3_core/conf文件夹下建立data-config.xml文件,此文件名与上述配置文件中str标签中的值应相同。
在data-config.xml添加如下内容:
<?xml version="1.0" encoding="UTF-8"?>
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/db_1804" user="root" password="123456"/>
<document>
<!--设置实例的属性,name自定义,为了不出错,最好与要查询的数据库中的表名一致;
query中填写实际查询数据库的sql语句-->
<entity name="demo_hotel" query="SELECT hotel_id,hotel_name FROM demo_hotel">
<!--column为数据库的字段名,name必须为"id"-->
<field column="hotel_id" name="id"/>
<!--column为数据库的字段名,name可以自定义-->
<field column="hotel_name" name="hotelName"/>
</entity>
</document>
</dataConfig>
(3)在managed-schema文件中添加如下内容(配置中文分词器):
<!--此处的name为data-config.xml文件中,field标签的name属性的值;
type属性为需要使用的分词类型,自选
注意:主键字段,即id不能进行分词设置,否则会报错!!!;
-->
<field name="hotelName" type="qian_ik" indexed="true" stored="true"/>
<fieldType name="qian_ik" class="solr.TextField">
<analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
五、重新启动solr
在cmd控制台中重新启动solr,并在浏览器中访问solr控制台。
六、添加实例
1、在solr控制台中,点击core admin中的add core,即添加实例:
(1)name自定义,但是为了不出错,最好与之前建立的hotel3_core文件夹名称相同;
(2)instanceDir填写hotel3_core文件夹的绝对路径;
(3)dataDir填写hotel3_data文件夹的绝对路径;
(4)其余属性不用修改,点击add按钮添加实例。
七、导入数据
实例添加完成后,加载完毕后点击如图中的按钮,从数据库中导入数据,其中:
1、full-import全量导入(每次将数据库中所有数据重新导入);
2、delta-import为增量导入(每次只从数据库中导入新增的数据);
3、在entity中选择要导入的表;
4、注意:千万不要输入start,rows的值,不要点这两个输入框,否则会报错报错报错!!!!!!(折腾了半天才弄明白为什么老报这两个错)。
5、属性设置完成后,点击execute按钮,观察界面右上方的执行,若如下图中所示,fetched属性值不为0,则表示数据导入成功。
八、查询数据
点击下图中的query按钮,即可进行分词查询:
1、q属性中,填写查询的条件:
(1)第一个星号填写data-config.xml文件中field标签对应的name的值;
(2)第二个星号填写要搜索的关键字、词,如:hotelName:香*。大功告成啦!!!!!
总结:
1.配置文件中,主意一定不要有中文字符、隐藏的特殊字符等,连空格都要仔细检查!!!
2.分词检索时,solr是对导入的数据进行分词,不是对输入的搜索条件分词!!