版本:solr5.5 ,mysql5.6
启动环境:solr自带的jetty服务器
solr环境搭建和添加core: solr入门-环境搭建(http://blog.csdn.net/u014611990/article/details/73881612)
因为需要连接mysql,所以自然少不了mysql连接驱动。还有因为在使用solr界面查询mysql数据时,
需要先把数据载入到solr,建立索引后,才能查询数据,所以需要使用到solr的dataimport功能。
准备
mysql-connector-java-5.1.41.jar
,solr-dataimporthandler-5.5.0.jar
。
solr-dataimporthandler-5.5.0.jar
可以从solr-5.5.0\dist目录下找到,
将两个包添加到solr-5.5.0\server\solr-webapp\webapp\WEB-INF\lib
目录下,如果是将solr部署在tomcat下面,则是对应tomcat的webapp目录。编辑core下面的
solrconfig.xml
添加如下内容
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">solr-data-config.xml</str>
</lst>
</requestHandler>
可以看到我们有引用solr-data-config.xml这个配置文件, 这个配置文件也可以在
solr-5.5.0\example\example-DIH\solr\solr\conf
中找到, 将其复制到自己core下面的conf文件下面,因为solrconifg.xml配置文件使用的是相对路径,也可以改成绝对路径,放置别处。
- 编辑solr-data-config.xml,最终内容如下
<dataConfig>
<dataSource name="springbootdb" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://127.0.0.1:3306/springbootdb?useUnicode=true&characterEncoding=utf-8" user="root" password="root"/>
<document>
<entity name="user" dataSource="springbootdb" query="select * from user" >
<field column="id" name="id"/>
<field column="user_name" name="userName"/>
<field column="description" name="description"/>
</entity>
</document>
</dataConfig>
url中的& 需要换成&, 否则后续导入
Data Config problem: 对实体 "useUnicode" 的引用必须以 ';' 分隔符结尾。
password属性要特别注意,密码最好不要带特殊符号比如”\ /” ,否则导入的时候报错, 被坑了好久, 才排查出来的。
Data Config problem: 对实体 "Q0usBfg" 的引用必须以 ';' 分隔符结尾
entity跟hiberante的mapping映射类似, column数据库的列名, name映射的字段名
编辑managed-schema , 新版本是这个, 没后缀, 以前的版本是schema.xml , 自己也可以改成schema.xml , 将我们solr-data-config.xml entity中的字段添加到里面
<field name="id" type="int" indexed="true" stored="true" required="true" multiValued="false" />
<field name="userName" type="string" indexed="true" stored="true"/>
<field name="description" type="string" indexed="true" stored="true"/>
我表中的id字段是int型的, 所以我把自带的id字段改成了String类型,type字段类型,indexed是否索引,stored是否存储,multiValued是否分词
启动solr
注意的是这里的command参数,它有两个选项
full-import:全量导入,它会覆盖原有的索引
delta-import:即增量导入,它会在原有索引的基础上追加
下面的几个多选框含义解释如下:
verbose:这个选项设为true的话,会打印导入的一些中间过程的详细信息,有利于调试以及了解内部操作细节
clean:表示是否在导入数据创建索引之前先清空掉原有的索引
commit:表示是否立即提交索引
optimize:表示是否优化索引
debug: 表示是否开启调试模式
我们可以展开右面的Configuration面板,可以看到solr-data-conifg里面的内容, 如果里面的内容都是黑色,说明内容有误, 有各种属性颜色则正确, 也可以点击Reload按钮,如果刷新图标变成绿色的√, ok, 不然得好好检查下文件了
- 选择Enttiy后,执行导入,成功后如图,我表中就3条数据,如果数据量小,带等待时间过长, 那就不要傻傻的等了,
看看Loging中有没有日志信息。 可以点击Refresh Status,刷新下状态。
- 检索数据,如果检索不出来,可尝试重复一次导入操作,如果还不行,在仔细看看上面的步骤看看有什么遗漏了。