solr 6.4 mysql_solr6.4.1搜索引擎(2)首次同步mysql数据库

注意,这里的两个输入框*Dir如果不指定目录,那么默认这个core3目录将应该在solrhome根目录下,instanceDir和dataDir必须是两个已存在的目录

我这里的core3目录是D:\solr\solrhome\core3(这个core3目录也要先建立出来)

39e4ea08c165da95898bfe90cf2f5508.png

先不要点击按钮Add Core,因为会报错:

Error CREATEing SolrCore 'core3': Unable to create core [core3] Caused by: Can't find resource 'solrconfig.xml' in classpath or 'D:\solr\core3'

为了避免这个错误,我们首先需要为这个core3做一些准备工作,包括要把Add Core中的solrconfig.xml和schema.xml文件都创建出来。主要分为以下几步:

第一步:创建solrconfig.xml

因为是同步数据库,所以找的是db目录下的solrconfig.xml, D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\solrconfig.xml

6c620c382039a404f8c6aac69be97c4e.png

(上图工具使用的是一个windows搜索器:Everything.exe)

复制D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\solrconfig.xml黏贴到D:\solr\solrhome\core3目录下。

修改D:\solr\solrhome\core3\solrconfig.xml,把

676715ada194f9d27eebbd6998f043d8.png

第二步:创建db-data-config.xml

因为在D:\solr\solrhome\core3\solrconfig.xml中,提到使用db-data-config.xml来导入数据

b65d5a60676b022eec9da77a1f352103.png

所以同理,复制db目录下的db-data-config.xml到D:\solr\solrhome\core3\目录下

d9790ff195dab2b81a91d97bca2dc114.png

重点1:db-data-config.xml中,url地址中的&符号必须替换为&否则会报错:

Data Config problem: 对实体 "useUnicode" 的引用必须以 ';' 分隔符结尾。

以下是我本地的db-data-config.xml文件

2605fe624fb2bee1121daa6206e93502.png

重点2:所有field标签的name值都必须存在于schema.xml中!(参考第三步:创建schema.xml)

第三步:创建schema.xml

复制D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\managed-schema黏贴为D:\solr\solrhome\core3\schema.xml,这个schema.xml就是Add Core界面的schema文件。

重点1:schema.xml文件定义了所有我们需要在数据库中同步过来的字段,其中db-data-config.xml中导入的字段必须要存在于该schema.xml中所以schema.xml文件决定了在整个solr应用中,所有的字段必须不能重复!建议在solr中对字段命名时采用表名_字段名方式。

重点2:schema.xml文件中所有的

重点3:当点击Add Core按钮之后,原先的D:\solr\solrhome\core3\schema.xml文件将被删除,随之增加D:\solr\solrhome\core3\conf\managed-schema(注意,没有后缀名)

以下是我本地的managed-schema文件

42beaff90b4a621ca375386d0020e50b.png

注意,不要缺失w10_id标签,否则会报错:

core3: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: QueryElevationComponent requires the schema to have a uniqueKeyField.

第四步:复制stopwords_*.txt文件到D:\solr\core3\lang\目录下

所有的D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_*.txt文件

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_el.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_en.txt

it;id;hy;lv;hu;pt;tr;de;hi;da;cz;th;sv; 等等txt文件,总共有31个

第五步:复制以下文件到D:\solr\core3\lang\目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_it.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_ca.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_ga.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_fr.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\hyphenations_ga.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stemdict_nl.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stoptags_ja.txt

第六步:复制elevate.xml到conf目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\elevate.xml复制到D:\solr\core3\conf

第七步:复制以下文件到D:\solr\core3\目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\protwords.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\synonyms.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\stopwords.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\currency.xml

第八步:重启tomcat,访问solr,增加core

增加一个core就相当于增加了一个数据库,solr本就支持数据库集群,支持以json格式存储数据

点击Core Admin菜单,输入core信息,点击Add Core按钮:

bbe1e40866fb71287a59b88ebfb2eda6.png

建立成功之后可以查看core3的位置信息:

42b006a94250cb41b5f7eca1b7a4bc41.png

ps: 如果启动过程中有遇到*.lock文件而报错,那么删除该lock文件重新建立一遍既可成功。

第九步:gui界面导入mysql数据库

下拉框选择刚刚建立的core3,选中Dataimport菜单

1090ee7c86d9b1105504c265e0cac77b.png

先检查core3加载的db-data-config.xml文件是否有效,点击Reload按钮校验,当出现信息No information available时则表示校验通过。

c45e7f684b5c78a4c0490589d74c5404.png

初次导入选择full-import全量导入模式,点击Execute按钮执行数据导入,页面右边显示Indexing since则表示正在导入中,在导入过程中,点击Refresh Status则会显示详细的导入信息(Requests,Fetched,Skipped),如下图右图所示:

fca007e8e0447b7edc5086e7a90b88f0.png

如果导入失败,需要重来一遍,在选择勾选clean选项(清除之前所有导入索引)外,也可以考虑直接删除数据文件,地址在core3根目录下,有个data文件夹:D:\solr\solrhome\core3\data。

注意勾选上选项 Auto-Refresh Status,这个会自动帮你刷新数据导入状态信息,信息大概变化如下:

f12ecd0084b388f39127ed149f6a7693.png

请求第一个entity,我这里是w10,数据10万量的表

d8e0dbca15325e35955fb5408bd50a29.png

请求第二个entity,我这里是w100, 数据100万量的表

883d4322cfaa67e85fbb791fbf480bfb.png

请求第三个entity,我这里是w1000, 数据1000万量的表

导入成功后,信息界面显示如下:

7726b9d177ffa582fd6a02344ef06677.png

数据导入成solr索引成功,总共花费了5分钟06秒。这时候就可以去掉勾选项Auto-Refresh Status

第十步:gui界面查看导入数据

选择core3,点击菜单Query,什么查询条件都不要加,点击Execute Query按钮

a880608379e9f37bfd10202d8cf4cdce.png

查询出solr同步数据如下,表示同步mysql数据成功:

df3d8ac9985e32409d0478a5710dab5f.png

上图中,http地址表示此次查询可以使用这样的get请求方式,其中status 0 表示查询成功,params表示此次查询使用的查询参数。这里显示的全都是默认值。response里的数据代表查询到的数据,可以看到已经查询成功。

第十一步:solr数据状态

082393d928be7e7922fa146df4588002.png

选择core4,点击overview,当在tomcat重启后,有可能出现上图中的optimize now,并且Optimized状态显示为叉叉,这是solr在告诉你这个core4的数据索引并没有按照solr的索引排序以达到最佳查询状态,只需要点击optimize now进行索引重新排序就可以了。

但是注意,这需要花费一定时间,所以会损失性能,当然,重新排序后,性能会提高。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值