一、${dih.delta.id}和${dataimporter.last_index_time}实现的solr增量导入
该增量导入方式,当数据库时间慢于solr服务器时间,会导致增量导入的数据缺少记录;会发出N+1条sql,效率低。1、 配置
1) 需要导入的表结构create table SOLRTEST
(
ID number,
EMP_NAME VARCHAR2(100),
CREATETIME DATE
)
2) solr配置
i) 创建索引库
${solr.home}\bin\solr.cmdcreate -c solrtest
ii) 配置${solr.home}\server\solr\solrtest\conf\managed-schema文件
配置中文分词器
<fieldType name="solr_cnAnalyzer" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
配置索引字段
<field name="empName" type="solr_cnAnalyzer" indexed="true" stored="true" required="true" multiValued="false" />
<field name="createtime" type="pdate" indexed="true" stored="true" required="true" multiValued="false" />
iii) 指定dataImportHandler的数据源配置文件,${solr.home}\server\solr\solrtest\conf\solrconfig.xml文件中添加:
<requestHandler name="/dataimport" class="solr.DataImportHandler">
<lst name="defaults">
<str name="config">./data-config.xml</str>
</lst>
</requestHandler>创建${solr.home}\server\solr\solrtest\conf\data-config.xml,并配置:
iv) 创建${solr.home}\server\solr\solrtest\conf\data-config.xml,并配置:
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"