solr导入MySql数据

1  概述


大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。  

 

能够读取关系数据库中的数据。 

通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档   

能够通过solr文档更新solr 

提供 通过配置文件就能够导入所有数据的能力 

能够配置 “完全导入”和“增量导入”的时间 

让读取xml文件,并建立索引成为可配置。 

能够将 其他的数据源(例如:ftp,scp,etc)或者其他格式的文档(Json,csv)以插件的形式集成到项目中。

 

2  配置资源数据

solr提供了2种方式来上传数据:

  • 命令行方式
  • 控制台界面

在solr目录下: solr\example\exampledocs下有一个post.jar,该jar提供了导入相关命令,下面主要记录通过控制台界面或者命令行的方式进行导入配置;

 

2.1     导入数据库

2.1.1   添加jar

solr 连接数据 需要两个jar 

分别是solr连接mysql的Jar,一个是mysql驱动Jar;

进入solr-5.5.0/dist 文件夹中

1)、将solr-dataimporthandler-5.5.4.jar,solr-dataimporthandler-extras-5.5.4.jar拷贝到solr\server\solr-webapp\webapp\WEB-INF\lib目录下;

2)、将mysql-connector-java-5.0.8-bin.jar拷贝到\solr\server\lib目录下;

 

 

数据库表结构:

 

 

2.1.2   配置数据库

进入solr\server\solr目录创建核心core目录,增加conf和data目录(关于如何新增的可以看之前写的安装配置文档)

在conf中

1、修改solrconfig.xml文件,新增:

<requestHandlername="/dataimport"class="org.apache.solr.handler.dataimport.DataImportHandler">  
         <lst name="defaults">  
               <strname="config">data-config.xml</str>  
         </lst>  
</requestHandler>


 

2、新增data-config.xml文件,内容如下:

<dataConfig>
   <dataSource type="JdbcDataSource"driver="com.mysql.jdbc.Driver"url="jdbc:mysql://localhost:3306/solr" user="root"password="root"/>
   <document>
       <entity name="check_lawyer"
           query="select id, name from solr_user">
           <field column="id" name="id" />
           <field column="name" name="name" />
       </entity>
   </document>
</dataConfig>


 

说明:

field区域当中的column对应数据库中的列,而name就是solr中显示的名称。

 

 

3、修改managed-schema文件,在最后新增:

<field name="content"type="string" indexed="true" stored="true"multiValued="false"/>


配置完成后,重启solr,选择Dataimport可以看到导入界面:

 



 

 

2.1.3   导入

Solr提供了full-importdelta-import两种导入方式

full-import

多个entity,每个entity有各自的last_index_time,可以通过dataimporter.entityname.last_index_time来取各自的最后更新时间来进行增量更新。

多个entity时,进行full-import时指明导入某个entity,

http://localhost:8088/solr-platform/zbs-core/dataimport?entity=zcx&command=full-import.会把之前创建的索引通通删除(包括其他ENTITY创建的索引)重新建,,加上参数clean = false;但也会删除相同id的(在scheam.xml uniqueKey 声明的)

 

delta-import

主要是对于数据库(也可能是文件等等)中增加或者被修改的字段进行导入。主要原理是利用率每次我们进行import的时候在solr.home\conf下面生成的dataimport.properties文件,此文件里面有最近一次导入的相关信息。这个文件如下:

#Tue Jun 06 12:55:58 UTC 2017
last_index_time=2017-06-0612\:55\:57
check_lawyer.last_index_time=2017-06-0612\:55\:57


 

其实last_index_time是最近一次索引(full-import或者delta-import)的时间。

通过比较这个时间和我们数据库表中的timestamp列即可得出哪些是之后修改或者添加的。

 

选择Execute之后开始导入,可以选择RefreshStatus状态查看导入状态:

 


Entity下拉框中可以选择data-config.xml中配置的entity,为空时导入所有entity;

 

 


至此solr连接mysql导入完成,以上是通过平台控制界面来实现导入的,除了界面操作之外还可以使用命令的方式导入,在这里就不细说了,相关可以搜索
localhost:8983/solr/dataimport?command=full-import 

 

 

 



  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
要使用Python增量导入Oracle数据Solr,您需要遵循以下步骤: 1. 安装Solr和Python的相关库(如pysolr)。 2. 编写Python脚本,连接Oracle数据库并执行增量查询,将查询结果转换为Solr文档格式,并使用pysolr库将文档添加到Solr中。 3. 您可以使用定时任务(如cron)来定期运行Python脚本,以便进行增量导入。 下面是一个示例Python脚本,用于从Oracle数据库中查询并导入数据Solr: ``` import cx_Oracle import pysolr # Oracle数据连接配置 dsn_tns = cx_Oracle.makedsn('localhost', '1521', 'XE') conn = cx_Oracle.connect(user='username', password='password', dsn=dsn_tns) cursor = conn.cursor() # Solr连接配置 solr = pysolr.Solr('http://localhost:8983/solr/mycore', timeout=10) # 查询增量数据 query = "SELECT * FROM mytable WHERE updated_at > :last_update" last_update = '2021-01-01 00:00:00' # 上次更新时间 cursor.execute(query, last_update=last_update) # 将查询结果转换为Solr文档格式 docs = [] for row in cursor: doc = { 'id': str(row[0]), 'title': row[1], 'content': row[2], 'updated_at': row[3].strftime('%Y-%m-%dT%H:%M:%SZ') } docs.append(doc) # 添加文档到Solr solr.add(docs) # 更新上次更新时间 last_update = datetime.now().strftime('%Y-%m-%d %H:%M:%S') # 关闭Oracle连接Solr连接 cursor.close() conn.close() solr.commit() solr.close() ``` 此脚本将从Oracle数据库中查询更新时间大于上次更新时间的数据,并将查询结果转换为Solr文档格式。然后,使用pysolr库将文档添加到Solr中,并更新上次更新时间。您可以根据需要调整查询和文档格式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值