solr导入oracle数据并创建索引

solr下载安装

下载

点此下载 solr-5.5.3

安装

  • 安装jdk1.8及以上,配置好环境变量(略)
  • 解压solr,以使用命令行脚本启动服务器。让我们去solr的bin目录,从命令提示符输入出以下命令

    solr start

  • 启动后访问 http://localhost:8983/solr/,进入solr控制台

solr常用命令选项

  • -c -要创建的核心或集合的名称(必需)。
  • -d -配置目录,在SolrCloud模式非常有用。
  • -n -配置名称。这将默认为核心或集合的名称。
  • -p -本地Solr的实例的端口发送create命令; 默认脚本试图通过寻找运行Solr的实例来检测端口。
  • -s -Number of shards to split a collection into, default is 1.
  • -rf -集合中的每个文件的份数。默认值是1。
    solr create -c jcg -d basic_configs
    进入solr控制台页面,可以看到JCG核心被填充在核心选择器上。还可以看到核心的统计信息。

solr配置

  • 默认dataImport功能在Solr5中是禁用的,需要在solrconfig.xml中添加如下配置开启数据导入功能:
<requestHandler name="/dataimport" class="solr.DataImportHandler">  
      <lst name="defaults">  
            <str name="config">data-config.xml</str>  
      </lst>  
</requestHandler>  

这里的data-config.xml是个相对路径,是相对于你当前core下的conf目录即C:\solr_home\core1\conf

  • 从\example\example-DIH\solr\solr\conf路径下复制一份 data.config.xml配置文件到solrconfig.xml配置文件的同级目录C:\solr_home\core1\conf下

  • 然后我们需要使用文本编辑软件打开data-config.xml配置文件稍作修改,如图:
<dataConfig>
    <dataSource password="scott" user="scott" url="jdbc:oracle:thin:@192.168.0.41:1521:yqfx" driver="oracle.jdbc.driver.OracleDriver"/>
        <document name="Info" pk="id">
        <entity name="zpxx" transformer="ClobTransformer" pk="id"
        query="SELECT * FROM siteinfo" 
        deltaImportQuery="SELECT id,url FROM siteinfo where id ='${dih.delta.id}'" 
        deltaQuery="select id from siteinfo where createTime > '${dataimporter.last_index_time}'">
            <field name="id" column="id"/> 
            <field name="url" column="url"/>
            <filed name="createTime" coiumn="createTime"/>
        </entity>
    </document>
</dataConfig>
  • query是获取全部数据的SQL(solr从sql中获取那些数据),多列
  • deltaImportQuery是获取增量数据时使用的SQL(数据库新增数据追加到solr的数据),多列
  • deltaQuery是获取pk的SQL(数据库新增数据是,追加到solr的数据时的条件,根据id ,条件是最后一次获取的时间,${dataimporter.last_index_time,最后获取的时间}),一列
  • 修改schema.xml文件申明field,field的名字应该和sql的查询结果集列名一致;
<--zx配置SSH库的field -->
<field name="id"   type="int "   indexed="true"  stored="true"  multiValued="false" required="true"/>  
<field name="name"   type="string"   indexed="true"  stored="true"  multiValued="false" />   
<field name="url"  type="string"     indexed="true"  stored="true"  multiValued="false" />

oracle驱动

  • 从E:\app\Administrator\product\11.2.0\client_1\jdbc\lib中复制ojdbc6.jar至solr-5.5.3\server\solr-webapp\webapp\WEB-INF\lib下

数据导入并创建索引

  • 进入solr管理界面,command选择full-import全部导入;entity需要导入的实体,也就是配置的哪个sql,点击execute执 行导入

js调用solr服务

$.ajax({
    type: 'GET',
    url: solrServer,
    data: {
        wt: 'json',
        q: 'name:*'+ key +'*',
        indent: true,
        "json.wrf" : 'solrCallback',// -- 1 --
        'start': '0',
        'rows': '10'
    },
    dataType: 'jsonp',
    jsonpCallback : 'solrCallback',// -- 2 --
    success:function(data){// -- 3 ---
        var responseHeader = data.responseHeader;
        var response = data.response;
        var highlighting = data.highlighting;
        var docs = response.docs;               
    },
    error : function(e) {
        console.log('poi查询失败!');
    }
});
  • 使用jquery的getJSON方法时,需要提供jsonCallback参数,虽然这个参数没有用,因为solr应用并不处理这个参数。但还是需要,否则载入方式,就不是jsonp了。同时还需要提供给solr’json.wrf’参数,例如’json.wrf’:’init’,init才是solr会使用的回调函数。详细参考solr文档。
  • 1,2,3步即可获得结果

参考

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要使用Python增量导入Oracle数据Solr,您需要遵循以下步骤: 1. 安装Solr和Python的相关库(如pysolr)。 2. 编写Python脚本,连接Oracle数据库并执行增量查询,将查询结果转换为Solr文档格式,并使用pysolr库将文档添加到Solr中。 3. 您可以使用定时任务(如cron)来定期运行Python脚本,以便进行增量导入。 下面是一个示例Python脚本,用于从Oracle数据库中查询并导入数据Solr: ``` import cx_Oracle import pysolr # Oracle数据库连接配置 dsn_tns = cx_Oracle.makedsn('localhost', '1521', 'XE') conn = cx_Oracle.connect(user='username', password='password', dsn=dsn_tns) cursor = conn.cursor() # Solr连接配置 solr = pysolr.Solr('http://localhost:8983/solr/mycore', timeout=10) # 查询增量数据 query = "SELECT * FROM mytable WHERE updated_at > :last_update" last_update = '2021-01-01 00:00:00' # 上次更新时间 cursor.execute(query, last_update=last_update) # 将查询结果转换为Solr文档格式 docs = [] for row in cursor: doc = { 'id': str(row[0]), 'title': row[1], 'content': row[2], 'updated_at': row[3].strftime('%Y-%m-%dT%H:%M:%SZ') } docs.append(doc) # 添加文档到Solr solr.add(docs) # 更新上次更新时间 last_update = datetime.now().strftime('%Y-%m-%d %H:%M:%S') # 关闭Oracle连接和Solr连接 cursor.close() conn.close() solr.commit() solr.close() ``` 此脚本将从Oracle数据库中查询更新时间大于上次更新时间的数据,并将查询结果转换为Solr文档格式。然后,使用pysolr库将文档添加到Solr中,并更新上次更新时间。您可以根据需要调整查询和文档格式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值