solr导入Oracle日期时间数据的处理

参考文章:
http://stackoverflow.com/questions/10111517/getting-correct-time-from-oracle-date-in-solr-dataimporthandler

在导入Oracle数据的时候,总是只有日期,但是时间信息每个记录都是一样的,在网上查了很多资料,只有参考文章中的办法成功了

做法:在data-config.xml配置文件中加入自定义transformer处理:

<?xml version="1.0" encoding="UTF-8"?>
<dataConfig>
<script><![CDATA[
function startDateTransform(row){
// Get the timestamp and convert it to a date
var dateVal = row.get("ADD_ATT").dateValue();
// Put the correct date object into the original column
row.put("ADD_ATT", dateVal);
if(row.get("MODI_DD")!=null){
dateVal = row.get("MODI_DD").dateValue();
row.put("MODI_DD", dateVal);
}
return row;
}
]]></script>
<dataSource type="JdbcDataSource" driver="oracle.jdbc.OracleDriver"
url="jdbc:oracle:thin:@101.174.8.206:1521:orcl"
user="usr"
password="pwd"/>

<document name="gqh_position">
<entity name="gqh_position"
query="SELECT CP_ID,P_NAME,CATE_TITLE,COMPANY_NAME,DESCRIPTION,EDU_LEVEL,TITLE_LEVEL,DAN_WEI_JJ,CAST(ADD_AT AS TIMESTAMP) AS ADD_ATT,
CAST(MODI_AT AS TIMESTAMP) AS MODI_DD,SALARY FROM GQH_POSITION_FULL_VIEW"
transformer="ClobTransformer,script:startDateTransform">
<!-- ROUND(TO_NUMBER(sysdate - modi_at) * 24 * 60) -->
<field column="CP_ID" name="CP_ID" />
<field column="P_NAME" name="P_NAME" />
<field column="CATE_TITLE" name="CATE_TITLE" clob="true"/>
<field column="COMPANY_NAME" name="COMPANY_NAME" />
<field column="EDU_LEVEL" name="EDU_LEVEL" />
<field column="DAN_WEI_JJ" name="DAN_WEI_JJ" clob="true" />
<field column="ADD_ATT" name="ADD_AT"/>
<field column="MODI_DD" name="MODI_AT" />
<field column="SALARY" name="SALARY"/>
</entity>
</document>
</dataConfig>


这样在客户端取得数据显示的时候

p.setStamp((Date)doc.getFieldValue("ADD_AT")); //p是vo对象
//在jsp页面中显示
<fmt:formatDate value="${p.stamp}" pattern="yyyy-MM-dd HH:mm:ss" />


关于deltaimport的配置:

deltaImportQuery="SELECT CP_ID,P_NAME,CATE_TITLE,COMPANY_NAME,DESCRIPTION,EDU_LEVEL,TITLE_LEVEL,DAN_WEI_JJ,CAST(ADD_AT AS TIMESTAMP) AS ADD_ATT,
CAST(MODI_AT AS TIMESTAMP) AS MODI_DD,SALARY FROM GQH_POSITION_FULL_VIEW WHERE to_char(ADD_AT,'YYYY-MM-DD HH24:MI:SS') > '${dataimporter.last_index_time}'
OR to_char(MODI_AT,'YYYY-MM-DD HH24:MI:SS') > '${dataimporter.last_index_time}'"
deltaQuery="SELECT CP_ID,P_NAME,CATE_TITLE,COMPANY_NAME,DESCRIPTION,EDU_LEVEL,TITLE_LEVEL,DAN_WEI_JJ,CAST(ADD_AT AS TIMESTAMP) AS ADD_ATT,
CAST(MODI_AT AS TIMESTAMP) AS MODI_DD,SALARY FROM GQH_POSITION_FULL_VIEW WHERE to_char(ADD_AT,'YYYY-MM-DD HH24:MI:SS') > '${dataimporter.last_index_time}'
OR to_char(MODI_AT,'YYYY-MM-DD HH24:MI:SS') > '${dataimporter.last_index_time}'"
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要使用Python增量导入Oracle数据Solr,您需要遵循以下步骤: 1. 安装Solr和Python的相关库(如pysolr)。 2. 编写Python脚本,连接Oracle数据库并执行增量查询,将查询结果转换为Solr文档格式,并使用pysolr库将文档添加到Solr中。 3. 您可以使用定时任务(如cron)来定期运行Python脚本,以便进行增量导入。 下面是一个示例Python脚本,用于从Oracle数据库中查询并导入数据Solr: ``` import cx_Oracle import pysolr # Oracle数据库连接配置 dsn_tns = cx_Oracle.makedsn('localhost', '1521', 'XE') conn = cx_Oracle.connect(user='username', password='password', dsn=dsn_tns) cursor = conn.cursor() # Solr连接配置 solr = pysolr.Solr('http://localhost:8983/solr/mycore', timeout=10) # 查询增量数据 query = "SELECT * FROM mytable WHERE updated_at > :last_update" last_update = '2021-01-01 00:00:00' # 上次更新时间 cursor.execute(query, last_update=last_update) # 将查询结果转换为Solr文档格式 docs = [] for row in cursor: doc = { 'id': str(row[0]), 'title': row[1], 'content': row[2], 'updated_at': row[3].strftime('%Y-%m-%dT%H:%M:%SZ') } docs.append(doc) # 添加文档到Solr solr.add(docs) # 更新上次更新时间 last_update = datetime.now().strftime('%Y-%m-%d %H:%M:%S') # 关闭Oracle连接和Solr连接 cursor.close() conn.close() solr.commit() solr.close() ``` 此脚本将从Oracle数据库中查询更新时间大于上次更新时间数据,并将查询结果转换为Solr文档格式。然后,使用pysolr库将文档添加到Solr中,并更新上次更新时间。您可以根据需要调整查询和文档格式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值