提取oracle数据库HTML内容转换成正文格式

提取oracle数据库HTML内容转换成正文格式(去标签)在更新到同表的TZNR

# -*- coding:utf-8 -*-
import cx_Oracle
from bs4 import BeautifulSoup


conn = cx_Oracle.connect('用户名', '用户密码', 'localhost:1521/ORCL')
cur = conn.cursor()

sql_search = 'select WZ,HTML from 表名'
res = cur.execute(sql_search)
# html = cur.fetchone()
rows = cur.fetchall() #得到所有数据集
for row in rows:
    # print(row[0])
    html = BeautifulSoup(row[1],'lxml').text
    # print(html)
    upsql = "UPDATE 表名 t SET t.TZNR = :TZNR WHERE t.WZ = :WZ"
    cur.prepare(upsql)
    cur.execute(None, {'TZNR': html,'WZ': row[0]})
    print('sucess!!!')
    conn.commit()

cur.close()
conn.close()

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值