python爬取图片链接标签的src属性值_python 正则提取img标签和src

#coding=utf-8

importpymssqlimportredefconnectDB():

conn= pymssql.connect(server='****', user='User', password='****', database='*****',

charset='cp936')

cur=conn.cursor()

sql= 'select ProductID,Content from Products WHERE (not Content IS NULL )'cur.execute(sql)

row=cur.fetchone()

resultList=[]whilerow:#print("ProductID=%s,Content=%s" % (row[0], row[1]))

result = parseContent(row[1])ifresult:

tmp=[]#print("解析出的img为:")

#print(result)

#tmp.append(int(row[0])) # 将productID转成int类型,方便下面的比较

tmp.append(row[0])

tmp.append(result)

resultList.append(tmp)try:

row=cur.fetchone()exceptUnicodeDecodeError:continueconn.close()returnresultListdefparseContent(content):

pattern= ']*/>'result=re.findall(pattern, content)returnresultdefsaveImg(resultList):

productIdList=getExtraBookProductIDList()

conn= pymssql.connect(server='****', user='User', password='****', database='*****',

charset='cp936')

cur=conn.cursor()for result in resultList: #遍历解析出来的imgList

if result[0] inproductIdList:#提取src

imgSrc = getImgSrc(result[1])for img inimgSrc:

sql_1= """update ExtraBookInfo set YImage='{img}' WHERE ProductID='{pID}'""".format(

img=img, pID=result[0])print(sql_1)

cur.execute(sql_1)

conn.commit()else:#sql_2 = """insert into ExtraBookInfo (ProductID,YImage) values( '{pID}','{img}')""".format(

#pID=result[0], img=tmp)

for img inimgSrc:

cur.execute('insert into ExtraBookInfo ProductID,YImage values(%s,%s)', (result[0], img))

conn.commit()

conn.close()defgetExtraBookProductIDList():

conn= pymssql.connect(server='****', user='User', password='****', database='*****',

charset='cp936')

cur=conn.cursor()

sql= 'select ProductID from ExtraBookInfo'cur.execute(sql)

productIdList=[]

row=cur.fetchone()whilerow:

productIdList.append(row[0])try:

row=cur.fetchone()exceptUnicodeDecodeError:continueconn.close()returnproductIdListdefgetImgSrc(result):for r inresult:

pattern_2= 'http.*?\.jpg'p2=re.findall(pattern_2, r)print(p2)returnp2

resultList=connectDB()

saveImg(resultList)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值