python 爬虫 --豆瓣出版社-写入Excel

import urllib.request
import re
import xlwt
data=urllib.request.urlopen("https://read.douban.com/provider/all").read().decode()
pat='<div class="name">[\u4e00-\u9fa5].*?</div>'
new_data=re.compile(pat).findall(data)
book=xlwt.Workbook(encoding="utf-8")
sht=book.add_sheet("publisher",cell_overwrite_ok=True)
pat1="<.*>(.*?)<.*>"
line=0
for d in new_data:
temp=re.compile(pat1).findall(d)
txt="".join(temp)
sht.write(line,0,line+1)
sht.write(line,1,txt)
line=line+1
book.save("d:\data.xls")

 

转载于:https://www.cnblogs.com/xiesongyou/p/7849599.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值