爬取豆瓣出版商名称,并存储在本地文件中。
import urllib.request
data=urllib.request.urlopen('https://read.douban.com/provider/all').read()
data=data.decode('utf-8')
import re
pat='<div class="name">(.*?)</div>'
a=re.compile(pat).findall(data)
print(a)
file=open('D:/1python/爬虫.txt','w')
for i in range(0,len(a)):
file.write(a[i]+'\n')
file.close()
——来自韦玮老师课堂