爬虫案例——豆瓣出版商

Taozidede

于 2018-03-14 15:27:53 发布

阅读量301

点赞数

分类专栏： Python小tips 文章标签： python 爬虫豆瓣

本文链接：https://blog.csdn.net/Taozidede/article/details/79555348

版权

Python小tips 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

爬取豆瓣出版商名称，并存储在本地文件中。

import urllib.request
data=urllib.request.urlopen('https://read.douban.com/provider/all').read()
data=data.decode('utf-8')
import re
pat='<div class="name">(.*?)</div>'
a=re.compile(pat).findall(data)
print(a)
file=open('D:/1python/爬虫.txt','w')
for i in range(0,len(a)):
    file.write(a[i]+'\n')
file.close()

——来自韦玮老师课堂