爬虫入门：第一个小项目爬取豆瓣官网的出版社名称

最新推荐文章于 2024-07-18 15:53:23 发布

xiaofu_小鹏儿

最新推荐文章于 2024-07-18 15:53:23 发布

阅读量137

点赞数

分类专栏： 1 文章标签： python

本文链接：https://blog.csdn.net/weixin_43109714/article/details/107358313

版权

1 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

爬虫入门：第一个小项目爬取豆瓣官网的出版社名称

from urllib.request import urlopen, Request
import re
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
url="https://read.douban.com/provider/all"
ret = Request(url, headers=headers)
res = urlopen(ret)
aa = res.read().decode('utf-8')
pat='<div class="name">(.*?)</div>'
rst=re.compile(pat).findall(aa)
for i in rst:
    print(i)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiaofu_小鹏儿

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
爬虫入门：第一个小项目爬取豆瓣官网的出版社名称

**爬虫入门：第一个小项目爬取豆瓣官网的出版社名称**from urllib.request import urlopen, Requestimport reimport sslssl._create_default_https_context = ssl._create_unverified_contextheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,
复制链接

扫一扫