爬虫请求模块(1)

最新推荐文章于 2024-06-21 14:01:06 发布

weixin_53607808

最新推荐文章于 2024-06-21 14:01:06 发布

阅读量1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53607808/article/details/116376983

版权

urllib

urllib的特点：

较老的爬虫项目用的四urllib
做爬虫是需要requests+urllib一起使用
python内置模块
urllib在某些方面较强

urllib.request用法

创建请求对象urllib.request.Request()构建user-agent
发起请求获取对象urllib.request.urlopen()
读取响应对象的内容read().decode('utf-8')（bytes ➡ str）

urllib爬取贴吧指定主题及页面练习(get方式)

先分析各页面之间的规律，去掉无关代码，并验证，得到统一的网址格式，发现页数不同就是pn的值不同，规律为(页数-1)*50

https://tieba.baidu.com/f?ie=utf-8&kw=%E5%AD%A6%E7%94%9F&fr=search

https://tieba.baidu.com/f?kw=%E5%AD%A6%E7%94%9F&

最低0.47元/天解锁文章

weixin_53607808

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫请求模块(1)

urllib有的较老的爬虫项目用的是urllib 做爬虫时需要requests+urllib共同使用
复制链接

扫一扫

weixin_53607808

博客等级

码龄4年

6
原创

1
点赞

1
收藏

0
粉丝

关注

私信

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。