python爬虫系列(1.1-urllib中常用方法的介绍)

最新推荐文章于 2024-07-12 16:16:27 发布

weixin_34355881

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量90

点赞数

文章标签： python 爬虫

原文链接：https://juejin.im/post/5be3e92a6fb9a049e65fbbdb

版权

一、关于urllib中常用方法的介绍

1、urlopen网络请求

urlopen方法是网络请求的方法,默认是get请求,如果传递了data是post请求
1. from urllib import request
3. if __name__ == "__main__":
4. response = request.urlopen('http://www.baidu.com')
5. print(response.read())
2、urlretrieve下载文件
1. from urllib import request
3. if __name__ == "__main__":
4. # 下载整个网页
5. request.urlretrieve('http://www.baidu.com', 'baidu.html')
6. # 下载图片
7. request.urlretrieve('http://www.baidu.com/img/bd_logo1.png', 'baidu.png')

二、关于编码的处理

1、urlencode将字典类型数据转换为parsed模式
1. from urllib import parse
3. if __name__ == "__main__":
4. dict1 = {
5. "name": "hello",
6. "age": "20",
7. "gender": "man"
8. }
9. re = parse.urlencode(dict1)
10. print(re) # name=hello&age=20&gender=man
2、parse_qs和parse_qsl反序列化
```
复制代码
```
1. from urllib import parse
3. if __name__ == "__main__":
4. dict1 = {
5. "name": "hello",
6. "age": "20",
7. "gender": "man"
8. }
9. re = parse.urlencode(dict1)
10. print(re)
11. print(parse.parse_qs(re))

三、切割url的方法

1、urlsplit和urlparse方法
```
复制代码
```
1. from urllib import request, parse
3. if __name__ == "__main__":
4. url = 'http://www.baidu.com?name=hello&age=20'
5. print(parse.urlsplit(url))
6. print(parse.urlparse(url))
8. # 输出
9. # SplitResult(scheme='http', netloc='www.baidu.com', path='', query='name=hello&age=20', fragment='')
10. # ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='name=hello&age=20', fragment='')

转载于:https://juejin.im/post/5be3e92a6fb9a049e65fbbdb

weixin_34355881

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫系列(1.1-urllib中常用方法的介绍)

一、关于urllib中常用方法的介绍1、urlopen网络请求urlopen方法是网络请求的方法,默认是get请求,如果传递了data是post请求from urllib import requestif __name__ == "__main__":response = request.urlopen('http://www.baidu.com')print(response.read())2...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。