python爬虫库——urllib常用函数

最新推荐文章于 2024-07-26 10:45:15 发布

guanxxx

最新推荐文章于 2024-07-26 10:45:15 发布

阅读量411

点赞数 11

文章标签：爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guanxxx/article/details/138419885

版权

URL拆分与合并

urllib.parse.urlparse(url='') # 将URL解析为六部分：<scheme>://<netloc>/<path>;<params>?<query>#<fragment>
urllib.parse.urlparse(url='', scheme='') # 设置URL协议
urllib.parse.urlparse(url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’、‘params’或‘query’的一部分
urllib.parse.urlunparse(components=('scheme', 'netloc', 'path', 'params', 'query', 'fragment')) # 使用六部分信息构造URL
urllib.parse.urlsplit(url='') # 将URL解析为五部分：<scheme>://<netloc>/<path>?<query>#<fragment>
urllib.parse.urlsplit(url='', scheme='') # 设置URL协议
urllib.parse.urlsplit(url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’或‘query’的一部分
urllib.parse.urlunsplit(components=('scheme', 'netloc', 'path', 'query', 'fragment')) # 使用五部分信息构造URL
urllib.parse.urljoin(base='', url='') # 将‘base_url’解析为四部分：<scheme>://<netloc>/<path>#<fragment>，使用‘scheme’、‘netloc’、‘path’三部分内容，对新URL缺失部分进行补充
urllib.parse.urljoin(base='', url='', allow_fragments=False) # 将‘fragment’部分解析为‘path’的一部分

字典和URL参数转换

urllib.parse.urlencode(query={}) # 将字典转换为GET请求参数‘query’
urllib.parse.parse_qs(qs='query, str') # 将GET请求参数‘query’转换为字典
urllib.parse.parse_qsl(qs='query, str') # 将GET请求参数‘query’转换为由元组组成的列表

文本和URL编码转换

urllib.parse.quote(string='') # 将中文字符转换为URL编码格式
urllib.parse.unquote(string='') # 将URL编码格式解码为中文字符

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python爬虫库——urllib常用函数

urllib.parse.urljoin(base='', url='') # 将‘base_url’解析为四部分：<scheme>://<netloc>/<path>#<fragment>，使用‘scheme’、‘netloc’、‘path’三部分内容，对新URL缺失部分进行补充。urllib.parse.urlunparse(components=('scheme', 'netloc', 'path', 'params', 'query', 'fragment')) # 使用六部分信息构造URL。
复制链接

扫一扫

guanxxx CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

16万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

529: 积分

216: 粉丝

346: 获赞

14: 评论

108: 收藏

私信

关注

热门文章

最新评论

python 全局变量、局部变量、自由变量的使用
CSDN-Ada助手: 恭喜作者发布了新的博客文章！标题看起来很有趣，对于Python中全局变量、局部变量和自由变量的理解肯定有所帮助。希望作者可以继续保持创作的热情，探索更多有趣的主题。建议下一篇文章可以深入探讨Python中的装饰器或者生成器等高级主题，期待您的精彩内容！
python使用列表推导式（列表解析）及生成器表达式构建列表/序列
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
python使用列表推导式（列表解析）及生成器表达式构建列表/序列
CSDN-Ada助手: 恭喜您写了第11篇博客！标题看起来很有趣，列表推导式和生成器表达式在Python中确实很强大。希望您能继续保持创作的激情，不断提升自己的技术水平。下一步可以尝试深入探讨一些高级的Python编程技巧，比如装饰器、上下文管理器等，相信会给读者带来更多启发和收获。期待您的下一篇博客！
python使用列表推导式（列表解析）及生成器表达式构建列表/序列
CSDN-Ada助手: 恭喜您第11篇博客的发布！看到您分享关于Python使用列表推导式和生成器表达式构建列表/序列的内容，让我收获颇丰。希望您能继续保持创作的热情，探索更多有趣的主题，或许可以尝试分享一些实际应用案例，让读者更好地理解如何运用这些技巧。期待您的下一篇作品！
正则表达式
CSDN-Ada助手: 恭喜您发布了关于正则表达式的博客！持续创作非常了不起。接下来，您可以考虑拓展一些实际应用场景，比如在编程中如何利用正则表达式提高效率，或者分享一些常见的正则表达式错误和解决方法。期待看到更多精彩的内容，加油！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。