python3中的urlopen对于中文url是如何处理的？

最新推荐文章于 2021-03-29 20:33:44 发布

SayLove丶

最新推荐文章于 2021-03-29 20:33:44 发布

阅读量734

点赞数

分类专栏： python3 文章标签：学习 python

python3 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

刚刚看了urllib.parse.quote()的定义，完全可以直接处理中英混排的url，无需单独处理中文再拼接。具体方法：

# -*- coding:utf-8 -*-

from urllib.parse import quote


url = 'http://www.example.com/api.php?text=中文在这里'

# 不带附加参数
print('\n不带附加参数：\n%s' % quote(url))

# 附带不转换字符参数
print('\n附加不转换字符参数：\n%s' % quote(url, safe='/:?='))

作者：知乎用户
链接：https://www.zhihu.com/question/22899135/answer/119088406
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

运行结果：

不带附加参数：

http%3A//www.example.com/api.php%3Ftext%3D%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附加不转换字符参数：

http://www.example.com/api.php?text=%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

quote可用的参数如下：

quote(string, safe='/', encoding=None, errors=None)

其中的safe参数可用的范围：

reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

最简单的处理方式：

首先，url中的中文要单独处理，不能中英文全部合在一起处理（因为一部分的特殊字符也会被处理掉）。其次。在python3.0+中，已经不支持之前的urllib.quote了，而是需要urllib.parse.quote(str)

一种可行的方案
import urllib
s=‘中文’

s=urllib.parse.quote(s)

url='some english url character %s'%(s)

urllib.request.urlopen(url)

作者：孙晓飞
链接：https://www.zhihu.com/question/22899135/answer/23746054
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

SayLove丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录