python处理URL带中文无法通过ascii 编码问题 -《狗嗨默示录》-

因为url中含有中文调试了一中午,饭都忘吃了,最后终于知道怎么处理URL带中文无法通过ascii 编码的情况了。

通过了解urllib.parse.quote(),发现它完全可以直接处理中英混排的URL。

 

import urllib.parse

 

url = 'http://www.example.com/api.php?text=中文'

# 不带附加参数 print('\n不带附加参数:\n%s' % quote(url))

# 附带不转换字符参数 print('\n附加不转换字符参数:\n%s' % quote(url, safe='/:?='))

运行结果:

不带附加参数:

http%3A//www.example.com/api.php%3Ftext%3D%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附加不转换字符参数:

http://www.example.com/api.php?text=%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附:
quote可用的参数如下:

quote(string, safe='/', encoding=None, errors=None)

其中的safe参数可用的范围:

reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

通过设置合适的参数即可对爬取来的混合中文的URL进行直接处理了。

转载于:https://www.cnblogs.com/LiGoHi/p/7286556.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值