一.问题:
url中常常会有类似于%E4%B8%87%E8%BF的格式存在,这是对于中文做了url编码的原因
二.python的url解码:
- python2中:
import urllib
urllib.unquote(url)
- python3中:
import urllib.parse
urllib.parse.unquote(url)
三.python的url编码:
要对含有中文的url做编码,python中可以使用urlencode和quote方法,区别是urlencode是对字典编码(做get请求拼接参数时候可以用到),quote是对单个字符串编码
- python2中:
import urllib
urllib.urlencode()
- python3中:
import urllib.parse
#urllib.parse.urlencode()方法
data={"name":"王逆战","age":"/","addr":"abcdef"}
print(urllib.parse.urlencode(data))
#如果对单个字符串编码
print(urllib.parse.quote("hahaha你好啊!"))
输出格式为:
hahaha%E4%BD%A0%E5%A5%BD%E5%95%8A%EF%BC%81