url地址中文解码乱码
1.问题描述:
![url中文乱码](https://i-blog.csdnimg.cn/blog_migrate/045488ed958efb0f89795a9285d56369.png)
2.问题原因:
urllib.parse.unquote默认为’utf8’编码格式,而文中url格式为’gbk’,故而解析不成功
3.解决方法:
在urllib.parse.unquote函数中增加解码格式参数如下所示
import urllib.parse
url = 'https://tieba.baidu.com/f?kw=%D3%A2%D0%DB%C1%AA%C3%CB&fr=ala0&tpl=5'
data = urllib.parse.unquote(url, 'gbk'