爬虫时经常想实现在网址加入搜索名字,但是部分网站直接输入汉字会乱码。
此时可以考虑用转码方式处理后再放入网址中。
import urllib
seachname = '杀玛特'
urllib.parse.quote(seachname.encode('gbk'))
返回值:
‘%C9%B1%C2%ED%CC%D8’
爬虫时经常想实现在网址加入搜索名字,但是部分网站直接输入汉字会乱码。
此时可以考虑用转码方式处理后再放入网址中。
import urllib
seachname = '杀玛特'
urllib.parse.quote(seachname.encode('gbk'))
返回值:
‘%C9%B1%C2%ED%CC%D8’