在编写关键词查询排名的时候发现含有中文网址不能直接被抓取,需要对网址进行处理。具体处理方式如下:
Python3 中处理中文网址使用urllib.parse.quote函数
from urllib.parse import quote
import string
url = r'http://www.abc.com/?abc=中文'
url = quote(url, safe = string.printable) # safe表示可以忽略的字符
print(url)
输出结果:http://www.abc.com/?abc=%e4%b8%ad%e6%96%87