使用url解码时,出现一部分内容失去。
def unescape(string):
string = urllib.parse.unquote(string)
quoted = html.unescape(string).encode(sys.getfilesystemencoding()).decode('utf-8')
#转成中文
return re.sub(r'%u([a-fA-F0-9]{4}|[a-fA-F0-9]{2})', lambda m: chr(int(m.group(1), 16)), quoted)
解决办法:去掉%0D
t= response.text
t= t.replace('%0D','')