1,先看下面一段网址,这种情况是包含字母、特殊字符 str=’%257B%2522request%255Fid%2522%253A%2522166780646916782395369211%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D’
25,7B,22,5F都是十六进制,%25表示%,7B表示{
用re.sub把所有的%25替换为\x。
str2=re.sub('%25',r'\\x',str)
print(str2)
这里我试验了,不行,有个难题,无法替换为‘\x’,能替换为‘\x7b’等
如图1
如果能替换就简单了。应该写法有问题, 应该怎么写print(str2)直接
显示解码结果
结果应该是这样:
{"":"","":".."}
2,下面这一串表示的全是中文,三个为一组表示一个中文字符,utf-8表示中文字符要用三个字节
str=’%E4%BA%8C%E5%8F%89%E6%8E%92%E5%BA%8F%E6%A0%91’
用re.sub()把所有%替换为\x转换后,类型为字符串:
str2=re.sub('%25',r'\\x',str)
这里我试验了,不行,如果能替换就简单了。应该写法有问题,不知道怎么写
替换结果:
\xE4\xBA\x8C\xE5\x8F\x89\xE6\x8E\x92\xE5\xBA\x8F\xE6\xA0\x91
用.decode('utf-8')方法解码为中文b_data.decode('utf-8')
结果应该为:
二叉排序树