关于网址中字符的解码学习分享及提问

两个桃核

已于 2022-11-17 15:27:51 修改

阅读量1.3k

点赞数

文章标签： python

于 2022-11-09 13:06:40 首次发布

本文链接：https://blog.csdn.net/qq_42894279/article/details/127767824

版权

1，先看下面一段网址，这种情况是包含字母、特殊字符 str=’%257B%2522request%255Fid%2522%253A%2522166780646916782395369211%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D’

25,7B,22,5F都是十六进制，%25表示%,7B表示{
用re.sub把所有的%25替换为\x。
	str2=re.sub('%25',r'\\x',str)
	print(str2)
这里我试验了，不行，有个难题，无法替换为‘\x’，能替换为‘\x7b’等
如图1
如果能替换就简单了。应该写法有问题， 应该怎么写print(str2)直接
显示解码结果 
结果应该是这样：
{"":"","":".."}

2，下面这一串表示的全是中文，三个为一组表示一个中文字符，utf-8表示中文字符要用三个字节
str=’%E4%BA%8C%E5%8F%89%E6%8E%92%E5%BA%8F%E6%A0%91’

用re.sub()把所有%替换为\x转换后，类型为字符串：
	str2=re.sub('%25',r'\\x',str)
这里我试验了，不行，如果能替换就简单了。应该写法有问题，不知道怎么写
替换结果：
	\xE4\xBA\x8C\xE5\x8F\x89\xE6\x8E\x92\xE5\xBA\x8F\xE6\xA0\x91
用.decode('utf-8')方法解码为中文b_data.decode('utf-8')
结果应该为：
二叉排序树

两个桃核

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于网址中字符的解码学习分享及提问

1，先看下面一段网址，这种情况是包含字母、特殊字符str=’%257B%2522request%255Fid%2522%253A%2522166780646916782395369211%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D’#25,7B,22,5F都是十六进制，%25表示%,7B表示{#用re.sub把所有的%25替换为\x。这里我试验了，不行，如果能替换就简单了。应该写法有问题，不知道怎么写str2=re.sub(’%
复制链接

扫一扫