url %E4%BD%A0%E5%A5%BD 编码问题

url链接粘贴下来后通常会出现类似%E4%BD%A0%E5%A5%BD的编码,一般来说一个中文字对应三个%编码的是utf-8, 一个中文字对应两个%编码的是GB2312。

还可以在http://tool.chinaz.com/tools/urlencode.aspx 这个网站上进行解码测试。在这里%E4%BD%A0%E5%A5%BD是utf-8 你好 的意思。

  • decode 的作用是将其他编码的字符串转换成 Unicode 编码
  • encode 的作用是将Unicode编码转换成其他编码的字符串

在python里对url 的utf-8编码进行str.decode(‘utf-8’)是不起作用的,但urllib库里面有个urlencode函数,可以把key-value这样的键值对转换成url格式,返回的是a=1&b=2这样的字符串

urllib另外对字符串还单独提供 quote()函数 和 unquote()函数

  • quote()把字符串进行urlencode转换
import urllib

print urllib.quote("你好")

#%E4%BD%A0%E5%A5%BD
  • unquote()对urlencode后的字符串进行解码
import urllib

print urllib.unquote("%E4%BD%A0%E5%A5%BD")

#你好

参考:http://blog.csdn.net/haoni123321/article/details/15814111/

  • 11
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值