python解码gbk_Python的url编码问题(ansi,utf8,gbk) | C/C++程序员之家

Python的url编码问题(ansi,utf8,gbk)。

urllib包提供了对url的编码和解码,示例如下:

>>> import urllib

>>> data = '杭州'

>>> print data

杭州

>>> data

'\xe6\x9d\xad\xe5\xb7\x9e'

>>> urllib.quote(data)

'%E6%9D%AD%E5%B7%9E'

>>> urllib.unquote('%E6%9D%AD%E5%B7%9E')

'\xe6\x9d\xad\xe5\xb7\x9e'

>>> print urllib.unquote('%E6%9D%AD%E5%B7%9E')

“丽江”单词,细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk(部分叫ANSI,导致C/C++程序员之家走了很多弯路,不过现在百度已经支持UTF8了),其他的一般网站比如google就是utf8的,示例如下:

>>> import sys,urllib

>>> s = '杭州'

>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))

%BA%BC%D6%DD

>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))

'%E6%9D%AD%E5%B7%9E'

参考资料:互联网等

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值