Python urlencode 编码和url拼接

本文介绍了Python中urlencode函数的使用,包括如何处理字典参数,以及在模拟请求Google和百度时,由于不同站点的编码差异(Google使用UTF-8,百度使用GB2312)导致的编码转换问题。通过示例展示了如何使用urllib库进行URL编码和解码,确保中文参数在URL中的正确传递。
摘要由CSDN通过智能技术生成

转自:
https://www.weidianyuedu.com/
urlencode 调用方法
urlencode的参数必须是Dictionary

import urllib
d = {‘name1’:‘www.pythontab.com’,‘name2’:‘bbs.pythontab.com’}
print urllib.urlencode(d)
输出:

name2=bbs.pythontab.com&name1=www.pythontab.com
相当于拼接两个url参数,这个用法类似于PHP中的http_build_query(),这里就不多数PHP中怎么用了,有兴趣的自己去查一下。

urlencode 编码
函数urlencode不会改变传入参数的原始编码,也就是说需要在调用之前将post或get参数的编码调整好。

问题:现在模拟请求Google和baidu,由于baidu使用的是gb2312编码,google使用的是utf8编码,两个站点提交到URL中的中文参数的urlencode值是不一样,下面以”PythonTab中文网”为例:

coding: UTF-8

str = u’PythonTab中文网’
str = str.encode(‘gb2312’)
d = {‘name’:str}
q = urllib.urlencode(d)
print q
结果:

name=PythonTab%D6%D0%CE%C4%CD%F8
注意:urlencode的参数必须是Dictionary

其他用法
django中urlencode类似,方法如下:

from django.utils.http import urlquote
a = urlquote(‘PythonTab中文网’)
print a
得到汉字的GBK编码

urllib 转换字符串
其实可以用urllib的quote函数对URL中的中文进行转换,将中文转换成GBK的编码,得到的编码是符合URI标准的URL。

import urllib
a = “PythonTab中文网”
a
‘PythonTab\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x91’
urllib.quote(a)
'PythonTab%E4%B8%AD%E6%96%87%E7%BD%91

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值