Python爬虫笔记——Url解码时,如何将汉字转化为以 %开头的 gb2312 编码 和 将以%号开头的编码转化为汉字 的示例

参考的链接:
Url解码时,如何将汉字转化为以 %开头的 gb2312 编码
Python标准库urllib中parse.quote()
Python之quote()使用
python之urlencode(),quote()及unquote()

将汉字转化为以 %开头的 gb2312 编码
我的代码如下:将以%号开头的编码转化为汉字
(python3)

import urllib.parse

city_li = ['北京','上海']
citys = []
for city in city_li:
	city = city.encode('gb2312')
	city = urllib.parse.quote(city)
	citys.append(city)
print(citys[0],citys[1])

key = '格力塔扇'
keywords = key.encode('gb2312') #如果编码格式为utf-8,那么这一步可以省略
keywords = urllib.parse.quote(keywords)
print(keywords)

wine = '法国红酒'
wine = urllib.parse.quote(wine)  #默认编码格式为utf-8
print(wine)

打印结果:

%B1%B1%BE%A9 %C9%CF%BA%A3
%B8%F1%C1%A6%CB%FE%C9%C8
%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92

将以%号开头的gb2312编码转化为汉字
我的代码如下:

import urllib.parse
#urllib.parse.unquote(string,encoding ='utf-8',errors ='replace')

key = '%B8%F1%C1%A6%CB%FE%C9%C8'  #此编码格式为gb2312
key = urllib.parse.unquote(key,encoding='gb2312') #urllib.parse.unquote()的默认编码格式为‘utf-8’
print(key)

name = '%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92'  #此编码格式为utf-8
name = urllib.parse.unquote(name)
print(name)

打印结果:

格力塔扇
法国红酒
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值