【python实例】爬虫中HTML与中文的相互转化

最新推荐文章于 2021-06-04 18:14:39 发布

努力学python的设计师

最新推荐文章于 2021-06-04 18:14:39 发布

阅读量898

点赞数

分类专栏： python学习心得 python练习

本文链接：https://blog.csdn.net/aa12551827/article/details/109134698

版权

python学习心得同时被 2 个专栏收录

34 篇文章 1 订阅

订阅专栏

python练习

19 篇文章 0 订阅

订阅专栏

我们在输入关键词进行爬取时，如果输入的是英文或者数字，通常都没有什么问题，但如果输入的是中文，因为编码的问题，通常会出现无法解码的错误。比如

我们的关键词输入的是“风险”，但实际显示是KW后面的代码确实%B7%E7%CF%D5，所以如果我们想要进行中文的搜索，就需要对中文进行转换，通常需要用到urllib模块
代码如下：

import urllib.parse
#Html代码中文转代码，和代码转中文

ss1 ='%B7%E7%CF%D5'
print(urllib.parse.unquote(ss1, encoding='gbk')) #输出结果为‘风险’

ss2 ='风险'
print(urllib.parse.quote(ss2,encoding='gbk'))  #输出结果为%B7%E7%CF%D5

需要注意的是，导入的是urllib.parse，而不是urllib

努力学python的设计师

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【python实例】爬虫中HTML与中文的相互转化

我们在输入关键词进行爬取时，如果输入的是英文或者数字，通常都没有什么问题，但如果输入的是中文，因为编码的问题，通常会出现无法解码的错误。比如我们的关键词输入的是“风险”，但实际显示是KW后面的代码确实%B7%E7%CF%D5，所以如果我们想要进行中文的搜索，就需要对中文进行转换，通常需要用到urllib模块代码如下：import urllib.parse#Html代码中文转代码，和代码转中文ss1 ='%B7%E7%CF%D5'print(urllib.parse.unquote(ss1,
复制链接

扫一扫