c# 接收网络汉字乱码_Python爬虫的一次提问，引发的“乱码”问题

最新推荐文章于 2021-02-02 21:38:52 发布

VIP文章 weixin_39568653

最新推荐文章于 2021-02-02 21:38:52 发布

阅读量123

点赞数

文章标签： c# 接收网络汉字乱码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39568653/article/details/112515350

版权

一、乱码问题的出现

就以爬取51job网站举例，讲讲为何会出现“乱码”问题，如何解决它以及其背后的机制。

代码示例：

import requestsurl = "http://search.51job.com"res = requests.get(url)print(res.text)

显示结果：

打印res.text时，发现了什么？中文乱码！！！不过发现，网页的字符集类型采用的gbk编码格式。

我们知道Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 r.text 之时，Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码，并且能够使用r.encoding 属性来改变它。

接下来，我们一起通过resquests的一些用法，来看看Requests 会基于 HTTP 头部对响应的编码方式。

print(res.encodi

最低0.47元/天解锁文章

weixin_39568653

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
c# 接收网络汉字乱码_Python爬虫的一次提问，引发的“乱码”问题

一、乱码问题的出现就以爬取51job网站举例，讲讲为何会出现“乱码”问题，如何解决它以及其背后的机制。代码示例：import requestsurl = "http://search.51job.com"res = requests.get(url)print(res.text)显示结果：打印res.text时，发现了什么？中文乱码！！！不过发现，网页的字符集类型采用的gbk编码格式。我们知道Re...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。