python中requests库中文乱码问题

最新推荐文章于 2024-09-27 10:11:28 发布

weixin_30343157

最新推荐文章于 2024-09-27 10:11:28 发布

阅读量104

点赞数 1

文章标签： python

原文链接：http://www.cnblogs.com/nul1/p/9232484.html

版权

当使用这个库的时候经常会出现各种乱码的情况。

首先要知道：

text返回的是处理过的unicode的数据。

content返回的是bytes的原始数据

也就是说r.content比r.text更加节省资源

如果headers没有charset字符集的化,text()会调用chardet来计算字符集，这又是消耗cpu的事情

倘若在conttent-type字段中没有制定charset的时候，默认使用的是ISO-8859-1编码，在处理英文的时候是没有问题，但是在处理中文的时候就会出现乱码的情况了。

解决

如果在确定使用text，并已经得知该站的字符集编码时，可以使用 r.encoding = ‘xxx’ 模式，当你指定编码后，requests在text时会根据你设定的字符集编码进行转换.

使用apprent_encoding可以获得真实编码

1 >>> import requests
2 >>> respone = requests.get("http://www.baidu.com/")
3 >>> respone.apparent_encoding
4 'utf-8'

转载于:https://www.cnblogs.com/nul1/p/9232484.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30343157

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

爬虫 - Request模块 - 模拟请求获取数据

LIN的博客

01-22

4790

目录一、Request简单介绍 1-1 支持请求API 二、请求获取数据总结 2-0 request方法 2-1 GET 请求 - 直接获取页面信息 2-2 POST 请求 - 发送数据用于请求 2-2-1 POST请求模拟登陆 - github测试，手动处理cookie信息 2-2-1 POST请求模拟登陆 - github测试，requests.session()处理cook...

解决Python发送Http请求时,中文乱码的问题

09-16

在Python中使用`requests`库发送HTTP请求时，如果请求参数或URL中含有中文字符，那么这些中文字符在传输过程中可能会被错误地编码，导致接收方解析时出现乱码。例如，在构造URL时直接使用未编码的中文字符作为参数值...

参与评论您还未登录，请先登录后发表或查看评论

关于python使用requests库，中文乱码对问题

qq_40677222的博客

11-15

335

今天使用python的requests库，爬取百度首页，中午的时候还能正常显示中文，但是到下午的时候就乱码了。真心有点懵逼，好了看代码。 import requests url = “http://www.baidu.com” r = requests.get(url) print(r.text) 无中文显示！修改最后一行代码为： print(r.content.decode(“utf-8”)...

解决Python库Requests中文乱码

LU_ZHAO的博客

03-14

660

当使用Python库requests进行网络请求的时候： r = requests.get(url) 1 使用 r.text返回的是Unicode型的数据。 r.content返回的是bytes型的数据。如果你想取文本，使用r.text。如果想取图片，文件，则可以通过r.content。 2 Requests库的自身编码为: r.encoding = ‘ISO-8859-1’ 修改编码： r...

raise_for_status()方法 / response.apparent_encoding

sometime here

03-24

3098

raise_for_status()方法理解Response类非常重要，Response这样的一个对象返回了所有的网页内容，那么它也提供了一个方法，叫raise_for_status()，这个方法是专门与异常打交道的方法，该方法有这样一个有趣的功能，它能够判断返回的Response类型状态是不是200。如果是200，他将表示返回的内容是正确的，如果不是200，他就会产生一个HttpError的异...

Python Requests模块中文乱码问题

GXSmile的博客

02-25

447

这时我们可以使用res.content转换为二进制类型,然后使用str方法转换为uft-8编码。在使用requests模块时,会遇到返回的信息为中文乱码的问题。

python—requests【中文乱码】纠正

weixin_46403572的博客

12-19

746

对大量网站爬取中文时编码格式不同一,

Python requests 中文乱码问题解决方案

weixin_42927927的博客

03-22

7363

方案一：requests请求成功时，设置它的编码注：前提是知道它的编码，一般通过鼠标右键网页就可以查看网页原代码方案二：利用apparent_encoding 注：apparent_encoding本质上是requests本身对网页源码的猜测，如果猜不到，会返回None 方案三：先解成二进制，之后再转成想要的编码方式方案四：修改headers里的Accept-Encoding参数，如下： ...

Python 使用requests中文乱码问题

qq_43654142的博客

05-23

2601

一、首先我们要知道的一个知识点：《HTTP权威指南》里第16章国际化里提到，如果HTTP响应中Content-Type字段没有指定charset，则默认页面是’ISO-8859-1’编码。这处理英文页面当然没有问题，但是中文页面，就会有乱码了！ import requests # req = requests.get("http://www2.nkfust.edu.tw") req = reque...

python中requests爬去网页内容出现乱码问题解决方法介绍

12-25

最近在学习python爬虫，使用requests的时候遇到了不少的问题，比如说在requests中如何使用cookies进行登录验证，这可以查看这篇文章。这篇博客要解决的问题是如何避免在使用requests的时候出现乱码。 import ...

解决python3中的requests解析中文页面出现乱码问题

09-19

在Python 3中，使用requests库进行HTTP请求时，可能会遇到中文页面乱码的问题。这是因为requests库在处理HTTP响应时，默认会尝试猜测响应内容的字符编码（通过`response.encoding`属性），但这种猜测并不总是准确，...

简单题101. 对称二叉树（python）20240922

Sep21m_wyy的博客

09-22

387

【代码】简单题101. 对称二叉树（python）20240922。

第二百五十四节 JPA教程 - JPA 多对多映射示例

最新发布

2301_78772942的博客

09-27

454

第二百五十四节 JPA教程 - JPA 多对多映射示例

python 实现harmonic series调和级数算法

luthane的博客

09-24

883

Hn∑k1n1kHnk1∑nk1其中，𝑛n 是正整数。这个级数是由调和数列（Harmonic sequence）的各元素相加所得的和。调和级数的名字源于泛音及泛音列，即一条振动的弦的泛音的波长依次是基本波长的121314213141等。调和级数的性质发散性：调和级数是一个发散的无穷级数，也就是说，它的部分和随着项数的增加而无限增长。

ubuntu安装libtorch

meng_152634的博客

09-25

693

nouveau是由第三方为NVIDIA显卡开发的一个开源3D驱动，ubuntu默认集成了nouveau驱动，安装NVIDIA驱动前必须禁用系统自带的显卡驱动nouveau，否则安装NVIDIA驱动时会报错。，一定要确定好安装的CUDA版本是否支持显卡的算力，否则安装成功也无法使用GPU加速。如果cmake版本低于3.18，会出现下面的报错，这是由于低于3.18的cmake不支持CUDA17的编译，需要更新cmake版本。因为安装的CUDA版本为12.1，这里选择最新版的CUDNN 9.4.0进行安装。

Python 类class的用法详解

十七次方

09-22

809

在 Python 中，使用 class 关键字来定义一个类。类定义通常包括类变量、实例变量和方法。

Python 高阶内容：套娃式装饰器巧妙为函数增加功能

敲代码别忘了喝上一杯凉白开。

09-23

560

装饰器是 Python 中一种非常强大且灵活的工具，能够在不修改函数本身的情况下，为函数增加额外的功能。本文介绍了装饰器的基本概念及应用，通过实例演示如何在函数执行前后添加额外操作，如鉴权、数据验证等，类似“套娃”般层层嵌套。文章还通过代码示例展示了如何定义和使用装饰器，以及如何将装饰器与实际业务逻辑结合，实现灵活的功能扩展。这种设计模式不仅可以提升代码的可读性和可维护性，还可以有效减少代码的冗余。掌握装饰器的用法，将为你的 Python 编程技巧增添更多亮点。

python requests 中文乱码

09-19

python中使用requests库发送HTTP请求时，可能会遇到中文乱码的问题。中文乱码的出现原因一般是因为编码方式不匹配导致的。解决这个问题的方法有以下几种： 1. 使用response.content.decode()方法指定正确的编码方式...