UnicodeDecodeError: 'utf-8' codec can't decode byte

最新推荐文章于 2024-07-25 18:00:29 发布

灰暗角落里的琴

最新推荐文章于 2024-07-25 18:00:29 发布

阅读量2.3k

点赞数

分类专栏： python 文章标签： python decode

本文链接：https://blog.csdn.net/u012329294/article/details/80457359

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

UnicodeDecodeError: 'utf-8' codec can't decode byte 报错。

原因：爬取的网站编码和decode默认的utf8编码不同，例如：gbk

解决办法：

1、忽略掉utf8编码

def parse(self, response):

    print(response.body.decode("utf8", "ignore"))
    return

但这样做的结果是网站中的代码都是乱码

2、从meta 中提取charset，然后根据charset类型写对应的解析编码方式

例如：一个网站的metah如下：

则代码可以先从meta中提取出charset，然后再解析，如下（这里只用content判断应该还不够，只能满足一般情况）：

charset = re.findall('content="text/html; charset=(.*?)"',
                     response.body.decode('utf8','ignore'))
print(charset)
if charset:
    print(response.body.decode(charset[0]))
else:
    print(response.body.decode())

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

灰暗角落里的琴

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

爬虫编码UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb1 in position 78: invalid start byte解决方案

weixin_43178406的博客

05-10

8万+

本文主要介绍了爬虫编码UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb1 in position 78: invalid start byte解决方案，希望能对学习python的同学们有所帮助。文章目录 1. 问题描述 2. 解决方案

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc1 in position 41694: invalid start byte解决方案

weixin_43178406的博客

03-31

1万+

本文主要介绍了UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc1 in position 41694: invalid start byte解决方案，希望能对学习Python的同学有所帮助。文章目录 1. 问题描述 2. 解决方案

参与评论您还未登录，请先登录后发表或查看评论

python编码问题 utf-8 codec can not decode byte

a563562675的博客

05-28

5284

问题描述在用python读txt文件的时候遇到了编码问题：‘utf-8’ codec can’t decode byte 0xb70，同样的代码之前在python2的时候是不会出现问题的。用百度找了一下也没能找到有效的解决方法，后来在stackoverflow上找到了类似的问题。 stackoverflow问题解决方案 str = unicode(str, errors='replace') or str = unicode(str, errors='ignore') 这个操作会删除（忽略）有问题的

UnicodeDecodeError: 'utf-8' codec can't decode byte..问题

b13766339702的博客

02-24

2269

解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题问题描述：问题分析：该情况是由于出现了无法进行转换的二进制数据造成的，可以写一个小的脚本来判断下，是整体的字符集参数选择上出现了问题，还是出现了部分的无法转换的二进制块：问题解决法一：将gbk编码数据decode('gbk')...

【BUG】已解决：UnicodeDecodeError: ‘utf-8’ codec can’t decode bytes in position 10

最新发布

m0_73367097的博客

07-25

697

UnicodeDecodeError: ‘utf-8’ codec can’t decode bytes in position 10

decode(charset,‘ignore’) 解决 ‘utf-8‘ codec can‘t decode byte 0xa4 问题

bigcarp的专栏

08-20

1497

在这个信息万变、知识膨胀的时代，一个人不可能面面具到，我们必须要明确自己的方向，不断学习、锻炼和累积经验。这个社会的各个领域相互交错，相互渗透，但我们不能面面具到，所以我们需要有敏锐的触觉，摄取最有价值的信息，计算机应用技术是非常有价值的技术，十分有用的工具，IT支撑在管理上应用得当可以大大提高效率，学多一点IT技术绝对有百利而无一害，但我们的时间和精力有限，我们要分清主次，抓住重点。我现在要花多

anaconda更新后navigator打不开：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position

qq_40296501的博客

10-21

1372

anaconda更新后navigator打不开：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position

yolo-deepsort工程转换yolo.h5报错：UnicodeDecodeError: 'utf-8' codec can't decode byte

qq_35630339的博客

03-10

581

首先放上大佬的代码： https://github.com/Qidian213/deep_sort_yolov3 最近在Python3.5环境下运行上述工程中的convert.py进行模型转换时报错： UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xf4 in position 12: invalid continuation byte ...

basemap readshapefile UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0-附件资源

03-05

basemap readshapefile UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0-附件资源

Python3, pyinstaller: UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 解决方法

PianGe_zyl的博客

02-07

4409

python==3.7 在使用pyinstaller打包程序的时候报了这个错： File "D:\Python_Anaconda\lib\site-packages\PyInstaller\hooks\hook-zmq.py", line 20, in <module> hiddenimports = ['zmq.utils.garbage'] + collect_submodules('zmq.backend') File "D:\Python_Anaconda\lib\sit

anaconda下载后自带的spyder报UnicodeDecodeError

qq_52231465的博客

05-10

720

想尝试使用Jupyter Notebook和spyder来写一些python代码，发现spyder报错以上就是今天要讲的内容，本文主要解决anaconda自带的spyder不能打开的问题。

Python 运行报错 UnicodeDecodeError 解决方法

Killer015的博客

04-19

1962

Python 运行报错 UnicodeDecodeError 解决方法

已解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 1022-1023: unexpected end of dat

热门推荐

努力让自己发光，对的人才能迎着光而来

03-28

2万+

已解决使用pycharm run运行代码正常，而debug却抛出异常UnicodeDecodeError: ‘utf-8’ codec can’t decode bytes in position 1022-1023: unexpected end of data，附上三种的正确解决方法，亲测有效！！！

python keras 加载.h5模型出现错误

sophina_f的博客

09-09

4451

OSError: Unable to open file (Truncated file: eof = 26583040, sblock->base_addr = 0, stored_eoa = 672267176) 错误描述：情况说明：我自己网上下载好别人训练好的网络，保存模式是.h5格式，模型用tensorflow，keras训练的，我在重新加载模型并用自己的数据图像进行实验的时候，在keras加载model的时候报错，网上方法尝试：下载的模型不完整，解决方法：重新下载模型，并且下载前

python3中UnicodeDecodeError 'utf8' codec can't decode问题的解决以及数据流加压缩问题

weixin_40321125的博客

10-15

3558

python3中UnicodeDecodeError: ‘utf8’ codec can’t decode问题的解决以及数据流加压缩问题 import urllib from urllib import request import gzip 首先，来看一个无法成功的请求 url = "http://www.baidu.com" headers = {"User-Agent":"Mozilla/...

python安装包时提示UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3

weixin_49379854的博客

10-21

5620

编码错误提示UnicodeDecodeError: ‘utf-8’ codec，一般一看就时编码错误，网上很多大神都已经有了问题的可能性和对应解决方法，比如命令提示符的编码问题，用户目录的路径中存在中文字符。命令提示符编码问题：直接输入命令”chcp“查看自己的编码格式，比如我的就是GBK 命令窗口里面右键点击”属性“，”选项“也可以查看你当前的编码格式 ”chcp 65001“命令可以改命令提示符的编码，这里的65001表示的就是UTF-8，其他的编码有需要的可以百度一哈（这种方式只是临时改编码

本地编码：PG_GBK, 导入文件编码：PG_UTF8错误解决

weixin_44705301的博客

07-28

6761

DM管理工具导入dmp文件出现编码错误

unicodedecodeerror: utf-8 codec can t decode byte 0xca in position 13: invalid continuation byte

06-18

当您遇到`UnicodeDecodeError: utf-8 codec can't decode byte 0xca in position 13: invalid continuation byte`这个错误时，这意味着您正在尝试使用UTF-8编码解析一个文本文件，但在某个位置遇到了不符合UTF-8编码...