UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa9 in position 0: invalid start byte

最新推荐文章于 2023-12-04 19:50:15 发布

Poor_Getsby

最新推荐文章于 2023-12-04 19:50:15 发布

阅读量2.4k

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a1208896581/article/details/106043298

版权

python 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

问题描述

在我进行seek()的练习使用时出现如题所示的报错

f = open('myfile.txt', 'r', encoding='utf-8')
f.seek(8)
print(f.readline())
print(f.readline())

文件内容如下

摄氏温度的转换问题
一二三
三二一

问题解决

将seek()中的偏移量参数改为3，6，9等3的倍数时，余下字符串正常输出，无报错

如图

seek的使用1
seek的使用2
seek的使用3

相关知识及思路

起初我查找网上教程，以为是编码格式设置问题，但是将编码格式指定后，错误依然存在，于是查找了seek的相关说明：¹

概述
seek()方法用于移动文件读取指针到指定位置。

语法 seek() 方法语法如下：

fileObject.seek(offset[, whence])
参数
offset – 开始的偏移量，也就是代表需要移动偏移的字节数

whence：可选，默认值为 0。给offset参数一个定义，表示要从哪个位置开始偏移；0代表从文件开头开始算起，1代表从当前位置开始算起，2代表从文件末尾算起。

再次查找utf-8相关知识，发现关于汉字的解释²：

其他基本多文种平面（BMP）中的字符（这包含了大部分常用字，如大部分的汉字）使用三个字节编码（Unicode范围由U+0800至U+FFFF）。

于是猜测是因为seek的偏移量（起初取为8）使得文件读取指针到了一个并不是单个汉字编码结束的地方（即不是三的整数倍），所以剩下的编码并不能按照三字节、三字节、三字节地解读为正确的字符（此处为汉字），故而报错，遂有了题中以3，6，9为偏移量的试探，经验证，结论正确。

至于查到的特别注明以gbk编码读取而成功解决的案例，那可能文件本身就是以gbk编码写入的，总之，什么形式的编码，就以什么编码形式读取，搞好对应之后，也并不一定不出错。

而gbk编码中单个汉字所占字节数，那又是另一个故事了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa9 in position 0: invalid start byte

问题描述在我进行seek()的练习使用时出现如题所示的报错f = open('myfile.txt', 'r', encoding='utf-8')f.seek(8)print(f.readline())print(f.readline())文件内容如下摄氏温度的转换问题一二三三二一问题解决将seek()中的偏移量参数改为3，6，9等3的倍数时，余下字符串正常输出，无报错如图相关知识及思路起初我查找网上教程，以为是编码格式设置问题，但是将编码格式指定后，错误依然存在，
复制链接

扫一扫

专栏目录

Poor_Getsby CSDN认证博客专家 CSDN认证企业博客

码龄9年

10: 原创

106万+: 周排名

155万+: 总排名

4万+: 访问

: 等级

258: 积分

5: 粉丝

15: 获赞

8: 评论

74: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Renpy】renpy游戏引擎制作的游戏拆包及汉化教程
tine307: 您好，我在执行命令的时候完报错，报错信息如下： Traceback (most recent call last): File "D:\Program Files\python3.7\lib\runpy.py", line 193, in _run_module_as_main "__main__", mod_spec) File "D:\Program Files\python3.7\lib\runpy.py", line 85, in _run_code exec(code, run_globals) File "D:\Program Files\python3.7\Scripts\unrpa.exe\__main__.py", line 7, in <module> File "D:\Program Files\python3.7\lib\site-packages\unrpa\__main__.py", line 189, in main extractor.extract_files() File "D:\Program Files\python3.7\lib\site-packages\unrpa\__init__.py", line 123, in extract_files index = self.get_index(archive, version) File "D:\Program Files\python3.7\lib\site-packages\unrpa\__init__.py", line 214, in get_index offset, key = version.find_offset_and_key(archive) File "D:\Program Files\python3.7\lib\site-packages\unrpa\versions\official_rpa.py", line 36, in find_offset_and_key offset = int(parts[1], 16) ValueError: invalid literal for int() with base 16: b'00000000<h(n'
Python脚本运行出现语法错误：IndentationError: unindent does not match any outer indentation level
ctotalk: 挺好
【Python】我搞我自己——自己的浏览器历史记录分析
落雪wink: 这是一篇不错的文章，有用，谢谢分享！
【Python】我搞我自己——自己的浏览器历史记录分析
落雪wink: 给大佬点赞，向大佬学习！
【Python】我搞我自己——自己的浏览器历史记录分析
普通网友: 刚入行，特别需要这样的文章滋养，强烈推荐！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。