之前练习truncate时,一直报错。想不通缘由。
f = open('./a.txt','r+',encoding='utf-8')
a = f.read()
f.seek(0,0)
f.truncate(5)
b = f.read()
print(b)
#a.txt内容:我就试一下我就是文档
Traceback (most recent call last):
File "D:\py\project\文件操作与模块\文件\文件的定位读取.py", line 41, in <module>
b = f.read()
File "D:\py\python\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 3-4: unexpected end of data
百度之后还是没有答案,只是试了一下此博客的代码段能正常运行:
python中的truncate()方法_yandajiangjun的博客-CSDN博客_python truncate
然后才想起来在UTF-8编码中:一个中文等于三个字节,中文标点占三个字节。 一个英文字符等于一个字节,英文标点占一个字节。
而truncate的size对应的是字节而不是字符,在中文文档中跳转非3的倍数字节相当于一个中文的一部分,自然会报错。
f = open('./a.txt','r+',encoding='utf-8')
a = f.read()
f.seek(0,0)
f.truncate(3)
b = f.read()
print(b)
所以注意打开中文文档时跳转字节数能够对应上字符就可以了。