python读写txt报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x81 in position 5: illega

lingboboo

于 2021-11-21 10:31:00 发布

阅读量1.3k

点赞数

文章标签： python

本文链接：https://blog.csdn.net/bigdataZLB/article/details/121450279

版权

trick 专栏收录该内容

2 篇文章

订阅专栏

加上encoding="**"

with open(r'train.zh',encoding='UTF-8') as f:
    text=f.read()
new=text.split()
new=list(set(new))
#print(text.split())
with open("myvocab3.txt","w",encoding='UTF-8') as f2:
	for i in new:
		f2.write(i)
		f2.write('\n')
f.close()
f2.close()

读写txt

read() 一次性读全部内容,以字符串的形式返回结果

readline() 读取第一行内容,以字符串的形式返回结果

readlines() 读取文本所有内容，返回列表

读取文本所有内容，并且以数列的格式返回结果，一般配合for in使用
readlines会读到换行符，可用如下方法去除：

with open("test.txt", "r") as f:
    for line in f.readlines():
        line = line.strip('\n')  #去掉列表中每一个元素的换行符