对with语句进行学习时出现了错误
1、错误代码
with open(r"a.txt",'r') as f:
strline=f.readline()
#此结构保证能够完整读取文件直到结束
while strline:
print(strline)
strline=f.readline
报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa0 in position 26: illegal multibyte sequence
即:UnoUeUdebug错误:“GBK”编解码器不能解码位置26中的字节0xa0,非法多字节
解码的时候读取文件和编辑器所用的编码导致的(在此我读的文档为UTF-8,注意:pycharm为GBK)
解决:with open(r"tec.txt",'r',encoding='UTF-8') as f:
或with open(r"tec.txt",'rb') as f:
以下为某度的
UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码
GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。这一版的GBK规范为1.0版。