Python处理Windows记事本utf8编码文件要注意的坑

封面图片:《Python程序设计基础(第2版)》,ISBN:9787302490562,董付国,清华大学出版社

图书详情:

配套资源:用书教师可以免费获取教学大纲、教案、课件、源码、习题答案、课堂管理与考试系统。

中国大学MOOC:

https://www.icourse163.org/learn/enroll/CCEC-1449771164

智慧树网慕课:

https://coursehome.zhihuishu.com/courseHome/2071947

===============

Python相关课程教材选用参考与建议

董付国老师Python在线课程资源使用方法

===============

感谢西北师大文玉锋老师发现并提供这个有意思的问题。

以Win 10为例,假设当前文件夹中有个ANSI编码的文本文件data.txt,其中包含若干行文本,每行存放一个整数,例如:

编写程序读取其中的每行数字,加5之后输出,代码如下:

接下来,使用记事本打开文件data.txt,然后另存为UTF8编码格式,

然后修改代码,使用UTF8编码格式,代码出错,

根据异常信息可以发现,莫名其妙多出来一个字符,\ufeff,然而输出文件内容时却又没有这个符号,例如,

出现这个错误的原因在于,Windows系统的记事本程序转换为UTF8时,会在文件头增加BOM(Byte Order Mark),也就是标志位\ufeff,这个符号使用print()输出时不可见,使用repr()函数转换一下,

Windows记事本转换为UTF8编码时加BOM本身并没有对与错,但是没有明确说明就不合适了,还是notepad++人性化一些,明确对不带BOM的utf8和带BOM的utf8做了区分,例如,

不管怎么样,明白了原因之后,处理就容易了,可以手动删除这个符号,

或者,改用utf-8-sig编码格式来读取内容,

温馨提示

关注本公众号“Python小屋”,通过菜单“最新资源”==>“历史文章”可以快速查看分专题的1000篇技术文章列表(可根据关键字在页面上搜索感兴趣的文章),通过“最新资源”==>“微课专区”可以免费观看500节Python微课,通过“最新资源”==>“培训动态”可以查看近期Python培训安排,通过“最新资源”==>“教学资源”可以查看Python教学资源。

---董付国老师Python系列图书---

友情提示:不建议购买太多,最好先通过京东、当当、天猫查阅图书了解目录和侧重点,然后再选择购买适合自己的书。

(1)《Python程序设计(第2版)》(ISBN:978-7-302-43651-5),清华大学出版社,2016年8月出版,2019年度清华大学出版社畅销图书

(2)《Python可以这样学》(ISBN:978-7-302-45646-9),清华大学出版社,2017年2月

(3)《Python程序设计基础(第2版)》(ISBN:978-7-302-49056-2)清华大学出版社,2018年1月出版,2019年度清华大学出版社畅销图书

(4)《中学生可以这样学Python》(ISBN:978-7-302-48039-6)清华大学出版社

(5)《Python程序设计开发宝典》(ISBN:978-7-302-47210-0)清华大学出版社,2018年10月

(6)《玩转Python轻松过二级》(ISBN:978-7-302-49916-9)清华大学出版社,2018年5月

(7)《Python程序设计基础与应用》(ISBN:978-7-111-60617-8),机械工业出版社,2018年9月

(8)《Python程序设计实验指导书》(ISBN:9787302525790),清华大学出版社,2019年4月

(9)《Python编程基础与案例集锦(中学版)》(ISBN:978-7-121-35539-4),电子工业出版社,2019年4月

(10)《大数据的Python基础》(ISBN:978-7-111-62455-4),机械工业出版社,预计2019年5月出版

(11)译作《Python程序设计》,机械工业出版社(华章),2018年11月出版

(12)繁体版《Python也可以这样学》,台湾博硕文化股份有限公司,2017年10月出版,本书为《Python可以这样学》在台湾发行的繁体版,两本书内容一样,不建议重复购买。

(13)《Python程序设计实例教程》(ISBN:978-7-111-63198-9),机械工业出版社

(14)《Python数据分析、挖掘与可视化》(ISBN:978-7-115-52361-7),人民邮电出版社,2019年12月

Python相关课程教材选用参考与建议

董付国老师Python在线课程资源使用方法

董付国老师6本Python教材PDF版免费阅读

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值