Python读写Unicode文件

最新推荐文章于 2024-08-07 22:32:38 发布

pkrobbie

最新推荐文章于 2024-08-07 22:32:38 发布

阅读量1.1w

点赞数

文章标签： python encoding byte file

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pkrobbie/article/details/1451437

版权

Python核心库的open函数是按照ascii设计的。但是，现在我们越来越多地要面对Unicode文件。好在python提供了codecs模块，帮我们解决了这个问题。使用中有一些需要注意的问题。

codecs模块的open定义如下

open( filename, mode[, encoding[, errors[, buffering]]])

Open an encoded file using the given mode and return a wrapped version providing transparent encoding/decoding.

其中前两个参数filename和mode和默认的open相同。第三个参数encoding是关键，制定了文件的编码方式。

对于常用的Unicode有这几种utf_16、utf_16_le、utf_16_be、utf_8，每一种还有一些可用的别名，具体可以查找python manual。

utf_16、utf_16_le、utf_16_be参数的区别是这样的。

如果指定了utf_16，python会检查文件的BOM（Byte Order Mark）来判断，文件类型到底是utf_16_le、utf_16_be。对于没有BOM的文件会报错。

如果我们直接指定了utf_16_le、utf_16_be，python就不检查BOM了。对于没有BOM的文件很好用。但是，对于有BOM的文件就要注意，它会把BOM当作第一个字符读入。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pkrobbie CSDN认证博客专家 CSDN认证企业博客

码龄19年

87: 原创

7万+: 周排名

6万+: 总排名

36万+: 访问

: 等级

4605: 积分

108: 粉丝

88: 获赞

58: 评论

178: 收藏

私信

关注

热门文章

分类专栏

.Net 5篇
C/C++ 23篇
Database 13篇
Healthcare 9篇
Office 2篇
Others 26篇
Python 8篇
Web 3篇
Image processing 9篇
deeplearning 1篇

最新评论

dcmtk 3.6 网络性能优化
Gyw_: 好帖子
vtk表面提取参数研究
lordn_buaa: 请问PointLocator的作用是是什么呢？我加了之后模型提取的速度大幅降低，并且模型质量也没有什么提升
windows 10安装gitlab docker
weixin_42175698: 笔记：3.配置https中的ii：要设置通用的信息，您可以在命令中使用默认值或者使用相同的值来填充所有的信息。下面是一个示例命令，使用相同的值填充所有信息： shell Copy openssl req -new -key /etc/gitlab/ssl/192.168.149.129.key -out /etc/gitlab/ssl/192.168.149.129.csr -subj "/C=US/ST=State/L=City/O=Organization/OU=Company/CN=192.168.149.129/emailAddress=admin@example.com" 上述命令中的"/C=US/ST=State/L=City/O=Organization/OU=Company/CN=192.168.149.129/emailAddress=admin@example.com"部分是指定的主题（Subject），其中的值被设置为通用的信息。
windows 10安装gitlab docker
weixin_42175698: 笔记：3. 配置https中的 e. 复制证书到gitlab目录： cp /etc/gitlab/ssl/etc/gitlab/ssl/192.168.149.129.crt /etc/gitlab/trusted-certs/ 多复制了/etc/gitlab/ssl
windows 10安装gitlab docker
DruidTing: 寫得非常詳細!!

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。