为什么python打开文件时有文本和二进制的说法

文件的扩展名

尤其是windows环境下,常有误解:文件名决定了它的类型。
其实文件名与人的名字一样,叫张富贵不一定是有钱人。扩展名为 txt 的也可能本来是一幅图片(我一哥们常把他的电影文件改扩展名为txt)。
当然,扩展名是大家暗暗约定的风俗,最好要入乡随俗。

文件内容有文本和二进制之分?

这个也不十分了然。
文件在存储上,就是一些1011010010…的信息,怎么好说是什么类型呢?比如,你把一个mp3文件删去一半,再后边粘上一首古诗上去,机器也不至于爆炸吧?这个文件又算哪种类型呢?

类型只是一种观点

文件所谓的类型只是我们在处理它时所持有的一种观点,并不等价于这个文件的本质特征。
换句话说,同样一个文件,我们可以在 open 它的时候用文本的观点,也可以用二进制的观点。
所谓的文本观点,就是行的观点。
即:认为文件的内容是一行行的信息构成的。
那么,核心问题出现了:在10101001010…的洪流中,怎样去识别到哪里算是一行呢?

历史留下的大坑

如果全世界统一认为,0x0a (即二进制的00001010)就是标准的行间分隔符,遇到它就表示上一行结束了,那么生活会非常的美好。
可惜实际情况却混乱得多。windows上用了两个连续的字符0x0d0a,苹果系统上用了0x0d,linux上用了0x0a。
这里,0x0d 就是’\r’,0x0a就是’\n’&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值