文件的扩展名
尤其是windows环境下,常有误解:文件名决定了它的类型。
其实文件名与人的名字一样,叫张富贵不一定是有钱人。扩展名为 txt 的也可能本来是一幅图片(我一哥们常把他的电影文件改扩展名为txt)。
当然,扩展名是大家暗暗约定的风俗,最好要入乡随俗。
文件内容有文本和二进制之分?
这个也不十分了然。
文件在存储上,就是一些1011010010…的信息,怎么好说是什么类型呢?比如,你把一个mp3文件删去一半,再后边粘上一首古诗上去,机器也不至于爆炸吧?这个文件又算哪种类型呢?
类型只是一种观点
文件所谓的类型只是我们在处理它时所持有的一种观点,并不等价于这个文件的本质特征。
换句话说,同样一个文件,我们可以在 open 它的时候用文本的观点,也可以用二进制的观点。
所谓的文本观点,就是行的观点。
即:认为文件的内容是一行行的信息构成的。
那么,核心问题出现了:在10101001010…的洪流中,怎样去识别到哪里算是一行呢?
历史留下的大坑
如果全世界统一认为,0x0a (即二进制的00001010)就是标准的行间分隔符,遇到它就表示上一行结束了,那么生活会非常的美好。
可惜实际情况却混乱得多。windows上用了两个连续的字符0x0d0a,苹果系统上用了0x0d,linux上用了0x0a。
这里,0x0d 就是’\r’,0x0a就是’\n’&#