计算机文件基本上分为二种:二进制文件和 ASCII(也称纯文本文件)
文本文件是可以看到的字符, 二进制文件是不可视字符,如图片.
二进制文件: 包含在 ASCII及扩展 ASCII 字符中编写的数据或程序指令的文件。计算机文件基本上分为二种:二进制文件和 ASCII(也称纯文本文件),图形文件及文字处理程序等计算机程序都属于二进制文件。这些文件含有特殊的格式及计算机代码。ASCII 则是可以用任何文字处理程序阅读的简单文本文件。
由于很难严格区分文本文件和二进制文件的概念,所以我们可以简单地认为,如果一个文件专门用于存储文本字符的数据,没有包含字符以外的其他数据,我们就称之为文本文件,除此之外的文件就是二进制文件。
1之所以要区分两种文件模式,是忽悠初学计算机的人.
比如一篇文章,如果用中文写的,你一看就懂,你就可以蛋疼的定义它为文本模式
与之对应,同样内容,你用英文写的或者甲骨文写的,你就可以定义为二进制模式
新华字典你姑且可以定义为"记事本",用对应看这篇文章,就是OK的
如果你用新华字典来尝试看英文写的文章,你就可以称呼它为乱码.
2.二种打开方式稍有区别,就是换行代码0D0A表示,文本认为它就是一个字符,二进制认位是2个字符
你就知道文本有多蛋疼了.
4.你把文本文件看成二进制文件的一种,就可以理解了,世界上本就没有所谓文本,都是吃多了撑出来的.
无论是文本文件,还是unicode 和ascii 的编码,这些都是文件的解释方式。
举个例子,文件里有个单词"apple",那么现在要求用中文模式打开,那么就会显示“苹果”,但是对于的文件内容来说,它还是apple,并没有变,只是解释方式变了。
好,来回答lz的问题:
1、为什么用fopen打开文件要分二制度和文本文件模式?
这是两种解释方式
2、二种打开方式在实现上有什么区别吗?
与其说打开方式,不如说是文件内容的解释方式。
二进制就是以字节来读取写入,没有任何的附加动作。
文本方式对回车和换行符进行了处理.
大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。
简单来说,文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。从上面可以看出文本文件基本上是定长编码的(也有非定长的编码如UTF-8),基于字符嘛,每个字符在具体编码中是固定的,ASCII码是8个比特的编码,UNICODE一般占16个比特。而二进制文件可看成是变长编码的,因为是值编码嘛,多少个比特代表一个值,完全由你决定。
===========================================================================================================================================================================================================================================================================
二进制文件和ASCII文件有何区别
2014年06月09日 17:31:47 迂者-贺利坚 阅读数:25955更多
个人分类: C++
所属专栏: C++课堂在线
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sxhelijian/article/details/29594687
二进制文件和ASCII文件(即文本文件)的区别,对于和计算机亲近时间尚短的同学是个难题。本文用简单的例子,试图展示其中的道道,希望能对菜鸟们有些帮助。
1、一个例子:两种100000
有程序:
-
#include<iostream>
-
using namespace std;
-
int main( )
-
{
-
char c[8]="100000";
-
int n=100000;
-
cout<<"c="<<c<<endl;
-
cout<<"n="<<n<<endl;
-
return 0;
-
}
运行结果:
c=100000
n=100000
c和n的输出看起来是一样的,那两者真的一样吗?
显然不是一回事。
有图为证。下面是在CodeBlock中单步执行上面的程序时,跟踪c和n的值看到的情形。
(注:要将待观察的数据以二进制形式显示出来,方法见本文附注部分。)
字符串的c占用了8个字节,保存的是:1个'1'(ASCII码为49,二进制110001)、5个'0'(ASCII码为48,二进制110000),最后2个字节为'\0'(ASCII码为0)
而整型的n,用4个字节(可以将图中二进制1 1000 0110 1010 0000转成十进制,正好100000。本来4字节32位,前面的0省略了。)
重点品味一下n。n在内存中用4字节表示,那样一种形式,对掌握计算机内部机制的人不是回事,但对和计算机尚做不到十分亲近的人而言,32位的数据就是#@!#!@#...。当程序中用cout<<n的方式显示n值时,给出的是100000。可敬的cout!
实际上,cout输出过程中,计算机已经给我们做了转换:将n的二进制内部表示,转换成了人乐于看到的字符形式。
2、将n保存到ASCII文件什么样
-
#include<fstream>
-
using namespace std;
-
int main( )
-
{
-
int n=100000;
-
ofstream out("a.dat",ios::out);
-
out<<n<<endl;
-
return 0;
-
}
运行这一段程序,是将n输出到ASCII文件a.dat中。
文件可以用记事本打开,如图:
显然,ASCII文件中表示n时,也是“看起来”的样子,而不是n在内存里的实际表示形式
3、将n保存到二进制文件什么样
-
#include<fstream>
-
using namespace std;
-
int main( )
-
{
-
int n=100000;
-
ofstream out("b.dat",ios::out|ios::binary);
-
out.write((char*)&n, sizeof(n));
-
return 0;
-
}
运行这一段程序,是用对二进制文件写入的方式,将n输出到文件b.dat中。
用记事本打开b.dat文件,如图:
纳尼?这是个神马字?你会念吗?开什么玩笑!
找一个查看二进制文件的软件(我用BinaryViewer),看到的b.txt如下:
文件为4字节大。按高位优先的原则(将图中显示的4个字节由后往前取出来),里面保存的数的十六进制形式是:0x000186A0,展开成二进制形式,自然是1 1000 0110 1010 0000,这恰是十进制数100000在内存中的形式。至于为何显示的是那么一个怪字,需要了解汉字编码的知识,参见《 用C++程序理解汉字的机内码表示》(跳转之前,先将本文读完)。
用BinaryViewer也看一下a.txt——前文中另一个也是保存100000的文件,只不过,是ASCII文件。查看结果是:
文件共有8字节,前面的6个字节,保存的是:1个'1'(ASCII码为49,十六进制31)、5个'0'(ASCII码为48,十六进制30)。
由此可以看出二进制文件和ASCII文件的区别:前者,用和内存中一样的方式保存数据;而后者,用和cout显示一样的方式保存,存的是人“看起来”的那个样子。
不方便人看的二进制文件实际上效率更高,用途更广,初学编程的童鞋,不要错过学会它的机会。
附注:用下面的方法将待观察的数据以二进制形式显示出来
在待观察的变量上击鼠标右键,选“Properties”,如下图
在“Format”部分,如下图选择“Binary”后,点击“OK”。
================= 迂者 贺利坚 CSDN博客专栏================= |== IT学子成长指导专栏 专栏文章的分类目录(不定期更新) ==| |== C++ 课堂在线专栏 贺利坚课程教学链接(分课程年级) ==| |== 我写的书——《逆袭大学——传给IT学子的正能量》 ==| ===== 为IT菜鸟起飞铺跑道,和学生一起享受快乐和激情的大学 ===== |