从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件两种。
ASCII文件也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的ASCII码。例如,数5678的存储形式为:
ASC码: 00110101 00110110 00110111 00111000
↓ ↓ ↓ ↓
十进制码: 5 6 7 8 共占用4个字节。ASCII码文件可在屏幕上按字符显示, 例如源程序文件就是ASCII文件,用DOS命令TYPE可显示文件的内容。 由于是按字符显示,因此能读懂文件内容。
二进制文件是按二进制的编码方式来存放文件的。 例如, 数5678的存储形式为: 00010110 00101110只占二个字节。二进制文件虽然也可在屏幕上显示, 但其内容无法读懂。C系统在处理这些文件时,并不区分类型,都看成是字符流,按字节进行处理。 输入输出字符流的开始和结束只由程序控制而不受物理符号(如回车符)的控制。 因此也把这种文件称作“流式文件”。
一个文件可以以文本模式或二进制模式打开,这两种的区别是:在文本模式中回车被当成一个字符'\n',而二进制模式认为它是两个字符0x0D,0x0A(ps:不知道是不是说反了,好像是);如果在文件中读到0x1B,文本模式会认为这是文件结束符,也就是二进制模型不会对文件进行处理,而文本方式会按一定的方式对数据作相应的转换。
补充:
C的文本方读写与二进制读写的差别仅仅体现在回车换行符的处理上.文本方式写时,每遇到一个''\n''(0AH换行符),它将其换成''\r\n''(0D0AH,回车换行),然后再写入文件;当文本读取时,它每遇到一个''\r\n''将其反变化为''\n'',然后送到读缓冲区.正因为文本方式有''\n''--''\r\n''之间的转换,其存在转换耗时.二进制读写时,其不存在任何转换,直接将写缓冲区中数据写入文件.
所以上面ps那里,应该确实是写反了。
昨天在看一篇文章的时候,突然想起了这个基础性的问题,自己一直对它的区别不是很清楚,于是今天上午研究下了,分享下自己的理解。(对它很清楚的同学们可以略过此篇文章)
从存储方式来说,文件在磁盘上的存储方式都是二进制形式,所以,文本文件其实也应该算二进制文件。那么他们的区别呢,各自的优缺点呢?不急,我慢慢道来。先从他们的区别来说,虽然都是二进制文件,但是二进制代表的意思不一样。打个比方,一个人,我们可以叫他的大名,可以叫他的小名,但其实都是代表这个人。二进制读写是将内存里面的数据直接读写入文本中,而文本呢,则是将数据先转换成了字符串,再写入到文本中。下面我用个例子来说明。
我们定义了一个结构体,表示一个学生信息,我们打算把学生的信息分别用二进制和文本的方式写入到文件中。
{
int num;
char name[ 20 ];
float score;
};
void write_to_binary_file()
{
struct Student stdu;
stdu.num = 111 ;
sprintf_s(stdu.name, 20 , " %s " , " shine " );
stdu.score = 80.0f ;
fstream binary_file( " test1.dat " ,ios:: out | ios::binary | ios::app); // 此处省略文件是否打开失败的判断
binary_file.write(( char * ) & stdu, sizeof ( struct Student)); // 二进制写入的方式
binary_file.close();
}
// 文本格式写入
void write_to_text_file()
{
struct Student stdu;
stdu.num = 111 ;
sprintf_s(stdu.name, 20 , " %s " , " shine " );
stdu.score = 80.0f ;
FILE * fp = fopen( " test2.dat " , " a+ " ); // 此处省略文件是否打开失败的判断
fprintf(fp, " %d%s%f " ,stdu.num,stdu.name,stdu.score); // 将数据转换成字符串(字符串的格式可以自己定义)
fclose(fp);
}
// MAIN函数调用前面两个方法
int _tmain( int argc, _TCHAR * argv[])
{
write_to_binary_file();
write_to_text_file();
return 0 ;
}
![](https://i-blog.csdnimg.cn/blog_migrate/68f15abcc1ee18b784c34c8526694488.jpeg)
文本文件
![](https://i-blog.csdnimg.cn/blog_migrate/dd4e39218108df9d730500e84c49a27b.jpeg)
2进制文件里面将111编码成6F,1个字节,这刚好是111的16进制表示,而文本文件中则写成31,31,31用了3个字节,表示111。73 68 69 6E 65 表示shine,之后2进制文件里是几个连续的FE,而文本文件中是38 30......文本文件将浮点数80.000000用了38(表示8) 30(表示0) 2E(表示.) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0) 30(表示0),二进制文件用了4个字节表示浮点数00 00 A0 42
通过这里我们可以初见端倪了,二进制将数据在内存中的样子原封不动的搬到文件中,文本格式则是将每一个数据转换成字符写入到文件中,他们在大小上,布局上都有着区别。由此可以看出,2进制文件可以从读出来直接用,但是文本文件还多一个“翻译”的过程,