文件的类型
- 文件其实有两种类型:文本类型文件(存储字符,可以有各种编码)和二进制类型文件(非仅储存字符)。举个例子,一般文本文件中的每个字节存储的是’a’,‘1’,‘W’’'等这些可见字符,以及如果使用utf8编码的话,会有utf8格式编码的字符,比如“中国”等,但是这些编码是有规律可循的,每个字节不是可以存储-128~127所有类型的,具体参考维基。而二进制文件就不同了,你通过vim打开一个可执行文件看看,经常是"^ A ^ G"的类型,这里他的编码是按照脱字符表示法表示的,很多文本中不存在的字符它也存在。
C++编程注意的点
- 如果你要初始化这样的一个string:"\x01\x00"“end”,这样初始化是不对的:
string sss("\x01\x00""end");
,这样初始化才对:
string sss(2,'0');
sss[0] = '\x01';
sss[1] = '\x00';
sss += "end";
这是因为string类型是以char*数组为基础的,它最后会以\x00结束,如果你中间有\x00,那就提前结束了,然后你再将sss存入文件就可以全部存进去了。同样的道理,fprintf函数中输出也会出现这种问题,c_str()函数经常输出不全,遇到\x00就会停止,需要注意一下。