字符编码及文件读取的基础知识

最新推荐文章于 2022-02-09 15:34:06 发布

钱吉

最新推荐文章于 2022-02-09 15:34:06 发布

阅读量858

点赞数

分类专栏： windows c/c++ 文章标签：二进制 utf-8 标准

本文链接：https://blog.csdn.net/lovewubo/article/details/37939561

版权

c/c++ 同时被 2 个专栏收录

36 篇文章 1 订阅

订阅专栏

windows

7 篇文章 0 订阅

订阅专栏

这是以前写的一点笔记，把它转过来。

1、二进制文件和文本文件

首先看二段代码：生成一个二进制文件和一个文本文件。打开一个二进制文件：test.dat,写入整数1234，其对应的十六进制为04 D2。

    FILE *pfile;
    int ntest = 1234;
    if(NULL == (pfile=fopen("test.dat","wb")))
    {
        printf("can't write file:test.dat");
        return(1);
    }
    fwrite(&ntest,sizeof(int),1,pfile);
    fclose(pfile);

用ultraedit打开，可以看见：

然后：再次写一个文件：

    FILE *pfile;
    int ntest = 1234;
    if(NULL == (pfile=fopen("test.bin","w")))
    {
        printf("can't write file:test.dat");
        return(1);
    }
//fwrite(&ntest,sizeof(int),1,pfile);
    fputs("1234", pfile);
    fclose(pfile);

打开后显示：

　　世界上本没有文本文件，只说用的人多了才有了文本文件的概念。所有存储在计算机上的文件都是以二进制比特流的形式存在。有些比特流的特定多少位表示一个能可见的字符（比如说o1100101表示A），那么组成的文件就是通常所说的文本文件，除此之外的就是二进制文件了，二进制文件通常打开都是乱码，是因为你的工具（如记事本等）往往按照一个字节一个字节去读取二进制比特流，而有时候这个字节代表了一个不可见的字符，比如上面的D2。我们平时用的doc，bmp等文件都是二进制文件。

2、二进制文件和文本文件的打开方式

　　文本方式和二进制方式仅仅是一种方式，不是说文本方式用来打开文本文件，二进制方式打开二进制文件。这两种方式的惟一区别就是：当利用文本方式打开文件时，遇到回车换行就转换成’\n’（windows需要转换，而linux系统不需要，这是因为windows与linux表示换行的标识符不一样，前者是\r\n,而后者是\n,与c语言规定的是一样的，在linux下面这两种方式没有区别。而且转化的工作由编译器完成，操作系统只负责处理数据流），而二进制方式没有这种转换。文本文件里的每个字节数据(当然也是用二进制存储在计算机上)一般都表示一个ascii（这里暂时只说ansi文本格式，对于unicode则不同了，后面会讲到），而二进制文件里的每个字节数据可能表示一个ascii也可能不是，当在ascii表中可以找到对应的字符时，你用文本编辑器打开时就能看见对应的字符，如果找不到就是乱码。

fread和fwrite往往用于读取和写入二进制文件，当然也可以读取和写入文本文件；反之，fgets和fputs往往用于文本文件的读取和写入，当然也可以读取和写入二进制文件。一切取决于你写入的数据格式和对读取的内容做什么样的解析。计算机只负责和二进制数据打交道，它不管你的二进制数据表示什么。

    FILE *pfile;
    char buf[1024] = {'\0'};
    int nCount;
    if(NULL == (pfile=fopen("test.txt","r")))

    //if(NULL == (pfile=fopen("test.txt","rb")))
    {
        printf("can't write file:test.dat");
        return(1);
    }
    //fread(&ntest,sizeof(int),1,pfile);
    fgets(buf, 1024, pfile);
    //printf("%d\n",ntest);
    for (int na=0; na<1024 && buf[na]!=0; na++)
    {
        int ntemp = buf[na];
        ntemp &= 255;
        printf("%0.2x\n",ntemp);
    }
    fclose(pfile);