目录
此篇接着上篇(文件上篇)所以目录序号也跟着上篇了。
C语言进阶⑱(文件上篇)(动态通讯录写入文件)(文件指针+流的概念+八个输入输出函数)_GR C的博客-CSDN博客
基于上篇先插入一个笔试面试问到的问题(第4目录是文件的顺序读写)
4.9对比一组函数:
scanf / fscanf / sscanf
printf / fprintf / sprintf
5. 文件的随机读写
5.1 fseek文件指针定位函数
介绍:根据文件指针的位置和偏移量来定位指针。
参数:offset 是偏移量。
参数:origin 是起始位置,有三种选项:
① SEEK_CUR 当前文件指针的位置开始偏移。
② SEEK_END 文件的末尾位置开始偏移。
③ SEEK_SET 文件的起始位置开始偏移。
代码演示:手动创建一个文件,打开文件随便写点内容
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b
ch = fgetc(pf);
printf("%c\n", ch);//c
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
如果我想得到 a a b,该怎么做?可以试着使用 fseek 函数:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
// 调整文件指针
fseek(pf, -1, SEEK_CUR); // SEEK_CUR为当前文件指针位置,偏移量为-1,向前移动1个单位
ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
用 SEEK_SET ,打印 a d e:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
// 调整文件指针
fseek(pf, 3, SEEK_SET); // SEEK_SET为文件的起始位置,偏移量为3,向后移动3个单位
ch = fgetc(pf);
printf("%c\n", ch);//d
ch = fgetc(pf);
printf("%c\n", ch);//e
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
用 SEEK_END ,打印 a e f :
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
// 调整文件指针
fseek(pf, -2, SEEK_END); // SEEK_END为当前文件末尾位置,偏移量为-2,向前移动2个单位
ch = fgetc(pf); //如果写test6.txt时加了回车就会出错
printf("%c\n", ch);//e
ch = fgetc(pf);
printf("%c\n", ch);//f
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
5.2 ftell返回偏移量函数
在上边创建好test.txt后,代码演示:ftell 的使用方法
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 调整文件指针
fseek(pf, 5, SEEK_CUR); // SEEK_CUR为当前文件指针位置,偏移量为5,向后移动5个单位
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch); // f
// 返回偏移量
int ret = ftell(pf);
printf("%d\n", ret); // 6
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
5.3 rewind 文件指针回到起始位置函数
介绍:rewind(意为倒带(我受够了等待~你所谓的安排~),磁带倒带),
设置文件位置为给定流 stream 的文件的开头,
让文件指针回到起始位置。
代码演示:利用 rewind 函数让文件指针回到起始位置
#include <stdio.h>
int main()
{
FILE* pf = fopen("test6.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 调整文件指针
fseek(pf, 5, SEEK_CUR); // SEEK_CUR为当前文件指针位置,偏移量为5,向后移动5个单位
// 读取文件
int ch = fgetc(pf);
printf("%c\n", ch); // f
// 返回偏移量
int ret = ftell(pf);
printf("%d\n", ret); // 6
// 让文件指针回到起始位置
rewind(pf);
ch = fgetc(pf); //再读取一次
printf("%c\n", ch);//a
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
6. 文本文件和二进制文件
再上一节中,我们已经对文本文件和二进制文件开了个头,在这里将进行详细探讨。
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
6.1 文本文件
什么是文本文件?
如果要求在外存上以 ASCII 码的形式存储,则需要在存储之前进行转换。
以 ASCII 字符的形式存储的文件,就是文本文件。
6.2 二进制文件
什么是二进制文件?
数据在内存中以二进制的形式存储,如果不加以转换地输出到外存,就是二进制文件。
6.3 数据在文件中的存储方式
一个数据在文件中是如何存储的呢?
存储方式如下:
① 字符一律以 ASCII 形式存储。
② 数值型数据既可以用 ASCII 形式存储,也可以使用二进制形式存储。
举个简单的例子:比如整数10000,如果以 ASCII 码的形式形式输出到磁盘,
则磁盘中占用5个字节(每个字符占1个字节)。而如果以二进制的形式输出,
则在磁盘上只占4个字节。
测试代码:
#include <stdio.h>
int main()
{
int a = 10000;
FILE* pf = fopen("test6.txt", "wb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
// 写文件
fwrite(&a, sizeof(int), 1, pf); // 二进制的形式写到文件中
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
(代码成功运行后打卡文件就发现是乱码)
使用强大的VS来打开我们的二进制文件 test6.txt ,
详细步骤如下:
点击源文件添加现有项,选中刚才的二进制文件(test6.txt)
添加到VS后选择打开方式,向下拉,选择二进制编辑器打开:
最后,我们来检测一下 10000 是不是 10 27 00 00 :
10000的二进制:0000 0000 0000 0000 0010 0111 0001 0000
转化为十六进制(八位转两位):00 00 27 10
小端倒过来就是10 27 00 00
总结:文本文件和二进制文件的存储方式
① 文本文件:将内存里的数据转换成 ASCII 码值的形式存储到文件中。
② 二进制文件:将内存里的二进制数据不加任何转化直接存储到二进制文件中。
7. 文件读取结束的判定
读文件读到什么时候才算结束,是个非常值得我们探讨的问题。
7.1 被错误使用的feof
介绍:在文件结束时,判断文件因为何种原因导致文件结束的函数,判断是因为读取失败而结束,
还是因为遇到文件尾而结束。如果文件结束,则返回非0值,否则返回0。
错误用途:feof 函数是个经常被错误使用的一个函数。在文件读取过程中,不能用 feof 函数的返回值直接判断文件是否结束。
feof 不是用来判定文件是否结束了的,还是在文件已经结束时,判断是什么原因导致文件结束的。
正确用途:当文件读取结束时,判断是因为读取失败而结束,还是因为遇到文件尾而结束。
代码演示:feof 的用法:
#include <stdio.h>
#include <stdlib.h>
int main()
{
//注:先创建一个test7.txt写入一些单词
int ch = 0; // 注意:为int型而非char,要求处理EOF
FILE* pf = fopen("test7.txt", "r");
if (!pf)// pf == NULL
{
perror("fopen");
return EXIT_FAILURE; // 符号常量EXIT_FAILURE,表示没有成功地执行一个程序 就是return 1;
}
// fgetc - 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((ch = fgetc(pf)) != EOF)
{
putchar(ch);
}
printf("\n");
// 判断文件结束的原因
if (ferror(pf)) // ferror - 检查是否出现错误。
{
puts("读取失败错误(I/O error when reading)");
}
else if (feof(pf))
{
puts("遇到文件尾而结束(End of file reached successfully) ");
}
// 文件关闭
fclose(pf);
pf = NULL;
return 0;
}
7.2正确判定文件是否读取结束的方法
文本文件读取是否结束,判断返回值是否为 EOF(fgetc),或者 NULL(fgets),例如:
① fgetc 函数在读取结束时会返回 EOF,正常读取时,返回读取到的字符的 ASCII 码值。
② fgets 函数在读取结束时会返回 NULL,正常读取时,返回存放字符串的空间的起始地址。
③ fread 函数在读取结束时会返回 实际读取到的完整元素的个数,如果发现读取到的完整的元素个数小于指定的元素个数,那么就是最后一次读取了。
代码演示:在工程路径下手动创建一个叫 file.txt 的文件,在里面随便写几行文字。然后通过代码将 file.txt 文件拷贝一份,生成 file2.txt :
#include <stdio.h>
int main()
{
FILE* pfread = fopen("file.txt", "r");
if (pfread == NULL)
{
return 1;
}
FILE* pfwrite = fopen("file2.txt", "w");
if (pfwrite == NULL)
{
fclose(pfread);
pfread = NULL;
return 1;
}
// 文件打开成功,读写文件
int ch = 0;
// 读文件
ch = fgetc(pfread);
while ((ch = fgetc(pfread)) != EOF)
{
// 写文件
fputc(ch, pfwrite);
}
// 关闭文件
fclose(pfread);
pfread = NULL;
fclose(pfwrite);
pfwrite = NULL;
return 0;
}
代码演示:二进制读取的例子
#include <stdio.h>
enum
{
SIZE = 5
};
int main()
{
double a[SIZE] = { 1.,2.,3.,4.,5. };
FILE* fp = fopen("test.bin", "wb"); // 必须用二进制模式
fwrite(a, sizeof * a, SIZE, fp); // 写double的数组
fclose(fp);
double b[SIZE];
fp = fopen("test.bin", "rb");
size_t ret_code = fread(b, sizeof * b, SIZE, fp); // 读double的数组
if (ret_code == SIZE)
{
puts("数组读取成功,数组内容如下:");
for (int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
putchar('\n');
}
else
{ // 异常处理
if (feof(fp))
{
printf("test.bin 读取错误!unexpected end of file\n");
}
else if (ferror(fp))
{
perror("test.bin 读取错误!");
}
}
fclose(fp);
return 0;
}
8. 文件缓冲区
8.1什么是文件缓冲区
【百度百科】文件是指存储在外部存储介质上的、由文件名标识的一组相关信息的集合。
由于CPU 与 I/O 设备间速度不匹配。为了缓和 CPU 与 I/O 设备之间速度不匹配矛盾。
文件缓冲区是用以暂时存放读写期间的文件数据而在内存区预留的一定空间。
使用文件缓冲区可减少读取硬盘的次数。
介绍:ANSIC 标准采用缓冲文件系统来处理数据文件,
所谓的缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块文件缓冲区。
规则如下:
① 如果从内存向磁盘输出数据,会先送到内存中的缓冲区,缓冲区装满后再一起输送到磁盘上。
② 如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),
然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。
注意事项:缓冲区的大小根据C编译系统决定的。
8.2冲刷缓冲区函数 fflush
介绍:强迫将缓冲区内的数据写回参数 stream 指定的文件中。刷新成功返回 0 ,
如果发生错误则返回 EOF ,且设置错误标识符,即 feof 。
注意事项:fflush 不适用于高版本VS
8.3感受文件缓冲区的存在
观察代码:验证缓冲区概念的存在(VS2013 - Win10)
#include <stdio.h>
#include <windows.h>
int main()
{
FILE* pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
//注:fflush 在高版本的VS上不能使用了
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭文件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
结论: 因为有缓冲区的存在,C语言在操作文件时,需要做刷新缓冲区或者在文件操作结束的时候
关闭文件。如果不做,可能导致读写文件的问题。
9.笔试选择题
9.1二进制打开文件
C语言以二进制方式打开一个文件的方法是?( )
A.FILE *f = fwrite( "test.bin", "b" );
B.FILE *f = fopenb( "test.bin", "w" );
C.FILE *f = fopen( "test.bin", "wb" );
D.FILE *f = fwriteb( "test.bin" );
解析:
首先,因为要打开文件,AD直接排除,由于不存在一个“fopenb”函数,
所以直接选C。二进制描述中的b要放在权限后,也就是“wb”才是合法的。
9.2fopen函数
关于fopen函数说法不正确的是:( )
A.fopen打开文件的方式是"r",如果文件不存在,则打开文件失败
B.fopen打开文件的方式是"w",如果文件不存在,则创建该文件,打开成功
C.fopen函数的返回值无需判断
D.fopen打开的文件需要fclose来关闭
解析:
C选项中fopen的返回值可以检验文件是否打开成功,打开方式为"r"时尤其重要。
ABD为文件操作的基本概念和原则。
9.3文件名及路径
下列关于文件名及路径的说法中错误的是:( )
A.文件名中有一些禁止使用的字符
B.文件名中一定包含后缀名
C.文件的后缀名决定了一个文件的默认打开方式
D.文件路径指的是从盘符到该文件所经历的路径中各符号名的集合
解析:
B选项中,文件名可以不包含后缀名。A的话,文件中不能包含这些字符:\/:*?"<>|,
C表述了后缀名的作用,D是路径的基本概念。
9.4文件读写函数
C语言中关于文件读写函数说法不正确的是:( )
A.fgetc是适用于所有输入流字符输入函数
B.getchar也是适用于所有流的字符输入函数
C.fputs是适用于所有输出流的文本行输出函数
D.fread是适用于文件输入流的二进制输入函数
解析:
B选项中,getchar只针对标准输入流stdin。即使对stdin重定向,getchar针对的也只是stdin。
f系列的输入输出函数都是作用于所有流的的,所以AC没问题,
D的表述也没问题,fread做的就是二进制的活。
9.5下面程序的功能是什么? ( )
A.拷贝文件
B.统计文件的字符数
C.统计文件的单词数
D.统计文件的行数
#include<stdio.h>
int main()
{
long num = 0;
FILE* fp = NULL;
if ((fp = fopen("fname.dat", "r")) == NULL)
{
printf("Can’t open the file! ");
exit(0);
}
while (fgetc(fp) != EOF)
{
num++;
}
printf("num=%d\n", num);
fclose(fp);
return 0;
}
解析:
程序只通过只读方式打开了一个文件,所以A排除,
文中使用的fgetc,且没有' '和'\n'相关的统计,所以排除CD。
9.6下面说法不正确的是:( )
A.scanf和printf是针对标准输入、输出流的格式化输入、输出语句
B.fscanf和fprintf是针对所有输入、输出流的格式化输入、输出语句
C.sscanf是从字符串中读取格式化的数据
D.sprintf是把格式化的数据写到输出流中
解析:
sprintf是把格式化的数据写到字符串中,与输出流无关。
其他三句都准确描述了函数功能。选D
9.7关于feof函数描述不正确的是:( )
A.feof函数是用来判断文件是否读取结束的
B.feof函数是在文件读取结束的时候,检测是否是因为遇到了文件结束标志EOF,而读取结束
C.读取文本判断是否结束时,fgetc看返回值是否为EOF, fgets看返回值是否为NULL
D.二进制文件判断读取结束,看实际读取个数是否小于要求读取个数
解析:
说明:feof函数是在文件读取结束后,判断文件读取结束的原因的,
是读取失败结束,还是遇到文件尾结束。所以A是错误的,其他选项均正确。
本篇完。
(还有最后一篇知识点+一篇前面的课后作业C语言就结束了)