1. 基础输入函数
int fscanf(FILE *stream, const char *format, …)
参数
- stream,输入流fileIn之类;
- format,例如"%c %d %s“, ”%c,%d,%s"是不行的,不接受这样的分割;
- …,变量的指针/数组指针;
返回值
-
返回读取单元数,当无出错和非到达文件末尾时;
-
返回EOF,当在中途到达文件末尾,或者发生读取错误(还未明白到底是什么)时,最常见就是权限问题;
scanf函数的扫描逻辑:
值得注意的是,scanf的输入总体可分三类:%c,%d,%s,
%d 和 %s都会将’\n‘视为丢弃字符 / 终止字符,
%c 则会将’\n’视为可接收字符。
-
丢弃阶段,if (制表符,空格,换行符等) 丢弃,指针向前移动;
-
收集阶段,if (当前字符合要求) 读入并解析,直到空格、文件末尾、不符合要求字符为止;
-
判断阶段,if (符合要求读入数为0) 判定本单元读入失败,return;
其逻辑为,字符—>单元—>输入流,只要中间某个单元失败就返回。
如何判断字符是否符合要求:
假设使用ASCII编码,根据返回即可判断。例如%d(整数),用到的字符只有[0-9],遇到
[A-Za-z]则会结束本单元的扫描;
整个输入逻辑的可能变量:
-
目标输入集合,由"%d %c %s"定义,数量为3;
-
单元,%d表示一个整数单元,如果为正数的话,符合要求字符集[0-9],单元大小假设为INT_MAX的10进制位数吧;
%c表示一个字符单元,假设使用ASCII编码可见字符集,单元大小为1;
%s表示一个字符串,不能读取空格字符集,和换行符;
-
字符,单个字符,当一个单元在做扫描时,如果最终读取的符合要求字符数为0,那么
该单元读取失败,返回;
-
已读取单元数,当前单元中的已读取字符数;
-
对于’\n’的处理,例如%d,然后输入12\n,\n会被丢回输入流,如果下一次是getchar()之类,
则会接收到上一次丢回的\n,千万注意;
int fgetc(FILE *stream)
参数
stream,输入流;
返回值
由unsigned char转换而成的int,如果到达文件尾则为EOF(-1);
典型错误使用方式
/*虽然EOF在文件中实际并不存在,
但在理解时,可以当做实际的存在,设计上应该正式如此考虑的,
所以光标可以到达EOF符。
而feof返回判断是,当前符号为空时就返回,
EOF虚拟上是存在的,当前符号为EOF时也不为空,
因此回返回0,并且顺利读取EOF符。
总结起来就是,暂时没看到必须要使用feof()的场景。
*/
//fgetc
while (!feof(fileIn))
{
printf("%c ", fgetc(fileIn));
}
//fopen
if (fileIn)
{
printf("fopen() failed!")
}
char *fgets(char *s, int size, FILE *stream)
参数
- s,待输入字符串;
- size,待输入大小;
- stream,输入流;
返回值
如果输入成功,返回s指针;
如果失败 / 到达末尾,返回NULL;
-
行判定问题、size与行长度lineLen关系问题:
- size应该算上’\0’,同理lineLen应该算上’\n’,也就是互相抵消的意思;
- 当size <= lineLen时,读取size;否则读取lineLen,行以’\n’作为结束符;
分割符问题
- fgets()的分割符号是行的分割符,也就是换行符,hello\nworld会被分两次读入;
- size >= lineLen,也就是正常的情况下会读入’\n‘,所以经常要另行去除’\n’有点麻烦;
size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream)
参数
- ptr,待输入内存块;
- size,单元大小;
- nmemb,单元数量;
- stream,输入流;
返回值
如果正常,返回输出的单元数(全部成功读入,等于nmemb);
如果出错或者到达末尾,返回EOF;
EOF和error的区分
也不是这里的单独问题,基本都不能区分。
用途:
多用于输出struct、array、图片等非文本信息,主要考量点就是,人需要阅读不?
如果人需要阅读,例如网络传输的json等等,那肯定不会用二进制格式,不然怎么查错?
虽然可能需要耗时去解析。
2. 输出函数
int fprintf(FILE *stream, const char *format, …)
参数
- stream,输入流fileIn之类;
- format,例如"%c %d %s“, ”%c,%d,%s"是不行的,不接受这样的分割;
- …,变量的指针/数组指针;
返回值
如果没问题返回输出的单元数目;
如果出错输出EOF;
int fputc(int c, FILE *stream)
参数
- c,待输出字符;
- stream,输出文件流;
返回值
如果没问题返回c;
如果问题(例如文件以"r"打开)时返回EOF;
int fputs(const char *s, FILE *stream)
参数
- s,待输出字符串;
- stream,输出文件流;
返回值
没问题时返回非负数,gcc中会返回1;
出问题时返回EOF;
分割符问题
- fputs()的分割符号是字符串的结束符,也就是’\0’,"hello\nworld\n"会被一次输出;
- 很自然,’\0’是不会被输出的;
size_t fwrite (const void *ptr, size_t size, size_t nmemb,FILE *stream)
参数
- ptr,待输出内存块;
- size,单元大小;
- nmemb,单元数量;
- stream,输出流;
返回值
如果正常,返回输出的单元数(全部成功读入,等于nmemb);
如果出错或者到达末尾,返回EOF;
-
用途:
多用于输出struct、array、图片等非文本信息,主要考量点就是,人需要阅读不?
如果人需要阅读,例如网络传输的json等等,那肯定不会用二进制格式,不然怎么查错?
虽然可能需要耗时去解析。
3. 其他
关于EOF和error区分问题
基本上都不能依靠返回值区分EOF和error,函数ferror()和feof()即用于判断。我是觉得一般使用ferror()进行判断就行。
关于输入函数和输出函数区别
- 输入需要考虑如下因素:
- 是否出错;
- 是否已到达文件末尾;
- 行的分割符,’\n’;
- 目的读入数和行长度的关系,fgets();
- 目的读入数和文件长度的关系,fread();
- 输出需要考虑如下因素:
- 是否出错;
- 字符串的分割符,’\0’;
- 对比可知:
- 输出考虑的更少,输出没有行、目的输入数、文件末尾这样的概念;
- 输出本质是内部程序内容,输出到可以看作白版的文件中,只有程序内部内容一种格式;
- 输入本质是将外部文件内容转换成内部程序内容,是两种格式间的转换,具有两种格式;
fopen()的文本流模式和二进制模式
以前想的太复杂了,其实很简单:
-
文本流,在输入输出时会自动转换win的\r\n和linux的\n;
-
二进制流,不会发生任何转换;
-
如果输入图片之类纯二进制流,用文本流触发了转换的话,则会被完全扭曲;