字符输入/输出和输入验证
一、缓冲区
- 正在等待的程序可以立即使用输入的字符,这属于无缓冲(或直接)输入。
- 用户输入的字符被收集并存储在一个被称为缓冲区的临时存储区,按下Enter键后,程序才可以使用用户输入的字符。这属于缓冲输入。
- 缓冲分为:完全缓冲I/O 和行缓冲I/O。
- 完全缓冲输入指的是当缓冲区被填满时才刷新缓冲区(内容被发送至目的地),通常出现在文件输入中。
- 行缓冲输入指的是在出现换行符时刷新缓冲区。键盘输入就是行缓冲输入。
- ANSI C(ANSI C是由美国国家标准协会(ANSI)及国际标准化组织(ISO)推出的关于C语言的标准。) 和后续的C标准都规定输入是缓冲的。
二、结束键盘输入
1.文件、流和键盘输入
- 文件是存储器中存储信息的区域。通常,文件都保存在某种永久存储器中(磁盘,U盘或DVD等)。
- 直接调用操作系统的函数被称为底层I/O(由于计算机系统各不相同,所以不可能为普通底层I/O创建标准库)。从较高层面上,C可以通过标准I/O包来处理文件。
- 使用标准的I/O包,就可以不用考虑计算机系统的差异。
- 流是一个实际输入或输出映射的理想化数据流。打开文件的过程就是把流与文件相关联,而且读写都通过流来完成。
- 可以用处理文件的方式来处理键盘输入。因此C的输入函数内置了文件结尾检测器。
2.文件结尾
- 在C语言中,用getchar() 读取文件检测到文件结尾时将返回一个特殊的值,即EOF。scanf()函数检测到文件结尾时也返回EOF。
- EOF定义在stdio.h文件中:
#define EOF (-1)
,因为getchar() 函数的返回值通常介于0~127,这些值对应标准字符集(ASCII)。如果能识别扩展字符集,该函数的返回值又在0~255之间。但是始终-1都不对应任何字符。 - 比较getchar() 的返回值和EOF。若两值不同,则表明没有达到文件末尾。例如
while((ch = getchar()) != EOF)
。 - 不需要再定义EOF,也不用考虑它的实际值。getchar() 的返回值是int。
四.重定向和文件
- Unix(运行命令模式时)、linux(ditto)、Window命令行提示都可以重定向输入、输出。
- 重定向输入程序使用文件而不是键盘来输入;重定向输出让程序输出至文件而不是屏幕。
1.重定向输入
- 文本文件是内含文本的文件,其中存储的数据是我们可以识别的字符。内含机器语言指令的文件不是文本文件。
- <符号是Unix 和 DOS/Windows 的重定向运算符。该运算符使words文件同stdin流相关联,把文件内容导入echo_eof程序中。
- 必须用cd命令进入保存该执行文件内后再输入
echo_eof.exe<words.txt
。有可能会遇见乱码,这是因为命令行和文本文件的编码格式不同造成的,将文本文件的编码格式改为ANSI后可以解决这个问题。(cd filename//进入filename)例如:
2.重定向输出
- >符号是Unix 和 DOS/Windows 的重定向运算符。该运算符使words文件同stdin流相关联,把echo_eof的输出重定向至word文件。
- 一般会擦除该文件的内容,然后替换新内容。若没有该文件则会在echo_eof的文件目录下新建。
- 在下一行的开始处使用Ctrl+D(unix)或Ctrl+Z(DOS)即可以结束该程序。例如
3.组合重定向
- 制作一份文件副本例如:制作mywords文件的副本,并命名为savewords
echo_eof< mywords >savewords
- 在同一条命令中,输入文件名和输出文件名不能相同。
- 重定向运算符必须要有一个可执行文件和一个数据文件。
- 不能读取多个文件的输入,也不能输出至多个文件。
- 附echo_eof代码
/* echo_eof.c -- repeats input to end of file */
#include <stdio.h>
int main(void)
{
int ch;
while ((ch = getchar()) != EOF)
putchar(ch);
return 0;
}
五、输入验证
-
预料可能出现的一些输入错误,并编写出能够检测并处理这些问题的程序。
-
输入实际上是字符流,可以使用getchar() 逐字符读取输入。
-
通用设计方法
获取用户响应 当响应不合适时 提示用户再次输入 获取用户响应(成功时退出循环)
-
输入由字符组成,但是scanf()可以把输入转换成整数值或浮点数值。使用转换说明限制了可接受输入的字符类型,而getchar() 和使用%c的scanf() 接受所有的字符。
六、一些补充
- 如果scanf() 没有成功读取,就会把它留在输入队列中。