分析下面伪代码:
如果c不是空白字符,且inword为假
设置inword为真,并给单词计数
如果c是空白字符,且inword为真
设置inword为假
解析:此处最关键是,inword初始值设为0,具体分析见下图:
《C Primer Plus 》例题解析 程序清单7.7 wordcnt.c程序
//wordcnt.c ———— 统计字符数、单词数、行数
#include<stdio.h>
#include<ctype.h> //为ispace()函数提供原型
#include<stdbool.h> //为bool、true、false提供定义
#define STOP '|' //用 | 作为结尾标记
int main(void)
{
char c; //读入字符
char prev; //读入的前一个字符
long n_chars = 0L; //字符数
int n_lines = 0; //行数
int n_words = 0; //单词数
int p_lines = 0; //不完整的行数
bool inword = false; //此处的意思是 把inword的类型设置为bool类型
//或者写 int inword = 0; 即把inword设置为int类型,用0或1表示
printf("Enter text to be analyzed (| to terminate): \n");
prev = '\n'; //"\n"换行符用来识别完整的行数
while ((c = getchar()) != STOP)
{
n_chars++; //统计字符
if (c == '\n')
n_lines++; //统计行
/*如果使用布尔类型的变量,通常习惯把变量自身作为测试条件。如下:
用if(inword)代替(inword == true)
用if(!inword) 代替if(inword == false) */
if (!isspace(c) && !inword) //此为伪代码1:c不是空白字符,且inword为假
//if语句是条件为真才执行,所以 !inword 为真,则inword为假
{
inword = true; //单词的起点,执行的是伪代码1
//如果声明写的是 int inword = 0,此处则写 inword = 1
n_words++; //统计行,执行的是伪代码1
}
if (isspace(c) && inword) //此为伪代码2:c是空白字符,且inword为真
{
inword = false; //单词的末尾,执行的是伪代码2
//如果声明写的是 int inword = 0,此处则写 inword = 0
}
prev = c; //保存字符的值
}
//假如输入:are you ok|
//输入|之后再回车,那这就是一个不完整的行,prev != '\n' 成立
if (prev != '\n') //不完整的行数
p_lines = 1; //或者写 p_lines++
printf("characters = %ld, words = %d, lines = %d, ", n_chars, n_words, n_lines);
printf("partial lines = %d\n", p_lines);
return 0;
}
运行结果:
下面介绍两种统计单词相对简单的方法
举例1:编一个程序从键盘输入一行字符,统计其中单词的个数;假设单词之间以空格分隔。
编程思路:
1.由于第一个单词之前可能会有空格,同时两个单词之间也可能有多个空格,因此不能简单地统计空格的个数,以得到单词的个数。
2.除了最后一个单词,每个单词之后至少更一个空格;而最后一个单词之后,可能跟空格,也可能直接跟一个空字符 '\n'。
3.因此,当相邻的两个字符中,前一个是非空格字符,而后一个是空格或空字符时,说明找到一个单词的末尾。就可以队单词进行 +1 计数。
#include<stdio.h>
#include<string.h> //为strlen()函数提供原型
int main(void)
{
char ch[1000]; //声明一个字符串数组ch
int c = 0; //对单词个数进行计数
int n = 0; //保持字符串的长度
int i = 0; //循环变量,字符串数组的下标
printf("请输入一行以空格分割的单词:\n");
gets(ch); //gets()可以读取整行
n = strlen(ch); //求出字符串长度并存入变量n
while (i <= n - 1) //最后一个字符的下表是n-1
{
if (ch[i] != ' ' && (ch[i + 1] == ' ' || ch[i + 1] == '\0'))
//若第i个字符不是空格,第i+1个字符是空格或'\0'
//则表示找到一个单词的末尾,单词计数+1
c++;
i++;
}
printf("单词个数 = %d\n", c);
return 0;
}
运行结果:
在例1的程序中,假设单词之间是以空格分隔的,而在显示中,单词之间还可以用标点符号分隔。
举例2:从键盘输入一行字符,统计其中单词的个数。假设单词之间以标点符号或空格分隔。
编程思路:
1.由于单词之间是以标点符号或空格分隔的,而标点符号不便于一个个判断出来。
2.因此,可以通过判断一个字符是不是字母或者数字,来统计单词的个数。
3.当相邻的两个字符中,前一个是字母或数字,而后一个不是字母或数字时,说明找到一个单词的末尾。
判断一个字符ch是不是字母或数字的条件可表示为:
(ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z') || (ch >= '0' && ch <= '9')
如果满足上面条件,说明ch是字母或者数字。
也可以直接调用C语言的库函数 isalnum()。当ch的值是字母或数字是,isalnum(ch)的值为非0;否则,为0。
#include<stdio.h>
#include<string.h> //为strlen()函数提供原型
#include<ctype.h> //为isalnum()函数提供原型
int main(void)
{
char ch[1000]; //声明一个字符串数组ch
int c = 0; //对单词个数进行计数
int n = 0; //保持字符串的长度
int i = 0; //循环变量,字符串数组的下标
printf("请输入一行以空格或标点分隔的单词:\n");
gets(ch); //gets()可以读取整行
n = strlen(ch); //求出字符串长度并存入变量n
while (i <= n - 1) //最后一个字符的下表是n-1
{
if (isalnum(ch[i]) && !isalnum(ch[i+1]))
//isalnum(ch[i]) 等价于 isalnum(ch[i]) != 0
//!isalnum(ch[i+1]) 等价于 isalnum(ch[i+1]) == 0
//满足此条件说明找到单词的末尾,可进行单词计数
c++;
i++;
}
printf("单词个数 = %d\n", c);
return 0;
}
运行结果: