上一篇c:统计单词数量中使用 issplace()
来区分单词,过于粗糙。因为,.:
等这样的标点符号都能区分单词。所以这一篇做了改进。使用isalpha()
来区分单词。不过对于连写的单词,比如don't
也会被识别成两个单词。这里也不作处理了。
主要的开始分享一下思路,其实和上一篇差不多。但是相对而言,准确度更好。详见代码及其中注释。
#include <stdio.h>
#include <ctype.h>
#define STOP '|' // 假设 | 是不会出现文章中的
// don't hhhh'''''xxxx 'x'
int main(int argc, char const *argv[]) {
int char_size = 0;
int words = 0;
int lines = 0;
int start_word = 0;
char prev = 'x';
char c;
// printf("是不是空字符:%d\n", isspace(c));
printf("%s\n", "开始输入吧,退出按 | :");
while ((c = (char) getchar()) != STOP) {
char_size++;
if ('\n' == c) {
lines++;
}
// [ abc ]
// 判断一个单词开始:c 是英文字母;判断一个单词结束:c 不是英文字母
// 单词数量统计:单词开始,然后结束了 +1
if (!isalpha(c) && start_word) {
start_word = 0; // 一个单词结束
words += 1;
// printf("\n");
}
if (isalpha(c) && !start_word) {
start_word = 1; // 一个单词开始
}
if( isalpha(c) && start_word){
// printf("%c", c);
}
prev = c;
}
if (prev != '\n') {
lines += 1;
}
if (start_word) {
start_word = 0;
words += 1;
}
printf("总字符数=%d , 总单词数=%d , 总行数=%d\n", char_size, words, lines);
return 0;
}
输出效果如下:(粗体是控制台输入)
开始输入吧,退出按 | :
what do you want?
money? women? or power?
no ! i just want your love.
sorry. i can’t love you! bye!
|
总字符数=100 , 总单词数=21 , 总行数=4
ps: 由于 isalpha()
的缘故,会将can't
识别成两个单词,而不是一个.
–
end.