c:统计单词数量2

上一篇c:统计单词数量中使用 issplace()来区分单词,过于粗糙。因为,.:等这样的标点符号都能区分单词。所以这一篇做了改进。使用isalpha()来区分单词。不过对于连写的单词,比如don't也会被识别成两个单词。这里也不作处理了。

主要的开始分享一下思路,其实和上一篇差不多。但是相对而言,准确度更好。详见代码及其中注释。

#include <stdio.h>
#include <ctype.h>


#define STOP '|'  // 假设 | 是不会出现文章中的

// don't hhhh'''''xxxx 'x'

int main(int argc, char const *argv[]) {
    int char_size = 0;
    int words = 0;
    int lines = 0;
    int start_word = 0;
    char prev = 'x';
    char c;
    // printf("是不是空字符:%d\n", isspace(c));
    printf("%s\n", "开始输入吧,退出按 | :");
    while ((c = (char) getchar()) != STOP) {
        char_size++;
        if ('\n' == c) {
            lines++;
        }
        // [  abc ]
        // 判断一个单词开始:c 是英文字母;判断一个单词结束:c 不是英文字母
        // 单词数量统计:单词开始,然后结束了 +1

        if (!isalpha(c) && start_word) {
            start_word = 0; // 一个单词结束
            words += 1;
            // printf("\n");
        }
        if (isalpha(c) && !start_word) {
            start_word = 1; // 一个单词开始
        }
        if( isalpha(c) && start_word){
            // printf("%c", c);
        }
        prev = c;
    }
    if (prev != '\n') {
        lines += 1;
    }
    if (start_word) {
        start_word = 0;
        words += 1;
    }
    printf("总字符数=%d , 总单词数=%d , 总行数=%d\n", char_size, words, lines);
    return 0;
}

输出效果如下:(粗体是控制台输入)

开始输入吧,退出按 | :
what do you want?
money? women? or power?
no ! i just want your love.
sorry. i can’t love you! bye!
|
总字符数=100 , 总单词数=21 , 总行数=4


ps: 由于 isalpha()的缘故,会将can't识别成两个单词,而不是一个.

end.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值