求一个文本文件中有多少个单词的方法

需求是给出一个文本文件,求出其中有多少个单词(不用判断单词是否为真的英语单词)。

分析:因为不需要判断是否为真的英语单词,这就简单多了。只要以空格,TAB,标点符号等非字母间隔的字符串都是单词(不考虑连字符-)。我的解决方法是判断一个单词,只要满足一个是字母的字符后一个字符不是字母,即可算是一个单词。程序如下:

系统IO方式:

/*************************************************************************
	> File Name: WordCount_SYSIO.c
	> Author: Baniel Gao
	> Mail: createchance@163.com 
	> Blog: blog.csdn.net/createchance 
	> Created Time: Fri 11 Apr 2014 04:47:07 PM CST
 ************************************************************************/
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>

#define BUFF_SIZE	1024

int is_letter(char ch);

int main(int argc, char *argv[])
{
	int fd, cnt = 0;
	int ret, i = 0;
	char buff[BUFF_SIZE];

	if (argc != 2) {
		printf("Usage: %s filename \n", argv[0]);
		return -1;
	}
	if (-1 == (fd = open(argv[1], O_RDONLY))) {
		perror("open file");
		return -1;
	}
	while (1) {
		ret = read(fd, buff, BUFF_SIZE);
		if (ret == -1)
			return -1;
		else if (ret == 0)
			break;
		for (i = 0; i < strlen(buff) - 1; i++) {
			if (is_letter(buff[i]) && (!is_letter(buff[i + 1])))
				cnt++;
		}
	}
	printf("words: %d \n", cnt);

	return 0;
}

int is_letter(char ch)
{
	if ((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z'))
		return 1;
	else
		return 0;
}

标准IO方式:

/*************************************************************************
	> File Name: WordCount_STDIO.c
	> Author: Baniel Gao
	> Mail: createchance@163.com 
	> Blog: blog.csdn.net/createchance 
	> Created Time: Sat 12 Apr 2014 02:39:16 PM CST
 ************************************************************************/
#include <stdio.h>
#include <string.h>
#define BUFF_SIZE	1024

int is_letter(char ch);

int main(int argc, char *argv[])
{
	FILE *fp;
	char buff[BUFF_SIZE];
	int i = 0, cnt = 0;

	if (argc != 2) {
		printf("Usage: %s filename \n", argv[0]);
		return -1;
	}
	if (NULL == (fp = fopen(argv[1], "r"))) {
		perror("file open");
		return -1;
	}
	while (NULL != fgets(buff, BUFF_SIZE, fp)) {
		for (i = 0; i < strlen(buff) - 1; i++) {
			if (is_letter(buff[i]) && !is_letter(buff[i + 1]))
				cnt++;
		}
	}
	printf("words: %d \n", cnt);

	return 0;
}

int is_letter(char ch)
{
	if ((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z'))
		return 1;
	else
		return 0;
}


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值