文件操作与字符处理

Description

在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件,
其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数,
并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,
不足5个单词时,按序输出全部单词)。程序中注意如下细节:
(1)	空格、标点符号与回车符起到分隔单词的作用。
(2)	文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词;
(3)	名词缩写算一个单词;
(4)	数字不算单词;
(5)	单词不区分大小写;
(6)	输出时单词全使用小写;

#include "stdio.h" 
#include "math.h" 
#include "string.h" 
#include "stdlib.h" 

_______________________ 

main() 

         _______________________ 


输入格式

文件case1.in中一篇英文文章,包含多段文字,单词数不超过10000,每个单词不超过20个字符


输出格式

按题意输出答案


输入样例

(如case1.in内容如下) 
I am a student. My school is SCAU. It is a beau-
tiful university. I like it.


输出样例

a 2
i 2
is 2
it 2
am 1

实验课的东西,没有算法,没有散列,思路简单,写了点注释
#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"
struct WORD
{
    char c[21];     //记录单词
    int count;      //记录单词次数
} word[10001];
int num;
void tongji(char *temp)
{
    int i,flag=0;
    for(i=0; i<num; i++)
    {
        if(strcmp(word[i].c,temp)==0)
        {
            word[i].count++;
            flag=1;     //出现过就把flag赋值为1,然后该单词次数+1,跳出循环
            break;
        }
    }
    if(flag==0)     //flag==0代表没出现过
    {
        strcpy(word[num].c,temp);   //把temp记录的单词复制到word数组的最后一个中
        word[num].count=1;  //次数记录为1
        num++;      //总单词数+1
    }
}
//下面这个函数是对qsort函数排序方式的声明,return的值<0,则在qsort函数中不改变两者顺序,大于0,在qsort中交换两者顺序。只是一个函数的用法,不用问为什么
int cmp(const void *a,const void *b)
{
    struct WORD *ta=(struct WORD *)a;//强制转换ab成我们已经声明的结构体类型。在此处用ta,tb只是为了表达的方便
    struct WORD *tb=(struct WORD *)b;
    if(ta->count!=tb->count) return tb->count-ta->count;//两个单词的出现次数不同,用第二个参数减第一个,实现从大到小排
    else return (strcmp(ta->c, tb->c));//出现的次数相同,用strcmp比较字典顺序,strcmp如果第一个参数小于第二个参数,
    //返回-1,-1在qsort中就是不改变顺序,跟我们要的结果一样,所以在此处我们才能直接把strcmp的值作为返回值
}
main()
{
    int i=0,n=5;                //i起到记录临时单词长度的作用,n是为了在最后输出时与num比较而声明的
    char ch,temp[21];           //ch读入单个字符,temp存放临时单词
    FILE *fp;
    fp=fopen("case1.in","r");
    while((ch=fgetc(fp))!=EOF)
    {
LOOP:
        if(ch>='A'&&ch<='Z') ch=ch+32;//大写转小写
        if(ch>='a'&&ch<='z') temp[i++]=ch;
        else if(ch=='-')
        {
            ch=fgetc(fp);
            if(ch=='\n');
            else
            {
                if(i!=0)         //所有的统计操作都要在temp有读入字符的前提下进行,即此时i>0,所以这里要判断
                {
                    temp[i]='\0';   //将单词最后一个赋值为结束符
                    i=0;            //一个读完,要重新初始化单词长度
                    tongji(temp);
                }
                if(ch!=EOF) goto LOOP;   //不是EOF,重新回到LOOP那里执行
                else break;              //EOF,就结束啦,所以直接break,跳出while
            }
        }
        else
        {
            if(i!=0)            //这里的判断跟上面的原因一样
            {
                temp[i]='\0';
                i=0;
                tongji(temp);
            }
        }
    }
    if(i>0)
    {
        temp[i]='\0';
        tongji(temp);
    }
    fclose(fp);
    qsort(word,num,sizeof(struct WORD),cmp);
    if(num<5) n=num;                    //前面给了n=5,这里实际上是拿5和num比较,小的那个就给n
    for(i=0; i<n; i++) printf("%s %d\n",word[i].c,word[i].count);
}


SCAU综合实验课程中的文件操作字符处理是一门非常重要的课程,它教授了如何使用计算机来操作文件以及对文件中的字符进行处理文件操作是指使用计算机来创建、打开、读取、写入、修改和关闭文件的过程。在实验中,我们学习了如何使用C++编程语言来实现这些文件操作。通过实践,我们可以掌握文件的基本操作,比如创建文件、打开已存在的文件、从文件中读取数据、向文件中写入数据和关闭文件等等。这些操作对于日常的文件处理工作非常有用。 字符处理是指对文件中的字符进行操作处理的过程。我们学习了如何使用C++语言中的字符串类和字符数组来对字符进行处理。通过实验,我们可以掌握字符串的创建、拼接、截取、替换和转换等操作。这些操作可以帮助我们更好地处理文件中的文本数据,比如查找特定的字符、计算字符串的长度、在字符串中查找子字符串等等。 此外,我们还学习了一些常见的文件操作字符处理的应用,比如统计一个文件中的字符数、单词数和行数,将一个文件中的大写字母转换为小写字母,将一个文件中的所有空格替换为换行符等等。这些应用可以帮助我们更好地理解文件操作字符处理的实际应用场景,并提高我们的实际操作能力。 综上所述,SCAU综合实验中的文件操作字符处理课程是非常实用和重要的一门课程,它教授了我们使用计算机来操作文件处理字符的技能和知识。通过学习这门课程,我们可以提高我们的实际操作能力,为以后的工作做好准备。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值