C/C++英文文本分析处理[2023-11-16]

C/C++英文文本分析处理[2023-11-16]

程序设计题 1:英文文本分析处理

1 问题描述

编写一个程序,对一篇英文文章进行分析和处理。

2 功能要求

要求提供以下几个基本功能:
(1)从硬盘读入事先录入的英文文档(txt 格式,300 单词以上)。
(2)对文本进行如下处理:
当句子的首字母不是大写时,将其改为大写。
大多数英文标点符号之后应跟一个空格,如没有空格的,应补上(有例外,应根据具体情况判定)。标点之后、单词之间如有多个连续的空格,只保留一个,删除多余的空格(段落的首行缩进空格除外)。标点符号之前一般应无空格,如有,应删掉(有例外,应根据具体情况判定)。
每个段落的段尾不需要空格,应全部删除。
每个段落首行缩进,需空 2 字符,未缩进的补全空格,多余的空格删除。
段落之间、段前、断后不需要空行。
将整理后的文本保存到硬盘上。
(3)对整理后的文档进行统计,要求统计如下信息:
段落总数、句子总数、字符总数(含标点与空格)、单词总数(含标点与空格)、所有的单词(含标点与空格)及其出现的次数。
统计单词及其出现次数时,按词频从大到小排列,he’s 等缩写也算作一个单词。词频相同时,按字母顺序排列。注意大小写对统计的影响,如 He、he 应算作一个单词,而 I、i 应算作不同的单词。
将分析结果保存至另外一个文件中。

选做要求:
对于句子中的缩写,如 let’s、we’ll、we’d、what’s、where’s、that’s、there’s、here’s、I’m、I’d、I’ll、you’re、they’re、we’re 等,将其展开为 let us、we will、we would、what is、where is、that is、there is、here is、I am、I would、I will、you are、they are、we are 等,对于存在多种情况无法转换的,如 he’s 可能是 he is 或者 he has,则不替换,予以保留。转换时注意首字母的大小写。
将整理后的文本保存到硬盘上,并对该文档进行统计及分析,分析结果保存至另外一个文件中。

3 其他要求

(1)变量、函数命名符合规范。
(2)注释详细:每个变量都要求有注释说明用途;函数有注释说明功能,对参数、返回
值也要以注释的形式说明用途;关键的语句段要求有注释解释。
(3)程序的层次清晰,可读性强。
(4)界面美观,交互方便。
(5)如有可能,可使用 MFC 等开发工具,实现彩色或图形操作界面。

4 开发环境

可以选择 TC2.0、TC3.0、VC++6.0 等开发环境,或者与老师讨论,选择自己熟悉的开发
工具与平台。

源码联系UP主 -> https://space.bilibili.com/329101171

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值