【小白打基础系列】线性表的应用之单词检查

2020数据结构课程设计之单词检查:

单词检查(Ⅰ)- 顺序表实现
许多应用程序,如字处理软件,邮件客户端等,都包含了单词检查特性。单词检查是根据字典,找出输入文本中拼错的单词,我们认为凡是不出现在字典中的单词都是错误单词。不仅如此,一些检查程序还能给出类似拼错单词的修改建议单词。 例如字典由下面几个单词组成:
bake cake main rain vase
如果输入文件中有词vake ,检查程序就能发现其是一个错误的单词,并且给出 bake, cake或vase做为修改建议单词。
修改建议单词可以采用如下生成技术:
(1)在每一个可能位置插入‘a-‘z’中的一者
(2)删除单词中的一个字符
(3)用‘a’-'z’中的一者取代单词中的任一字符
很明显拼写检查程序的核心操作是在字典中查找某个单词,如果字典很大,性能无疑是非常关键的。
你写的程序要求读入字典文件,然后对一个输入文件的单词进行检查,列出其中的错误单词并给出修改建议。

课程设计必须采用如下技术完成并进行复杂度分析及性能比较。
(1)朴素的算法,用线性表维护字典
(2)使用二叉排序树维护字典
(3)采用hash技术维护字典

本题要求使用顺序表实现。

基本思路:
1)本题难点以及重点都在字符串的匹配问题上。如果完美匹配或需要替换一个字符,说明字符串长度与字典单词长度一致。又或者,字符串长度与字典单词长度差为±1,少一个或多一个,而且只能有一个字母的差异,其余的字母按顺序都相同,说明需要增或者减字母。

2)有了上述思路,就要想办法用顺序表实现这个功能。从宏观的角度,要开一个大数组(大小>=字典单词),其功能为储存匹配到的单词(建议修改成的)在字典中的序号。

3)在遍历字典中的过程,开始匹配(模糊搜索)。每个字典单词都要与输入的字符串进行匹配(首先判断长度是否相等或差是否为±1)。

4)如果长度相等,那么可能完美匹配,如何判断是否完美匹配呢?可以设置一个变量count,赋初值为0。用它来记录字符的失配次数。如果失配次数等于零,那么便是完美匹配啦!如果失配次数等于1,说明要替换单词。但如果失配次数大于1,便说明字符串无缘修改,直接break跳出单词字符的遍历。

5)如果字符串长度大于字典单词长度,那么可能需要删减一个字符。同4的思路,需要设置一个记录失配次数的count变量,来判断是否真的需要删减一个字符(如果count>1就没必要继续匹配了)。所以,在一开始判断字典单词与字符串长度的时候,我们需要利用if与else if语句分别处理三种长度比较的情况,count变量便可设置在if语句之外。但,如何在长度不相同的情况下来进行匹配字符呢?我们可以利用i,j两个变量,来记录匹配位置。(利用i来记录字符串的位置,利用j来记录字典单词的位置。遍历字符时,截至条件为长度较大的长度。如果两个字符失配,那么j–,这样便可继续按顺序匹配)。

6)如果字符串长度小于字典单词长度,那么可能需要增加一个字符。思路同上,但需要注意的是,在记录匹配位置时有变化。

7)因为自己太菜,输入问题困惑了好久(对我来说也是一个难题嘻嘻),下面贴上输入代码:

while (cin >> Node[n].character)//输入单词
		{
   
			if (Node[n].character[0] == '#')
				break;
			Node[n].len = strlen(Node[n].character);
			n++;
		}
		while (cin >> search.character)//检查单词
		{
   
			if (search.character[0] == '#'</
  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值