文本文件单词的检索与计数
实验任务:
建立一个文本文件,统计给定单词在文本文件中出现的总次数及位置;
实现要求:
1.文本文件中每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写,统计给定单词在文本文件中出现的总次数,检索输出的某个单词出现在文本中的行号、在该行中出现的位置。
2.设计数据量大的文本,进行子串的查询处理,分析算法运行的时间效率,对所有输出的匹配位置结果进行验证,以证明算法设计和实现的正确性。
3.用朴素模式匹配算法或KMP算法实现字符串定位;
4.可正确读取,保存文本;
朴素模式匹配算法
1.概念简述
子串定位运算,在主串中找出子串出现的位置。
在串匹配中,将主串 S 称为目标(串),子串 T 称为模式(串)。如果在主串 S 中能够找到子串 T, 则称匹配成功,返回 第一个 和 子串 T 中 第一个字符 相等 的 字符 在主串 S 中的 序号,否则,称匹配失败,返回 0。
2.算法步骤
假设我们要从主串s="goodgoogle"找到t="google"这个子串的位置,我们需要下列步骤
1、主串s的第1位开始,s与t前三个字符都匹配成功,第四个字符不匹配(竖线表示相等,闪电状弯折表示不想等)
2、主串s的第2位开始,匹配失败
3、主串s的第3位开始,匹配失败
4、主串s的第4位开始,匹配失败
5、主串s的第