数据结构实践项目三——文本文件单词的检索与计数（实验准备与设计）

最新推荐文章于 2021-05-25 10:39:40 发布

Cheem-dog

最新推荐文章于 2021-05-25 10:39:40 发布

阅读量820

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_55620711/article/details/114547468

版权

本文档详细介绍了如何通过KMP算法来完成一个实验项目，旨在统计给定单词在文本文件中的出现次数及位置。内容包括实验任务、KMP算法的概念和思想、编程语言选择、问题解决思路以及输出结果的处理方法。KMP算法在匹配过程中利用最长相等前缀避免了不必要的回溯，提高了时间效率。

摘要由CSDN通过智能技术生成

目录标题

一、实验内容
- 1、实验任务
- 2、实验要求
二、KMP算法的相关概念
三、编程语言及环境的选择
四、问题思路

一、实验内容

1、实验任务

建立一个文本文件，统计给定单词在文本文件中出现的总次数及位置

2、实验要求

文本文件中每个单词不包含空格且不跨行，单词由字符序列构成且区分大小写，统计给定单词在文本文件中出现的总次数，检索输出的某个单词出现在文本中的行号、在该行中出现的位置
设计数据量大的文本，进行子串的查询处理，分析算法运行的时间效率，对所有输出的匹配位置结果进行验证，以证明算法设计和实现的正确性
用朴素模式匹配算法或KMP算法实现字符串定位
可正确读取，保存文本

二、KMP算法的相关概念

1、朴素模式匹配算法

1.1主要思想

从主串s 和子串t 的第一个字符开始，将两字符串的字符一一比对，如果出现某个字符不匹配，主串回溯到第二个字符，子串回溯到第一个字符再进行一一比对。如果出现某个字符不匹配，主串回溯到第三个字符，子串回溯到第一个字符再进行一一比对…一直到子串字符全部匹配成功。

1.2时空复杂度

最好情况下时间复杂度为O(n),即子串的n个字符正好等于主串的前n个字符
最坏的情况下时间复杂度为O(m*n)
空间复杂度为O(1)，即不消耗空间而消耗时间

2、KMP算法

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。