《数据结构课程设计》系列文章三(文本文件单词的检索与计数)
《数据结构课程设计》系列文章一(学生成绩档案管理系统)
《数据结构课程设计》系列文章二(隐式图的搜索问题)
《数据结构课程设计》系列文章三(文本文件单词的检索与计数)
前言
本文主要是为文本文件单词的检索与计数所做的预习准备,后期项目完成会附录源码和实现代码分析
一、实验内容
二、实验思路
1.基础设计
①建立文本文件;
②给定单词进行计数,计算该单词在文本中出现的次数;
③检索给定单词,输出该单词在文中出现的次数以及其行号和位置;
2.算法分析
①朴素模式匹配算法(BF算法):
- 首先需要了解主串和模式串的定义,例如,我们在字符串A中查找字符串B,那字符串A就是主串,字符串B就是模式串,把主串的长度记作n,模式串的长度记作m,因为我们是在主串中查找模式串,因此n>m;
- BF 算法的思想可以用一句话来概括,那就是,我们在主串中,检查起始位置分别是 0、1、2…n-m 且长度为 m 的 n-m+1 个子串,看有没有跟模式串匹配的。如图:
②KMP算法
KMP算法相对于BF算法有着较大的改进,主要是消除了指针的回溯,使算法在某些程度上的算法效率都得到了提高,而它消除回溯 的方法就是它提取并运用了加速匹配的信息即next数组。
三、编程语言及开发环境
编程语言:java
开发环境:IntelliJ IDEA 2019