最近在忙一个批量导入excel的功能的java工程,预计明天完成,如有意向想要了解的朋友,可以访问我的github,看具体代码的实现,不喜勿喷。所以可能今天的笔记写的稍微晚了一些,不过还好。今天有两章内容要整理,明天也就是进行这本书的最后一个章节的知识点的总结了。期待您的关注。
闲话不多说,下面步入正题。
第六章 搜索算法
计算机可以从大量数据中能快速定位数据,因此就要用到我们下面说的一些搜索算法。
6.1 为数不少的搜索算法
搜素:就是从大量的数据中找出目标数据。
常见的搜索算法有:
1.线性搜搜
2.二分搜索
3.利用哈希表进行搜索
4.简单字符串的搜索
5.利用KMP算法进行字符串搜索
6.利用BM算法进行字符串搜索
前三个是从数据列中找到一个目标数据的算法 而后几个则是从数据列中搜索一定长度的数据的算法。
6.2 线性搜索
从一个随机排列的数据列中检索出目标数据,只能从起始位置开始按顺序进行排除,比较每个数据是否与目标数据一致。这样的算法就是搜索算法。
具体步骤如下:
![]() |
算法演示过程如下:
![]() |
6.3 二分搜索
在已排序的数据列中搜索
如果带搜索的数据列是升序或者降序排序的数据列,那么可以用二分搜索进行查找目标数据。
具体过程如下:
![]() |
算法演示过程如下:
![]() |
6.4 利用哈希表实现高效搜索
利用数据结构
往哈希表中插入数据的时候,针对每一个数据,会利用哈希函数求一个相应的哈希值。而哈希函数的作用就是对输入的N个数据,分散的返回0~N-1范围的一个哈希值。把这些哈希值作为下标,利用一个拥有N个元素的数组NT,就可以把不同的数据保存到相应的哈希值中。
当我们想插入一个新的数据到哈希表中的时候,发现所求的哈希值对应的哈希值已经存在,那么就会产生冲突。
解决方法是:不要把 数据直接插入哈希值中,而是在哈希值中保存一个单向链表的起始元素的指针。这样的话,即便存在冲突,也只需要把心的数据加入到单向链表的末尾元素即可。
算法演示如下:
![]() |
6.5 字符串搜索
在字符串中搜索部分子字符串的算法。
从字符串str中寻找子字符串sub的算法具体过程如下:
![]() |
以上搜索步骤简单,但处理速度相对较慢。
算法演示过程如下:
![]() |
6.6 KMP算法
优化下次开始比较的位置
根据字符串以及搜索时子字符串出现不匹配的位置,决定下一次开始比较字符的位置,从而优化搜索的效率。
KMP有“失配函数”的概念。
算法演示过程如下:
![]() |
6.7 BM算法
特征是从后往前搜索
采用的是从子字符串末尾字符开始匹配的方法,根据不匹配的字符以及位置的信息,来决定目标字符串中可以跳过比较的字符,从而优化搜搜效率。
最大特征在于,是从子字符串的末尾字符开始做字符比较的。
算法演示过程如下:
![]() |
真题六
在关系型数据库中使用到的排序和搜索
图示如下:
![]() |