数据结构整理

最新推荐文章于 2022-10-22 11:17:45 发布

Musing_jk

最新推荐文章于 2022-10-22 11:17:45 发布

阅读量296

点赞数

分类专栏： C++

本文链接：https://blog.csdn.net/weixin_37058227/article/details/82727272

版权

2.7快速排序O(nLog(n))~O(n^2)

收藏一个讲C和C++数据结构的网址:数据结构与算法系列目录

1、哈希表

常见的hash函数：

除法散列（除k取余）： h(k) = k mod m，其中m为槽的个数。将关键字k映射到m个槽的某一个中去。【m不能太小，m一定是质数】
乘法散列法： h(k) = floor(m(kA mod 1))，用关键字k乘上常数A[A的范围(0,1)]，并抽取kA的小数部分；然后用m乘以这个值，再取结果的底(即整数部分)。【比除法好，因为乘法比除法快，一般A=（根号5 - 1）/2，m是2的幂次】
全域散列法(universal hashing) ：预先定义一个有限的散列函数集（就是多个散列函数），等到真正开始执行时，随机选择一个散列函数（一旦开始执行，散列函数就不能改变），这样的优点是对手不知道你要选那个散列函数，看到的只是random()。
完全散列：适用于静态集合（只有search操作），利用两级哈希，使得最坏情况下查找只需要O(1)。要求：第二个散列函数必须是没有碰撞发生的

HASH 函数冲突处理方式包括：

开放定址法
再哈希法
链地址法
建立公共溢出区

例题：

开放地址法：

这个方法的基本思想是：当发生地址冲突时，按照某种方法继续探测哈希表中的其他存储单元，直到找到空位置为止。这个过程可用下式描述：
H i ( key ) = ( H ( key )+ d i ) mod m ( i = 1,2,…… ， k ( k ≤ m – 1))
其中： H ( key ) 为关键字 key 的直接哈希地址， m 为哈希表的长度， di 为每次再探测时的地址增量。
采用这种方法时，首先计算出元素的直接哈希地址 H ( key ) ，如果该存储单元已被其他元素占用，则继续查看地址为 H ( key ) + d 2 的存储单元，如此重复直至找到某个存储单元为空时，将关键字为 key 的数据元素存放到该单元。
增量 d 可以有不同的取法，并根据其取法有不同的称呼——线性探测再散列，二次探测再散列，伪随机探测再散列。

分析过程：

因为表中5、6、7已经被占据；
线性探测再散列，38/11=3...5,余数为5，而5被占据，因此找6，依次找到为空的表，即表8；
二次探测再散列，38/11=3...5,余数为5，而5被占据，因此（5+1）/11=0...6,被占据；（5-1）/11=0...4,找到表4；

总结二次探测再散列：

(key+1^2)mod m ; (key-1^2)mod m ; (key+2^2)mod m ; (key-2^2)mod m ; .......

链地址法：

与开放定址法相比，拉链法有如下几个优点：

拉链法处理冲突简单，且无堆积现象，即非同义词决不会发生冲突，因此平均查找长度较短；
由于拉链法中各链表上的结点空间是动态申请的，故它更适合于造表前无法确定表长的情况；
开放定址法为减少冲突，要求装填因子α较小，故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1，且结点较大时，拉链法中增加的指针域可忽略不计，因此节省空间；
在用拉链法构造的散列表中，删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表，删除结点不能简单地将被删结点的空间置为空，否则将截断在它之后填人散列表的同义词结点的查找路径。这是因为各种开放地址法中，空地址单元（即开放地址）都是查找失败的条件。因此在用开放地址法处理冲突的散列表上执行删除操作，只能在被删结点上做删除标记，而不能真正删除结点。

拉链法的缺点：指针需要额外的空间，故当结点规模较小时，开放定址法较为节省空间，而若将节省的指针空间用来扩大散列表的规模，可使装填因子变小，这又减少了开放定址法中的冲突，从而提高平均查找速度。

2、字符串匹配的两种算法

情景：

有字符串str1：a0a1a2a3...an;str2：b0b1b2b3....bm ai,bi代表一个字符
要找到str2中的子串，使其等于str1

Brute-Force算法：

比较a0和bi，如果相等，则比较a1和b(i+1)，知道全部匹配或者退出

KMP算法：

经典算法-KMP

2、排序算法总结

算法的稳定性定义：

如果Ai = Aj，排序前Ai在Aj之前，排序后Ai还在Aj之前，则称这种排序算法是稳定的。通俗地讲就是保证排序前后两个相等的数的相对顺序不变。

排序算法大体可分为两种：

　　　　一种是比较排序，时间复杂度O(nlogn) ~ O(n^2)，主要有：冒泡排序，选择排序，插入排序，归并排序，堆排序，快速排序等。

　　　　另一种是非比较排序，时间复杂度可以达到O(n)，主要有：计数排序，基数排序，桶排序等。

最低0.47元/天解锁文章

Musing_jk

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构整理

目录1、哈希表开放地址法：链地址法：2、字符串匹配的两种算法2、排序算法总结2.1冒泡排序(比较相邻元素)）2.2选择排序2.3插入排序2.4希尔排序2.5归并排序O(nLog(n))2.6堆排序O(nLog(n))2.7快速排序O(nLog(n))~O(n^2)二分排序：3、树和堆3.1 Huffman树3.2 B树、B+树、...
复制链接

扫一扫