数据结构整理

目录

1、哈希表

开放地址法:

链地址法:

2、字符串匹配的两种算法

2、排序算法总结

2.1冒泡排序(比较相邻元素))

2.2选择排序

2.3插入排序

2.4希尔排序

2.5归并排序O(nLog(n))

2.6堆排序O(nLog(n))

 

2.7快速排序O(nLog(n))~O(n^2)

二分排序:

3、树和堆

3.1 Huffman树

3.2 B树、B+树、B*树

3.3 堆

4、图

5、说说复杂度

6、链表代码

6.1 单链表创建、遍历(正序、逆序)

6.2 判断链表环


收藏一个讲C和C++数据结构的网址:数据结构与算法系列 目录

1、哈希表

常见的hash函数:

  1. 除法散列(除k取余): h(k) = k mod m,其中m为槽的个数。将关键字k映射到m个槽的某一个中去。【m不能太小,m一定是质数】
  2. 乘法散列法: h(k) = floor(m(kA mod 1)),用关键字k乘上常数A[A的范围(0,1)],并抽取kA的小数部分;然后用m乘以这个值,再取结果的底(即整数部分)。【比除法好,因为乘法比除法快,一般A=(根号5 - 1)/2,m是2的幂次】
  3. 全域散列法(universal hashing) :预先定义一个有限的散列函数集(就是多个散列函数),等到真正开始执行时,随机选择一个散列函数(一旦开始执行,散列函数就不能改变),这样的优点是对手不知道你要选那个散列函数,看到的只是random()。
  4. 完全散列:适用于静态集合(只有search操作),利用两级哈希,使得最坏情况下查找只需要O(1)。要求:第二个散列函数必须是没有碰撞发生的

HASH 函数冲突处理方式包括:

  • 开放定址法
  • 再哈希法
  • 链地址法
  • 建立公共溢出区

例题:

开放地址法:

        这个方法的基本思想是:当发生地址冲突时,按照某种方法继续探测哈希表中的其他存储单元,直到找到空位置为止。这个过程可用下式描述: 
       H i ( key ) = ( H ( key )+ d i ) mod m ( i = 1,2,…… , k ( k ≤ m – 1)) 
      其中: H ( key ) 为关键字 key 的直接哈希地址, m 为哈希表的长度, di 为每次再探测时的地址增量。 
采用这种方法时,首先计算出元素的直接哈希地址 H ( key ) ,如果该存储单元已被其他元素占用,则继续查看地址为 H ( key ) + d 2 的存储单元,如此重复直至找到某个存储单元为空时,将关键字为 key 的数据元素存放到该单元。 
增量 d 可以有不同的取法,并根据其取法有不同的称呼——线性探测再散列二次探测再散列伪随机探测再散列

分析过程:

  1. 因为表中5、6、7已经被占据;
  2. 线性探测再散列,38/11=3...5,余数为5,而5被占据,因此找6,依次找到为空的表,即表8;
  3. 二次探测再散列,38/11=3...5,余数为5,而5被占据,因此(5+1)/11=0...6,被占据;(5-1)/11=0...4,找到表4;

总结二次探测再散列:

          (key+1^2)mod m  ;  (key-1^2)mod m  ;  (key+2^2)mod m  ;  (key-2^2)mod m  ;  .......

链地址法:

与开放定址法相比,拉链法有如下几个优点:

  1. 拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;
  2. 由于拉链法中各链表上的结点空间是动态申请的,故它更适合于造表前无法确定表长的情况;
  3. 开放定址法为减少冲突,要求装填因子α较小,故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1,且结点较大时,拉链法中增加的指针域可忽略不计,因此节省空间;
  4. 在用拉链法构造的散列表中,删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表,删除结点不能简单地将被删结 点的空间置为空,否则将截断在它之后填人散列表的同义词结点的查找路径。这是因为各种开放地址法中,空地址单元(即开放地址)都是查找失败的条件。因此在用开放地址法处理冲突的散列表上执行删除操作,只能在被删结点上做删除标记,而不能真正删除结点。

拉链法的缺点:指针需要额外的空间,故当结点规模较小时,开放定址法较为节省空间,而若将节省的指针空间用来扩大散列表的规模,可使装填因子变小,这又减少了开放定址法中的冲突,从而提高平均查找速度。

2、字符串匹配的两种算法

情景:

  1. 有字符串str1:a0a1a2a3...an;str2:b0b1b2b3....bm       ai,bi代表一个字符
  2. 要找到str2中的子串,使其等于str1

Brute-Force算法:

比较a0和bi,如果相等,则比较a1和b(i+1),知道全部匹配或者退出

KMP算法:

经典算法-KMP

2、排序算法总结

算法的稳定性定义:

          如果Ai = Aj,排序前Ai在Aj之前,排序后Ai还在Aj之前,则称这种排序算法是稳定的。通俗地讲就是保证排序前后两个相等的数的相对顺序不变。

排序算法大体可分为两种:

    一种是比较排序,时间复杂度O(nlogn) ~ O(n^2),主要有:冒泡排序选择排序插入排序归并排序堆排序快速排序等。

    另一种是非比较排序,时间复杂度可以达到O(n),主要有:计数排序基数排序桶排序等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值