Jeff数据结构与算法收官之战：图及常见的十种算法（四天结束战斗!)

Jeff.Ye

于 2020-08-26 19:41:50 发布

阅读量1.7k

点赞数 7

分类专栏：数据结构文章标签：算法二叉树数据结构

本文链接：https://blog.csdn.net/weixin_43323278/article/details/108245871

版权

数据结构专栏收录该内容

13 篇文章 0 订阅

订阅专栏

平衡二叉树：

前提是有序的二叉树，它的左右子树的高相差不超过1，它的所有的子树也要满足这个要求。
如果一个有序二叉树呈单支状（接近单支），它的效率接近链表，因此只有达到平衡时它的效率才最高。
由于节点的位置受值的影响，因此只能进行调整，而不能强行修改。

二叉树不平衡的基础原因：
      x                            y 
     / \                         /   \
    y   t1  以为轴向右旋转       z     x
   / \                         / \   / \
  Z   t2                      t3 t4 t2 t1
 / \
t4  t3

  x                                  y
 / \                               /   \
t1  y                             x     z
   / \      心y为轴向左旋转       / \   / \
  t2  z                         t1 t2 t3 t4
     / \                             
    t3  t4

      x                 x                z
     / \               / \             /   \
    y   t1            z   t1          y     x
   / \               / \             / \   / \
  t4  z             y   t2          t4 t3 t2 t1
     /  \          / \
    t3   t2       t4  t3
以z为轴向左旋转    以z为轴向右旋转    最终达到平衡

    x                 x                   z
   / \               / \                /   \
  t1  y             t1  z              x     y
     / \               / \            / \   / \
    z  t4             t2  y          t1 t2 t3  t4
   / \                   / \
  t2  t3                t3 t4
以z为轴向右旋转    心z为轴向左旋转

红黑树：

也一种自平衡的二叉树，它不是根据子树的高度来调整平衡的，而是给节点设置一个颜色，来达到平衡。
优点：插入与删除的效率，比AVL树要高。
缺点：没有AVL均匀，查找效率没AVL树高。

图(Graph)型结构：

什么图型结构：由顶点的有穷且非空和顶点之间边的集合.
通常表示：G(V,E)，G表示一个图，V是图中顶点集合(元素)，E是图中边(元素之间的关系)的集合。

无向图：

  边用(A,B)方式表示，点与点之间是互通的。
  在无向图中，任意两个顶点之间都有边，该图称为无向完全图，则含有n个顶点的无向完全图有，n*(n-1)/2条边。

有向图：
边用<A,B>方式表示，仅仅是A到到B点，有向图的边也叫弧，A是弧尾，B是弧头。
在有向图中，任意两个顶点之间都方向相反的两条弧，这种图叫有向完全图，则含有n个顶点的有向完全图有，n*(n-1)。
注意：不存在顶点到自身的边，且一条边不重复出现，这种图叫简单图，数据结构中只研究简单图。

图的点多边少的图叫稀疏图，反之的叫稠密图，图的点与点之间边带数据，这些数据叫作边的权重，带权重的图被称为网。

依附于顶点的边的数量叫作顶的度，有向图双分为出度(从顶出的的弧的数量)和入度(指向顶点的弧的数量)。

路径：顶点到顶点经过的边叫路径，边的数量叫路径的长度。

第一个顶点到最后一个顶的路径是相同的，这种路径叫回路或者环。
序列顶点中不重复出现的路径称为简单路径，除了第一个顶点和最后一个顶点，其余顶点不重复出现的回路叫简单回路。

如果顶点V到顶点V1有路径，则称V和V1是连通的，如果图中和任意顶点之间是连通的，则称图为连通图，如果一个图中有n个顶点那么至少需要n-1条边才能达到连通图，仅需要n-1边的连通叫生成树，如果再配合上权重，代价最的叫最小生成树。

树的存储结构：

阾接矩阵：

  用一个一维数组来存储n个顶点，用一个n*n二维数组来存储边。
  char V[n] = {A,B,C,D,E,F,G};
        A  B  C  D  E  F  G
     A [0][0][0][1][1][0][0]
     B [0][0][0][0][0][0][0]
     C [0][0][0][0][0][0][0]
     D [1][0][0][0][0][0][0]
     E [0][0][0][0][0][0][0]
     F [0][0][0][0][0][0][0]
     G [0][0][0][0][0][0][0]
     二维数组中E[i][j]的值为1，则表示项V[i]，到顶点V[j]有边。
     注意：由于不存在自己到自己的边，主对角线上的值为假。
     如果存储的是无向图则二维数组中的值沿主对角线对称，可以压缩为一维数组（参看矩阵压缩）。

阾接矩阵的优点是可以方便计算顶点的入度和出度，但缺点是当图是稀疏图时，会非常浪费存储空间。

阾接表：

  边：
     顶点下标
     下一条边的地址
  顶点：
     数据
     指向第一条边的指针
  图：
     由顶点组成的数组            
     顶点数量cnt
  优点：可以节约存储空间，计算入度麻烦。

十字链表：

  边：
     弧尾下标
     弧头下标
     指向相同弧尾的下一条边
     指向相同弧头的下一条边

  顶点：
     数据
     指向第一条边的指针
     指向入度的边
  图：
     由顶点组成的数组            
     顶点数量cnt

阾接多重表：

  是一种专门存储无向图的一种结构。
  边：
     i,j 两个互相依附的顶点的下标
     inext 指向下一个依附i项点的边
     jnext 指向下一个依附j项点的边

  顶点：
     数据 
     指向与顶点有关系的一条边。
     
  图：
     由顶点组成的数组。
     顶点数量

算法：

输入: 算法具有0个或多个输入
输出: 算法至少有1个或多个输出
有穷性: 算法在有限的步骤之后会自动结束而不会无限循环，并且每一个步骤可以在可接受的时间内完成
确定性：算法中的每一步都有确定的含义，不会出现二义性
可行性：算法的每一步都是可行的，也就是说每一步都能够执行有限的次数完

如果评价一个算法：
时间复杂度：由于计算机的性能不同，无法准确统计出算法执行所需要的时间。
因此我们用算法执行的次数来代表算法的时间复杂度，O(公式)，一般忽略常数。

  常见的时间复杂度：
     // O(1)
     printf("%d",i); 
     // O(logn)
     for(int i=n; i>=0; i=i/2)
     {
        printf("%d",i);
     }
     // O(n)
     for(int i=0; i<n; i++)
     {
        printf("%d",i);
     }
     // O(nlogn)
     for(int j=0; j<n; j++)
     {
        for(int i=n; i>=0; i=i/2)
        {
           printf("%d",i);
        }
     }
     // O(n^2)
     for(int i=0; i<n; i++)
     {
        for(int j=0; j<n; j++)
        {
           printf("%d",i*j);
        }
     }

查找算法：

顺序查找：

  对待查找的数据没有要求，时间复杂度: O(n)

二分查找:

  对待查找的数据必须有序，时间复杂度: O(logn)

块查找：

  是一种数据处理的思想，不是特定的算法，当数据量过多时，可以先把数据进行分块处理，然后再进行查找，例如英语词典。

哈希查找：

  数据 经过哈希函数 计算出数据在哈希表中的位置，然后标记，方便之后的查找，它的时间复试度最快能达到：O(1)。
  但是该算法有很大局限性，不适合浮点型、字符串型数据，需要额外的存储空间，空间复杂度高，是一种典型的用空间换取时间的算法。

哈希函数设计方法：

     直接定址法：把数据直接当作数组的下标。
     数字分析法：分析数据的特点来设计哈希，常用的方法就是找到最大值与最小值,最大值-最小值+1来确定哈希表的长度，数据-最小值访问哈希表。

排序算法：

在这里插入图片描述

冒泡：数据左右进行比较，把最大的数据交换到最后，特点是该算法对数据的有序性敏感，在排序过程中可以立即发现已经完成。

选择：假定最开始的位置是最小值并记录下标min，然后与后面的数据进行比较，如果有比以min为下标的数据小的则min的更新，最后如果min的如果发生改变，则交换min与最开始位置的数据，虽然时间复杂度挺高的，但数据交换的次数比较小，因此实际运行速度并不慢(数据交换比数据比较耗时)。

插入：把数据看作两部分，一分部是有序，把剩余的数据逐个插入进行，适合对已经排序后的数据，新增数据并排序。

希尔：是插入排序的增加版，由于插入排序时，数据移动的速度比较发慢，所以增加了增量的概念，以此来提高排序速度。

快速：找到一个标杆，一面从左找比标杆大的数据，找到后把放在标杆的右边，另一个从右边找比标杆小的数据，找到后把放在标杆的左边，最终标杆左边的数据都比它小，右边的数据都比它大，这样就整体有序，然后按同样的方法排序标杆左边的数据和标杆右边的数据。

快速：通过一趟排序将待排记录分隔成独立的两部分，其中一部分记录的关键字均比另一部分的关键字小，则可分别对这两部分记录继续进行排序，以达到整个序列有序。

归并：建立在归并操作上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为2-路归并。

堆：堆排序（Heapsort）是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点。

计数：计数排序不是基于比较的排序算法，其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序，计数排序要求输入的数据必须是有确定范围的整数。

桶：桶排序是计数排序的升级版。它利用了函数的映射关系，高效与否的关键就在于这个映射函数的确定。桶排序 (Bucket sort)的工作的原理：假设输入数据服从均匀分布，将数据分到有限数量的桶里，每个桶再分别排序（有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排）。

基数：属于“分配式排序”（distribution sort），又称“桶子法”（bucket sort）或binsort，顾名思义，它是透过键值的部份资讯，将要排序的元素分配至某些“桶”中，藉以达到排序的作用。

Jeff.Ye

关注

7
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
Jeff数据结构与算法收官之战：图及常见的十种算法（四天结束战斗!)

平衡二叉树：前提是有序的二叉树，它的左右子树的高相差不超过1，它的所有的子树也要满足这个要求。如果一个有序二叉树呈单支状（接近单支），它的效率接近链表，因此只有达到平衡时它的效率才最高。由于节点的位置受值的影响，因此只能进行调整，而不能强行修改。二叉树不平衡的基础原因： x y / \ / \ y t1 以为轴向右旋转 z x /
复制链接

扫一扫