数据结构与算法 Python语言描述笔记

最新推荐文章于 2023-06-06 18:03:51 发布

weixin_30653023

最新推荐文章于 2023-06-06 18:03:51 发布

阅读量124

点赞数

文章标签： python c/c++ 数据结构与算法

原文链接：http://www.cnblogs.com/theodoric008/p/7899523.html

版权

数据结构

线性表包括顺序表和链表，python的list是顺序表，链表一般在动态语言中不会使用。不过链表还是会出现在各种算法题中。

链表 link list

单链表
- 逆转链表： leetcode 206
双链表
循环单链表

字符串 string

有一个重要的点就是字符串的匹配问题，其中比较重要的是无回溯匹配算法(KMP算法)，算法比较复杂，重要的思想在于匹配过程中不回溯。实际复杂度是O(m+n), m和n分别是匹配模式串和目标串，一般m<<n。

通配符 *和?
- * 匹配任意一个字符串
- ？匹配任意一个字符
正则表达式：内容很多，这里就不讲了
- 原始字符串：在字符串前面加r前缀,\不作为转义符

栈 stack

队列 queue

python3有内置的实现模块

二叉树

基本概念：路径，长度，层数。都比较好理解。
root的层数为0。
二叉树的性质：

性质6.1：在非空二叉树第i层中最多有2^i个节点
性质6.2：高度为h的二叉树最多有2^(h+1)-1个节点
性质6.2：对于任何非空二叉树，如果其叶节点的个数为n0,度数为2的节点个数为n2,那么n0=n2+1
满二叉树：所有分支节点的度数都是2
性质6.4: 满二叉树的叶节点比分支节点多一个
扩充二叉树：把一个二叉树的所有节点变成度数为2的节点（就是这棵树长了一圈叶子），旧节点叫内部节点，新节点叫外部节点。
性质6.5：扩充二叉树的外部路径长度叫E, 内部路径长度叫I, n是内部节点数量， E=I+2*n
完全二叉树：0-(h-1)层的节点都满，并且最后一层的节点都在左边。
性质6.6：完全二叉树节点数为n，则高度h=floor(log2n)
性质6.7：完全二叉树节点数为n, 并从0开始编号（按层次按左右）
- root的编号是0
- i的父节点是floor((i-1)/2)
- if 2i+1<n, 则其left child: 2i+1 else 无left child
- if 2i+2<n, 则其right chiild: 2i +2 else 无right child
  完全二叉树到线性结构有自然的双向映射
深度优先遍历 depth first traversal, depth first search, DFS
- 先根序遍历DLR
- 中根序遍历LDR
- 后根序遍历LRD
宽度(广度)优先遍历, Breadth First Search, BFS：实现BFS一般要用到一个队列

先根序DFT

def preorder(t, proc):
    if not t:
        return None
    proc(t.val)
    preorder(t.left)
    preorder(t.right)

广度优先遍历 BFS

def levelorder(t, proc_):
    q = Queue()
    q.put(t)
    while not q.empty():
        n = q.get()
        if not n:
            continue
        q.put(n.left)
        q.put(n.right)
        proc_(n.val)

合并两个二叉树：leetcode 617

堆：一个完全二叉树，并且，任意一个节点存放的数据先于其子节点的数据

小顶堆大顶堆
堆和完全二叉树

堆+一个元素 ->完全二叉树
堆去掉root 生成两个堆
上面得到的两个堆+新的root -> 完全二叉树
堆去掉最后一个节点，还是堆
堆可以用来构建优先队列(py3已经实现了)
由堆实现的优先队列，创建的时间复杂度是O(n)，插入和弹出是O(logn)
堆还可以用来排序

heap sort python实现

def heap_sort(nums_):
    def siftdown(nums_i, e, begin, end):
        i = begin
        j = begin*2+1
        while j < end:
            if j + 1 < end and nums_i[j+1] < nums_i[j]:
                j += 1
            if e < nums_i[j]:
                break
            nums_i[i] = nums_i[j]
            i = j
            j = 2*j+1
        nums_i[i] = e

    end = len(nums_)
    for k in range(end//2, -1, -1):
        siftdown(nums_, nums_[k], k, end)
    for k in range((end-1), 0, -1):
        e = nums_[k]
        nums_[k] = nums_[0]
        siftdown(nums_, e, 0, k)
    return nums_[::-1]

heap sort c++实现序列是数组
c++堆排序

排序算法 sort algorithm

内排序：在内存上排序
外排序
归并是外排序的基础
原地排序算法：空间复杂度为O(1)

稳定性
就是原序列里有一些Key一样的元素，排序之后能否保持不改变这部分序列的相对顺序。
比如key-value pair，按照key 排序：
(0, 100), (1, 50), (1, 60), (1, 45), (-2, 80)
希望排序之后(1, 50), (1, 60), (1, 45)这三个元素的相对位置不变。

适应性
如果一个排序算法对接近有序的序列工作的更快，就称这种算法具有适应性。

也就是说，如果本来已经快排序完了，还差一点，那么算法是能够利用这种优势迅速完成剩下的工作，还是推倒重来，按照原本既定的方法重新排序。

9.2 简单排序算法

插入排序：已经有一个排序完的序列，从剩余序列中顺序拿出一个跟前面的序列挨个比较，寻找合适的位置插入。用于链表不错
选择排序：
- 简单选择排序：每次找到最小的元素放在最前面
- 直接选择排序算法：把找到的最小元素和已排序序列后面的元素交换位置。是一个非常烂的算法。别用。
- 堆排序：堆排序的问题是不稳定
交换排序
- 冒泡排序
- 交错排序：从左向右扫描一遍，从右向左再扫描一遍