《算法图解》学习笔记—第11章 10种算法简介

本文链接：https://blog.csdn.net/weixin_38615776/article/details/118310467

前言

罗列了一些以后可能会用到的算法，并简单介绍了一下，以后具体用到的时候再详细学习。

1. 树

二叉查找树（binary search tree），一种数据结构。

对于其中的每个节点，左子节点的值都比它小，而右子节点的值都比它大。
在这里插入图片描述
假设你要查找Maggie。为此，你首先检查根节点。

Maggie排在David的后面，因此你往右边找。
在这里插入图片描述

查找过程跟二分查找一样。在二叉查找树中查找节点时，平均运行时间为O( $l o g n$ )，但在最糟的情况下所需时间为O( $n$ )；而在有序数组中查找时，即便是在最糟情况下所需的时间也只有O( $l o g n$ )，因此你可能认为有序数组比二叉查找树更佳。然而，二叉查找树的插入和删除操作的速度要快得多。
在这里插入图片描述
二叉查找树也存在一些缺点，例如，不能随机访问某个元素。有处于平衡状态和不平衡状态的二叉查找树。

可以研究一下其他树相关的数据结构：B树，红黑树，堆，伸展树。

2. 反向索引

反向索引（inverted index) 也是一种数据结构，常用于创建搜索引擎。
搜索包含指定单词的页面，利用一个散列表，将单词映射到包含它的页面，这种数据结构被称为反向索引。
在这里插入图片描述

3. 傅里叶变换

傅里叶变换（Fourier transform）是一种线性的积分变换。傅里叶就是一种变换，从时间到频率的变化或其相互转化。

4. 并行算法

为提高算法的速度，你需要让它们能够在多个内核中并行地执行！

在最佳情况下，排序算法的速度大致为O( $n l o g n$ )。众所周知，对数组进行排序时，除非使用并行算法，否则运行时间不可能为O( $n$ )！对数组进行排序时，快速排序的并行版本所需的时间为O( $n$ )。

并行算法设计起来很难，要确保它们能够正确地工作并实现期望的速度提升也很难。有一点是确定的，那就是速度的提升并非线性的，因此即便你的笔记本电脑装备了两个而不是一个内核，算法的速度也不可能提高一倍，其中的原因有两个:

并行性管理开销。假设你要对一个包含1000个元素的数组进行排序，如何在两个内核之间分配这项任务呢？如果让每个内核对其中500个元素进行排序，再将两个排好序的数组合并成一个有序数组，那么合并也是需要时间的。
负载均衡。假设你需要完成10个任务，因此你给每个内核都分配5个任务。但分配给内核A的任务都很容易，10秒钟就完成了，而分配给内核B的任务都很难，1分钟才完成。这意味着有那么50秒，内核B在忙死忙活，而内核A却闲得很！你如何均匀地分配工作，让两个内核都一样忙呢？

要改善性能和可扩展性，并行算法可能是不错的选择！