二分搜索树

数组、栈、队列、链表都是线性结构,树则是另外一种极其重要的数据结构。

树的种类有很多种,我们先从简单的 二分搜索树 开始树的学习。

二分查找法

二分查找法定义

一种在有序数组中查找某一特定元素的搜索算法。

搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;

如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。

如果在某一步骤数组为空,则代表找不到。

这种搜索算法每一次比较都使搜索范围缩小一半。

动画演示

在这里插入图片描述

动画说明

注意:二分查找的前提是数列必须是有序的。

目标是搜索数字 5

首先,检查有序数列中心的数字,这里查找到时数字 4

4 与 将要搜索的数字 5 进行比较,由于 4 小于 5,图中可以发现 5 在 4 的右边

这时,就不需要观察 4 左边的数字了,置灰删除掉

检查剩余有序数列中心的数字,这时是 5

找到了这个数字

二叉查找树(Binary Search Tree)基础

二叉查找树也可叫做二分查找树。

它不仅可以查找数据,还可以高效地插入、删除数据。

特点:每个节点的key值大于左子节点,小于右子节点。

注意它不一定是完全的二叉树。

在这里插入图片描述

class Node { E e; Node left; // 左孩子 Node right; // 右孩子}
二叉查找树有两个属性:

  1. 所有节点都比左子树中的节点大
  2. 所有节点都小于右子树中的节点

通过这两个属性,可以推断出以下结论:

  1. 二叉查找树最小的节点位于最顶端节点的最左边子树行的末尾(如图数字 3 )
  2. 二叉查找树的最大节点位于最顶端节点的最右边的子树行的末尾(如图数字 28 )

通过以下方式的进行添加元素与删除元素的操作,可以保留二叉查找树的完整性。

我们通过两组添加元素,三组删除元素,一组查找元素的操作来理解二叉查找树的属性性质。

添加元素操作

在这里插入图片描述

核心思想:从根节点开始找插入的位置,满足二叉搜索树的特性,比左子节点大,比右子节点小.

步骤:

从根节点开始,先比较当前节点,如果当前节点为null那么就插入到这个节点。

如果上面的节点不是null,那么和当前节点比较,如果小于节点就往左子树放,如果大于节点就往右子树放。

然后分别对左子树或者右子树递归的递归进行如上 1 、 2 步骤的操作

添加元素 1

从二叉查找树的最顶端节点开始,去找到附加节点的正确位置

由于 1 < 15 , 向左走

1 < 9 ,继续向左走

1 < 3,继续向左走,但因为没有节点在其后序前方,因此将它作为一个新节点进行添加

添加元素 4

同样的从二叉查找树的最顶端节点开始,去找到附加节点的正确位置

由于 4 < 15 , 向左走

4 < 9 ,继续向左走

4 > 3,向右走

4 < 8,向左走,但因为没有节点在其后序前方,因此将它作为一个新节点进行添加

代码实现

在这里插入图片描述

删除元素操作

在这里插入图片描述

步骤:

  1. 找到左子树中找左子树中所有节点的最大的节点
  2. 将这个节点赋值到删除节点的位置

删除元素 28

该节点没有子类,直接删除

删除元素 8

该节点有1个子类

目标节点被删除,将子节点移动到已删除节点的位置

删除元素 9

该节点有2个子类

目标节点被删除,从删除节点的左子树中找到最大的节点,将其移到到删除的节点的位置

代码实现

在这里插入图片描述

查找元素操作

在这里插入图片描述

在这里插入图片描述

查找元素 12

同样的,从二叉查找树的最顶端节点开始搜索

12 < 15 ,向左走

12 > 4 ,向右走

找到 12

代码实现

在这里插入图片描述

可以看出,使用二叉查找树可以实现高效搜索。

在这里插入图片描述

但是如果树接近形成直线,那么搜索效率将极其差,变成了线性搜索。

因此二叉查找树就需要进行改进为平衡二叉树,比较常见的 Balanced Binary Tree有:

红黑树

tree

AVL tree

Splay tree

Treap

二分搜索树的遍历
遍历(Traversal)是指沿着某条搜索路线,依次对树中每个结点均做一次且仅做一次访问。二叉树的遍历有三种:

  1. 前序遍历(Preorder Traversal):先访问当前节点,再依次递归访问左右子树
  2. 中序遍历(Inorder Traversal):先递归访问左子树,再访问自身,再递归访问右子树
  3. 后序遍历(Postorder Traversal):先递归访问左右子树,最后再访问当前节点。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

欢迎观这两个公众号,我觉得讲的还是很好的, 而且不像其他的公众号那样各种套路。

在这里插入图片描述

在这里插入图片描述
最后再多介绍两个概念吧。。
卡特兰数与二叉树
看一个例子:
某二叉树共有4个结点,前序(先根序)遍历该二叉树的4个结点并记录各结点取值,得到的结果是“abcd”。那么,该二叉树有多少种可能的拓扑结构?()

14

链接:https://www.nowcoder.com/questionTerminal/d3b5af97cd90455facb7b6f1cdf634ad
来源:牛客网

递推公式:
递推时每次固定根节点再考虑
规定f(0)=1
f(n) = f(n-1)f(0) + f(n-2)f(1)…f(0)f(n-1)
解:
f(1) = 1
f(2) = f(1)f(0) + f(0)f(1) = 2
f(3) = f(2)f(0) + f(1)f(1) + f(0)f(2) = 5
f(4) = f(3)f(0) + f(2)f(1) + f(1)f(2) + f(0)f(3) = 14
不要被先序遍历迷惑,其实就是4个结点的二叉树有多少种
典型的卡特兰数应用。n个节点的二叉树一共有((2n)!)/(n!*(n+1)!)种 。

余弦相似度:
词袋模型向量每一个值对应词汇出现的次数
cos θ = A·B / |A||B|
可见,AC是cos值最大的。
相似性范围从-1到1:-1意味着两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0通常表示它们之间是独立的。

import numpy as np
 
vector1 = np.array([1,2,0,2,0])
vector2 = np.array([0,3,0,1,3])
vector3 = np.array([0,2,0,2,1])
  
op12=np.dot(vector1,vector2)/(np.linalg.norm(vector1)*(np.linalg.norm(vector2)))
print(op12)
op13=np.dot(vector1,vector3)/(np.linalg.norm(vector1)*(np.linalg.norm(vector3)))
print(op13)
op23=np.dot(vector3,vector2)/(np.linalg.norm(vector3)*(np.linalg.norm(vector2)))
print(op23)

推荐阅读
一张大尺度美女图,竟然推进了图片算法的进步。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值