左式堆(leftist heap)

堆合并

堆合并是指,对于任意两个堆,将其合并为一个更大的堆,如下图所示:

heap_merge

为了解决这个问题,我们可以首先进行一些初步的尝试。

简明的插入策略

最简明的思路,无非是将一个堆中的元素,逐个删除并且依次插入到另一个堆中。不妨设两个堆的规模分别为mn,则这种策略的时间复杂度为O(m * (logm + log(m + n))) = O(m * log(m + n))

Floyd批量建堆算法

简明的插入策略的时间复杂度是在是太差,实际上,我们可以将这m + n个元素组织成一个向量,使用Floyd建堆算法,其时间复杂度为O(m +n )

实际上,Floyd建堆算法对于任意一组输入数据都可以达到线性的时间复杂度,但是这里的输入并非是【任意】的输入,而是两个堆,它们在内部都是满足堆序性质的。因此我们期望这种预先满足的堆序性质得到利用,从而在一定程度上得到一个更高效率的堆合并算法。

一种递归策略

下面给出一种递归地进行堆合并的策略——设两个堆分别为AB,并且保证A堆的堆顶大于B堆的堆顶,为了将AB两个堆合并,只需要取出A的右子树,将A的右子树与B进行合并,并且将合并后的堆重新作为A的右子树。而为了将A的右子树与B合并,只需要递归地进行上述的策略即可。

这种策略的正确性是显然的,一次这样的操作后,合并后的堆,其堆序性质仍然得到满足。通过不断地取堆的右子树,递归问题的规模不断减小,直到平凡的情况,即A的右子树为空,此时直接将B堆连接到A的右子树即可,因此该算法是有穷的。

对该算法进行进一步分析,在最坏的情况下,需要不断穷举AB的右子树,直到两个堆的规模都只有1,因此在最坏情况下, 该算法需要进行rh1 + rh2次递归,其中rh1rh2分别表示两个堆的最右侧路径长度。

为了快速地取出堆的右子树,以及将某棵树连接到一个节点上,这里应该抛弃前面在完全二叉堆采用的向量结构,而是采用二叉树来作为堆的底层结构,此时每次递归的时间复杂度都是O(1),因此整体的时间复杂度为O(rh1 + rh2)。可见,为了获得更好的性能,就应该尽量减少堆的最右侧路径长度,左式堆就是这样的一种结构。

左式堆的概念

首先需要引入空节点路径长度的概念——对任意一棵二叉树,引入所有的外部节点,则任意节点的空节点路径长度(npl, null path length),定义为该节点到外部节点的最短距离,外部节点的npl定义为零,即npl(null) = 0

因此,任意内部节点x的空节点路径长度,取决于其左右节点中npl的更小者,即

npl(x) = MIN(npl(lc(x)), npl(rc(x))) + 1;

对于左式堆中的任一节点,都满足其左孩子的npl值,不小于右孩子的npl值,即左倾性

npl(lc(x)) >= npl(rc(x));

根据npl的定义,左式堆中的任一节点的npl都唯一地取决于它的右孩子,即

npl(x) = npl(rc(x)) + 1;

这样,对于左式堆的根节点,其npl等于其右子树的npl加一,而它的右子树的npl,又等于它的右子树的右子树的npl加一,即

npl(root) = npl(rc(root)) + 1 = npl(rc(rc(root))) + 2 = ... = right path length

因此,根节点的外部路径长度npl,就等于最右侧路径长度。左式堆的一个实例如下图所示:

leftist_heap

而让我们再回顾一下npl的定义,即任一节点到外部节点路径的最短距离,因此根节点到外部节点的最短路径,就是左式堆的最右侧路径。设最右侧路径的长度为d,左式堆中一定包含了以d为高度的一棵满子树,因此左式堆的全部节点数量(包括外部节点)n一定满足

n ≥ 2 d + 1 − 1 n \ge 2^{d + 1} - 1 n2d+11

反过来,即d一定满足

d ≤ l o g 2 n + 1 = O ( l o g n ) d \le log_2^{n + 1} = O(logn) dlog2n+1=O(logn)

左式堆的该性质如下图所示:

在这里插入图片描述

在这样的条件下,我们上面给出的合并算法,其时间复杂度就只有O(logm + logn)了,这无疑是对性能的一次极大改进。但是需要注意的是,左式堆只是保证最右侧路径的长度最小,并非左子堆的规模和高度一定会大于右子堆。

左式堆的实现

左式堆仍然是优先级队列的一种实现方式,因此要实现左式堆,仍然只需要实现优先级队列的几个抽象函数接口,即getMaxinsertdelMax。其中getMax的实现只需取出左式堆的根节点即可,与完全二叉堆的实现相同,在这里不再赘述。

需要指出的是,左式堆的insert接口与delMax接口,都可以借助左式堆的merge算法快速的实现。对于insert接口,无非将一个规模为1的左式堆,与当前的左式堆进行合并,其代码如下:

template <typename K, typename V>
void LeftHeap<K, V>::insert(entry<K, V> e){
	BinNodePosi(T) newNode = new BinNode<T>(e);
	newNode->npl = 1;
	__root = merge(__root, newNode);
	__root->parent = nullptr;
	++__size;
}

而左式堆的delMax函数,无非是在删除了根节点以后,将根节点的两个左子堆进行合并,利用merge也可以方便地实现:

template <typename K, typename V>
entry<K, V> LeftHeap<K, V>::delMax(){
	entry<K, V> res = getMax();
	__root = merge(__root->leftChild, __root->rightChild);
	if (__root) __root->parent = nullptr;
	--__size;
	return res;
}

因此,问题的关键就在于左式堆的merge函数,该函数基本按照我们上面提到过的策略进行,只是需要做一些细节上的修改。无论是在insert还是delMax操作的过程中,都需要动态地维护左式堆的结构,即每次将合并后的堆作为右子树插入到当前节点后,都需要对当前节点的左倾性进行检查,一旦发现左子树的npl小于右子树,则将左右子树交换。merge函数的实现如下:

#define T entry<K, V>

template<typename K, typename V>
BinNodePosi(T) merge(BinNodePosi(T) a, BinNodePosi(T) b){
	if (a == nullptr) return b;
	if (b == nullptr) return a;
	BinNodePosi(T) temp;
	if (a->data < b->data){//swap a and b
		temp = a;
		a = b;
		b = temp;
	}
	if (a->rightChild == nullptr) a->rightChild = b;
	else a->rightChild = merge(a->rightChild, b);
	a->rightChild->parent = a;

	if (NPL(a->leftChild) < NPL(a->rightChild)) {// swap the right chlid and left child of a
		temp = a->leftChild;
		a->leftChild = a->rightChild;
		a->rightChild = temp;
	}
	a->npl = NPL(a->rightChild) + 1;
	return a;
}

根据前面的分析,merge的时间复杂度为O(logn),无论是在insert还是delMax中,调用merge函数以外的操作都可以在O(1)时间内完成,因此两个操作的性能都是O(logn)

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值