C++ 实现并查集结构

KamikazePilot

已于 2022-12-23 17:28:44 修改

阅读量417

点赞数 6

分类专栏：数据结构和算法 C++ 文章标签： leetcode c++ 数据结构

于 2022-12-23 00:47:42 首次发布

本文链接：https://blog.csdn.net/KamikazePilot/article/details/128414742

版权

C++ 同时被 2 个专栏收录

22 篇文章 1 订阅

订阅专栏

数据结构和算法

17 篇文章 0 订阅

订阅专栏

前言

并查集一般用于多元素，多集合的查找问题；
听说很有用，但是平时好像确实没有怎么见过。。
leetcode典型例题：岛屿数量

一、原理

其实并查集的每个小集合就是一张有向图，只不过是所有子节点指向父节点的图结构。

他之所以能够高效的合并和查找，是因为它在查找过程中，一直在动态更改所有走过节点的父节点。

主要结构：

这里先定义一个节点结构：

template<class T>
class EleNode
{
public:
	T value;
	EleNode<T>* father;
	EleNode(T val)
	{
		value = val;
		father = nullptr;
	}
};

该节点结构非常类似于链表
只不过它里面存的指针指向自己的爸爸

主结构中：

nodeMap根据用户数据存储对应节点数据，所有被创建出来的节点都被存放在里面
numMap仅用于记录该集合的元素数量（只记录头部元素，因为这个数据只需要一条）
void createNode(T val)函数中，创建节点需要在nodeMap和numMap中初始化

template<class T>
class UnionFindSet
{
	//节点记录
	unordered_map<T, EleNode<T>*> nodeMap;
	//元素集数量记录
	unordered_map<EleNode<T>*, int> numMap;
public:
	UnionFindSet(){}
	//构造函数
	UnionFindSet(const vector<T>& list)
	{
		for (int i = 0; i < list.size(); i++)
		{
			createNode(list[i]);
		}
	}
	//销毁节点
	~UnionFindSet()
	{
		for (auto ele : nodeMap)
		{
			delete ele.second;
		}
	}

	// 新建一个节点
	void createNode(T val)
	{
		if (nodeMap.find(val) != nodeMap.end()) return;
		EleNode<T>* newNode = new EleNode<T>(val);
		nodeMap.insert(make_pair(val, newNode));
		numMap.insert(make_pair(newNode, 1));
	}
}

主要方法：

有三个方法，分别为：

// 判断是否在同个集合中
bool isSameSet(const T& v1, const T& v2);
// 执行联合，即合并节点
void doUnion(EleNode<T>* t1, EleNode<T>* t2);
//找头节点
EleNode<T>* findHead(EleNode<T>* node);

判断是否在同个集合中
判断两个节点的头节点是不是同一个。
为啥要找到头节点？
其实根据刚才的那张图就很显而易见

如果两个节点在同一个集合中，那么他们两个一直执行查找父亲的操作；最后绝对能找到同一个头节点
如果两个节点不在同集合中，那么执行该操作过后；最后绝对找到不同的头节点

	// 是否为同个集合
	bool isSameSet(const T& v1, const T& v2)
	{
		assert(nodeMap.find(v1) != nodeMap.end() && nodeMap.find(v2) != nodeMap.end());
		return findHead(nodeMap[v1]) == findHead(nodeMap[v2]);
	}

合并节点

将节点数量较小的那个集合，它的头部节点的指针指向节点数量较大集合的头节点。
这实际上也是两个图结构的合并。至于为啥要选出节点少的一边，这个跟并查集的优化逻辑有关，放在下面的方法说。

1> 首先判断他们是否已经在同个集合中，在同集合中就跳出。
2> 再分别找到他们两个的集合数量中的较大值和较小值
3> 将数量较小的一方并入数量较大的一方，通过将较小集合头节点的father指向改为较大集合头部
4> 更新集合数量值
在这里插入图片描述

比如上图中，用户输入2和4时，应该怎么操作？
实际上就是直接将1号指针指向3号。
改完以后：

	// 执行联合
	void doUnion(EleNode<T>* t1, EleNode<T>* t2)
	{
		// 判断头节点并保存
		EleNode<T>* head1 = findHead(t1);
		EleNode<T>* head2 = findHead(t2);
		if (head1 == head2) return;

		//找较大较小集合
		EleNode<T>* big = numMap[head1] >= numMap[head2] ? head1 : head2;
		EleNode<T>* small = numMap[head1] >= numMap[head2] ? head2 : head1;
		//改头
		small->father = big;
		//数值更新
		numMap[big] = numMap[big] + numMap[small];
		numMap.erase(small);
	}
public:
	// 执行联合外部接口
	void doUnion(const T& v1, const T& v2)
	{
		assert(nodeMap.find(v1) != nodeMap.end() && nodeMap.find(v2) != nodeMap.end());
		doUnion(nodeMap[v1], nodeMap[v2]);
	}

找头节点

找头节点的操作不仅仅是找到头部，还包含了一个重要的优化
这个优化就是将所有走过的，非头节点全部直接连在头结点上
并查集中，一个集合(图)最理想的状态就是所有子节点全部直接指向头节点，这种情况下，从子节点向上寻找头节点的代价是O(1)

例：从2位置开始，找到集合头部
在这里插入图片描述
执行后：

此时集合内节点数量未改变不需要调整，只需要调整结构即可

下面的函数中，将所有走过的路径全部压入栈内，并在找到头节点后，挨个将他的父亲改为头节点，最后返回头部。

//找头
	EleNode<T>* findHead(EleNode<T>* node)
	{
		stack<EleNode<T>*> path;
		while (node->father != nullptr)
		{
			path.push(node);
			node = node->father;
		}
		while (!path.empty())
		{
			path.top()->father = node;
			path.pop();
		}
		return node;
	}

二、全部代码

#include<vector>
#include<stack>
#include<unordered_map>
#include<iostream>
#include<cassert>
using namespace std;

template<class T>
class EleNode
{
public:
	T value;
	EleNode<T>* father;
	EleNode(T val)
	{
		value = val;
		father = nullptr;
	}
};

template<class T>
class UnionFindSet
{
	//节点记录
	unordered_map<T, EleNode<T>*> nodeMap;
	//元素集数量记录
	unordered_map<EleNode<T>*, int> numMap;

	//找头
	EleNode<T>* findHead(EleNode<T>* node)
	{
		stack<EleNode<T>*> path;
		while (node->father != nullptr)
		{
			path.push(node);
			node = node->father;
		}
		while (!path.empty())
		{
			path.top()->father = node;
			path.pop();
		}
		return node;
	}

	// 执行联合
	void doUnion(EleNode<T>* t1, EleNode<T>* t2)
	{
		EleNode<T>* head1 = findHead(t1);
		EleNode<T>* head2 = findHead(t2);
		if (head1 == head2) return;

		//合并
		EleNode<T>* big = numMap[head1] >= numMap[head2] ? head1 : head2;
		EleNode<T>* small = numMap[head1] >= numMap[head2] ? head2 : head1;
		small->father = big;
		numMap[big] = numMap[big] + numMap[small];
		numMap.erase(small);
	}
public:
	UnionFindSet(){}
	//构造函数
	UnionFindSet(const vector<T>& list)
	{
		for (int i = 0; i < list.size(); i++)
		{
			createNode(list[i]);
		}
	}
	//销毁节点
	~UnionFindSet()
	{
		for (auto ele : nodeMap)
		{
			delete ele.second;
		}
	}

	// 新建一个节点
	void createNode(T val)
	{
		if (nodeMap.find(val) != nodeMap.end()) return;
		EleNode<T>* newNode = new EleNode<T>(val);
		nodeMap.insert(make_pair(val, newNode));
		numMap.insert(make_pair(newNode, 1));
	}

	// 判断是否在同个集合中
	bool isSameSet(const T& v1, const T& v2)
	{
		assert(nodeMap.find(v1) != nodeMap.end() && nodeMap.find(v2) != nodeMap.end());
		return findHead(nodeMap[v1]) == findHead(nodeMap[v2]);
	}

	// 执行联合外部接口
	void doUnion(const T& v1, const T& v2)
	{
		assert(nodeMap.find(v1) != nodeMap.end() && nodeMap.find(v2) != nodeMap.end());
		doUnion(nodeMap[v1], nodeMap[v2]);
	}
};