哈希---开散列

最新推荐文章于 2024-03-30 10:30:30 发布

抖立FLAG

最新推荐文章于 2024-03-30 10:30:30 发布

阅读量280

点赞数

分类专栏： C++知识总结

本文链接：https://blog.csdn.net/qq_44329028/article/details/106619131

版权

C++知识总结专栏收录该内容

16 篇文章 0 订阅

订阅专栏

目录标题

上一篇讲解了关于哈希冲突的产生及其解决方式之一的闭散列。
本篇主要讲解开散列

开散列

**开散列：**开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。

在这里插入图片描述
从上图可以看出，开散列中每个桶中放的都是发生哈希冲突的元素。

开散列实现


template<class V>
struct HashBucketNode
{
	HashBucketNode(const V& data)
		: _pNext(nullptr), _data(data)
	{}
	HashBucketNode<V>* _pNext;
	V _data;
};
// 所实现的哈希桶中key是唯一的
template<class V, class HF = DefHashF<T> >
class HashBucket
{
	typedef HashBucketNode<V> Node;
	typedef Node* PNode;
public:
	HashBucket(size_t capacity = 3): _size(0)
	{ 
		_ht.resize(GetNextPrime(capacity), nullptr);
	}
// 哈希桶中的元素不能重复
PNode* Insert(const V& data)
{
// 确认是否需要扩容。。。
// _CheckCapacity();
// 1. 计算元素所在的桶号
	size_t bucketNo = HashFunc(data);
// 2. 检测该元素是否在桶中
	PNode pCur = _ht[bucketNo];
	while(pCur)
	{
		if(pCur->_data == data)
			return pCur;
		pCur = pCur->_pNext;
	}
// 3. 插入新元素
	pCur = new Node(data);
	pCur->_pNext = _ht[bucketNo];
	_ht[bucketNo] = pCur;
	_size++;
	return pCur;
}
// 删除哈希桶中为data的元素(data不会重复)，返回删除元素的下一个节点
PNode* Erase(const V& data)
{
	size_t bucketNo = HashFunc(data);
	PNode pCur = _ht[bucketNo];
	PNode pPrev = nullptr, pRet = nullptr;
	while(pCur)
	{
		if(pCur->_data == data)
		{
			if(pCur == _ht[bucketNo])
				_ht[bucketNo] = pCur->_pNext;
			else
				pPrev->_pNext = pCur->_pNext;
			pRet = pCur->_pNext;
			delete pCur;
			_size--;
		 	return pRet;
		}
	}
	return nullptr;
}
PNode* Find(const V& data);
size_t Size()const;
bool Empty()const;
void Clear();
bool BucketCount()const;
void Swap(HashBucket<V, HF>& ht;
~HashBucket();
private:
	size_t HashFunc(const V& data);
private:
	vector<PNode*> _ht;
	size_t _size; // 哈希表中有效元素的个数
}；

开散列扩容

桶的个数是一定的，随着元素的不断插入，每个桶中元素的个数不断增多，极端情况下，可能会导致一个桶中链表节点非常多，会影响的哈希表的性能，因此在一定条件下需要对哈希表进行增容，那该条件怎么确认呢？开散列最好的情况是：每个哈希桶中刚好挂一个节点，再继续插入元素时，每一次都会发生哈希冲突，因此，在元素个数刚好等于桶的个数时，可以给哈希表增容。

void _CheckCapacity()
{
	size_t bucketCount = BucketCount();
	if(_size == bucketCount)
	{
		HashBucket<V, HF> newHt(bucketCount);
		for(size_t bucketIdx = 0; bucketIdx < bucketCount; ++bucketIdx)
		{
			PNode pCur = _ht[bucketIdx];
			while(pCur)
			{
			// 将该节点从原哈希表中拆出来
				_ht[bucketIdx] = pCur->_pNext;
			// 将该节点插入到新哈希表中
				size_t bucketNo = newHt.HashFunc(pCur->_data);
				pCur->_pNext = newHt._ht[bucketNo];
				newHt._ht[bucketNo] = pCur;
				pCur = _ht[bucketIdx];
			}
		}
		newHt._size = _size;
		this->Swap(newHt);
	}
}

开散列与闭散列比较

应用链地址法处理溢出，需要增设链接指针，似乎增加了存储开销。事实上：由于开地址法必须保持大量的空闲空间以确保搜索效率，如二次探查法要求装载因子a <= 0.7，而表项所占空间又比指针大的多，所以使用链地址法反而比开地址法节省存储空间

抖立FLAG

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
哈希---开散列

目录标题开散列开散列实现开散列扩容开散列与闭散列比较上一篇讲解了关于哈希冲突的产生及其解决方式之一的闭散列。本篇主要讲解开散列开散列**开散列：**开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。从上图可以看出，开散列中每个桶中放的都是发生哈希冲突的元素。开散列实现template<class V>struct HashB
复制链接

扫一扫

专栏目录