(13)字符串哈希

#include <iostream>
#include <string>

using namespace std;

void TestReverseIndex();

const unsigned HASH_SIZE = 1024;
const unsigned CRYPT_SIZE = 0x100;

// 索引节点
struct KeyNode
{
	string strKey;
	int count;
	int pos;
	struct KeyNode *pNext;
};

KeyNode *hash_table[HASH_SIZE];

struct DocNode
{
	string docID;
	int classOne;
	string classTwo;
	string time;
	string MD5;
	int weight;
	struct DocNode * pNext;
};

unsigned long cryptTable[CRYPT_SIZE];
// 构造cryptTable
void PrepareCryptTable();
// 返回字符串的hash值
unsigned long HashString(const char *lpszkeyName, unsigned long dwHashType);
// 在hash表中寻找关键字,如何找到,则返回hash节点
KeyNode * SearchByString(const char * lpszkeyName);

#include "13_ReverseIndex.h"



void TestReverseIndex()
{
}

void PrepareCryptTable()
{
	unsigned long seed = 0x00100001;
	unsigned long index1, index2, i;

	for (index1 = 0; index1 < 0x001; ++index1)
	{
		for (index2 = index1, i = 0; i < 5; i++, index2 += 0x100)
		{
			unsigned long temp1, temp2;
			seed = (seed * 125 + 3) % 0x2AAAAB;
			temp1 = (seed & 0xFFFF) << 0x10;
			seed = (seed * 125 + 3) % 0x2AAAAB;
			temp2 = (seed % 0xFFFF);
			cryptTable[index2] = (temp1 | temp2);
		}
	}
}

unsigned long HashString(const char *lpszkeyName, unsigned long dwHashType)
{
	unsigned char *key = (unsigned char *)lpszkeyName;
	unsigned long seed1 = 0x7FED7FED;
	unsigned long seed2 = 0xEEEEEEEE;

	int ch;
	while (*key != 0)
	{
		ch = *key++;
		seed1 = cryptTable[(dwHashType << 8) + ch] ^ (seed1 + seed2);
		seed2 = ch + seed1 + seed2 + (seed2 << 5) + 3;
	}
	return seed1;
}

KeyNode * SearchByString(const char * lpszkeyName)
{
	const int HASH_OFFSET = 0, HASH_C = 1, HASH_D = 2;
	unsigned int nHash = HashString(lpszkeyName, HASH_OFFSET);
	unsigned int nHashC = HashString(lpszkeyName, HASH_C);
	unsigned int nHashD = HashString(lpszkeyName, HASH_D);
	unsigned int nHashStart = nHash % HASH_SIZE;
	unsigned int nHashPos = nHashStart;

}



字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用字符串哈希算法来加速字符串的比较操作。 引用\[1\]中的代码示例展示了一个使用字符串哈希算法C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。其中,哈希值的计算使用了前缀和数组和幂运算。 引用\[2\]中的解释指出,使用字符串哈希的目的是为了比较字符串时不直接比较字符串本身,而是比较它们对应映射的数字。这样可以将子串的哈希值的时间复杂度降低到O(1),从而节省时间。 引用\[3\]中的代码示例也展示了一个使用字符串哈希算法C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。与引用\[1\]中的代码类似,哈希值的计算也使用了前缀和数组和幂运算。 综上所述,字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用前缀和数组和幂运算来计算字符串哈希值,并通过比较哈希值来判断两个子串是否相等。 #### 引用[.reference_title] - *1* [C++算法题 # 33 字符串哈希](https://blog.csdn.net/weixin_44536804/article/details/123425533)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [字符串哈希(c++)](https://blog.csdn.net/qq_41829492/article/details/120980055)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [AcWing 841. 字符串哈希C++算法)](https://blog.csdn.net/YSA__/article/details/108453403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值