《剑指Offer》学习笔记--面试题35:第一个只出现一次的字符

题目:在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”,则输出'b'。

由于这道题目与字符出现的次数相关,我们是不是可以统计每个字符在该字符串中出现的次数?要达到这个目的,我们需要一个数据容器来存放每个字符的出现次数。在这个数据容器中可以根据字符来查找它出现的次数,也就是说这个容器的作用是把一个字符映射成一个数字。在常用的数据容器中,哈希表正是这个用途。

为了解决这个问题,我们可以定义哈希表的键值(Key)是字符,而值(value)是该字符出现的次数。同时我们还需要从头开始扫面字符串两次。第一次扫描字符串时,没扫描到一个字符就在哈希表的对应项中把次数加1。接下来第二次扫描时,没扫描到一个字符就能从哈希表中得到该字符出现的次数。这样第一个只出现一次的字符就是符合要求的输出。

哈希表是一种比较复杂的数据结构,并且C++的标准模板库中没有实现哈希表。接下来我们考虑的问题就是如何实现哈希表。由于本题的特殊性,我们只需要一个非常简单的哈希表就能满足要求。字符(char)是一个长度为8的数据类型,因此总共有256种可能。于是我们创建一个长度为256的数组,每个字母根据其ASCII码值作为数组的下标对应数组的一个数字,而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256,以字符ASCII码作为键值的哈希表。

第一次扫描时,在哈希表中更新一个字符出现的次数的时间是O(1)。如何字符串长度为n,那么第一次扫描的时间复杂度是O(n)。第二次扫描时,同样O(1)能读出一个字符出现的次数,所以时间复杂度仍然是O(n)。这样算起来,总的时间复杂度是O(n)。同时,我们还需要一个包含256个字符的辅助数组,它的大小是1K。由于这个数组的大小是个常数,因此可以认为这种算法的空间复杂度是O(1)。

当我们向面试官讲述清除这个思路并得到面试官的首肯后,就可以动手写代码了。下面是一段参考代码:

char FirstNotRepeatingChar(char* pString)
{
	if(pString == NULL)
		return '\0';
	const int tableSize = 256;
	unsigned int hashTable[tableSize];
	for(unsigned int i = 0; i < tableSize; ++ i)
		hashTable[i] = 0;

	char *pHashKey = pString;
	while(*(pHashKey) != 0)
		hashTable[*(pHashKey++)]++;

	pHashKey = pString;
	while(*pHashKey != '\0'){
		if(hashTable[*pHashKey] == 1)
			return *pHashKey;

		pHashKey++;
	}

	return '\0';
}
本题扩展:

在前面的例子中,我们之所以可以把哈希表的大小设为256,是因为字符(char)是8个bit的类型,总共只有256个字符。但实际上字符不只是256个,比如中文就有几千个汉子。如果题目要求考虑汉字,前面的算法是不是有问题?如果有,可以怎么解决?

相关题目:

(1)定义一个函数,输入两个字符串,从第一个字符串中删除在第二个字符串中出现过的所有字符。例如从第一个字符串“We are students. ”删除第二个字符串"aeiou"中出现过的字符得到的结果是“W r Stdnts. ”。为了解决这个问题,我们可以创建一个用数组实现的简单哈希表来存储第二个字符串。这样我们从头到尾扫描第一个字符串的每一个字符时,用O(1)时间就能判断出该字符是不是在第二个字符中。如果第一个字符串的长度是n.那么总的时间复杂度是O(n).

(2)定义一个函数,删除字符串中所有重复出现的字符。例如输入“google”,删除重复的字符之后的结果是"gole"。这个题目和上面的问题比较类似,我们可以创建一个用布尔类型数组实现的简单的哈希表。数组中的元素的意义是其下标看做ASCII码后对应的字母在字符串中是否已经出现。我们先把数组中2的元素都设为false。以“google”为例,当扫描到第一个g时,g的ASCII码是103,那么我们把数组中下标为103的元素的值设为true。当扫描到第二个g时,我们发现数组中下标为103的元素的值是true,就知道g在前面已经出现了。也就是说,我们用O(1)时间就能判断出每个字符是否在前面出现过。如果字符串长度是n,那么总的时间复杂度是O(n)。

(3)在英语中,如果两个单词中出现的字符相同,并且每个字母出现的次数也相同,那么这两个单词互为变位词。例如silent与listen、evil与live等互为变位词。请完成一个函数,判断输入的两个字符串是不是互为变位词。请完成一个函数,判断输入的两个字符串是不是互为变位词。我们可以创建一个用数组实现的简单哈希表,用来统计字符串中每个字符出现的次数。当扫描到第一个字符串中的每个字符时,为哈希表对应的项的值增加1.接下来扫描第二个字符串,扫描到每个字符时,为哈希表对应的项的值减去1.如果扫描完第二个字符串后,哈希表中所有的值都是0,那么这两个字符串就互为变位词。

举一反三:

如果需要判断多个字符是不是在某个字符串里出现过或者统计多个字符在某个字符串中出现的次数,我们可以考虑基于数组创建一个简单的哈希表。这样可以用很小的空间消耗来换时间效率的提升。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值