题目:在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”,则输出“b”。
最直观的想法自然是从头到尾扫描这个字符串中的每个字符,当访问到某字符时拿这个字符和后面的每个字符相比较,如果在后面未发现重复的字符,则该字符就是只出现一次的字符。
一如文章开头所说,算法并不单独构成算法,连同其时间复杂度分析共同构成算法。
如果字符串有
n
个字符,第
由于题目与字符出现的次数相关,我们是不是可以统计每个字符在该字符串中出现的次数?(次数统计是一件时间复杂度为 O(n) 的事)。要达到这一目的,我们需要一个数据容器来存放每个字符出的出现次数。在这个数据容器中可以根据字符来查找其出现的次数,也就是这个容器的作用是把一个字符映射为一个数字(其在字符串中出现的次数),在常用的数据容器中,哈希表正是这一用途。
为了解决这一问题,我们可以定义哈希表的键(Key)是字符,而值(Value)为该字符出现的次数。同时,我们还需要扫描字符串两次。
- (1)第一次扫描字符串,是为了建立每一个字符的统计计数,也即是为了建表。
- (2)第二次扫描是为了找到出现次数符合要求的字符并返回,也即是为了查表。
哈希表是一种比较复杂的数据结构,并且 C++ 的标准模板库(STL)中并没有实现哈希表。接下来我们要考虑的问题是如何实现哈希表。由于本题的特性,我们只需一个非常简单的哈希表即可满足需求。字符(char)是一个长度为 8 的数据类型,因此总共有 256 种可能。于是我们创建一个长度为 256 的数组,每个字母根据其 ASCII 码值作为数组的下标对应数组的一个数字,而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为 256,以字符 ASCII 码(类型转换)为键值的哈希表。
char FirstNotRepeatingChar(char* pStr)
{
if (pStr == NULL)
return '\0';
unsigned int hashTable[256] = {0};
char* pHashStr = pStr;
while (*pHashStr != '\0')
++hashTable[*pHashStr++];
pHashStr = pStr;
while (*pHashStr != '\0')
{
if (hashTable[*pHashStr] == 1)
return *pHashStr;
++pHashStr;
}
return '\0';
}
举一反三
以下的俩个问题,主要改变的是第二次扫描(也即查表的过程)
(1)第一个出现两次的字符,以及出现 k <script type="math/tex" id="MathJax-Element-2034">k</script> 次的字符
while (*pHashStr == k) ...
(2)出现最多次的字符
unsigned int maxTimes = 0; char maxTimesChar = '\0'; while (*pHashStr != '\0') { if (maxTimes < hashTable[*pHashStr]) { maxTimes = hashTable[*pHashTable]; maxTimesChar = *pHashTable; } ++pHashTable; } return maxTimesChar;