给定一个字符串,找到它的第一个不重复的字符,并返回它的索引。如果不存在,则返回 -1。
可以假定该字符串只包含小写字母。
其实这个题也没什么可说的,是一个很简单的题目。首先第一反应肯定是用map(不管是C++的unordered_map还是Java的HashMap,或者是JS里的Map,Python里的dict,又或者是别的语言里的类似的数据结构),而且这种规定了范围的题目可以将map退化成数组来提高效率。但是根据经验来看,遇到这种和重复有关的题目,一般还会有别的解法,比如异或运算和计算ASCII码之和相减等等,比如第389题找不同。
这题相比其他的重复性题目有一个特殊性,就是有顺序要求,要找到“第一个”。且看第389题是怎么描述的:
给定两个字符串 s 和 t,它们只包含小写字母。
字符串 t 由字符串 s 随机重排,然后在随机位置添加一个字母。
请找出在 t 中被添加的字母。
389题因为没有顺序要求,只要找到这个存在的数就行,所以可以用异或来找出那个额外的字符,也可以把两个字符串逐字符相加然后计算ASCII码之差。这两种解决方案是建立在无序的基础上的。
同样地,使用map的时候也面临着顺序的问题,不是那种插入map之后直接遍历就能解决的,可能还需要维护一个结构来保持顺序。C++的STL是没有内置的这种有序的map的,Java有LinkedHashMap。
但是维护一个单独的数据结构成本比较高,就考虑复用现有的资源,然后发现原来的字符串就是一个很好的顺序结构,所以遍历原来的字符串即可。
/**
* ------result------
* memory: 13 MB (80%)
* speed: 52 ms (60%)
*/
int firstUniqChar(string s)
{
unordered_map<char, int> map;
for (const char &c : s)
{
++map[c];
}
int length = s.length();
for (int i = 0; i < length; ++i)
{
if (map[s[i]] == 1)
{
return i;
}
}
return -1;
}
这题有一个很好的特性,就是字符串限制在26个小写字母,所以可以把map退化成数组:
/**
* ------result------
* memory: 12.6 MB (96%)
* speed: 32 ms (90%)
*/
int firstUniqChar(string s)
{
int map[123] = {0};
for (const char &c : s)
{
++map[c];
}
int length = s.length();
for (int i = 0; i < length; ++i)
{
if (map[s[i]] == 1)
{
return i;
}
}
return -1;
}
这样做的效率要比map高很多。
为什么要开长度为123的数组?因为小写字母z的ASCII码是122,这样可以避免每次插入数组时的计算开销。看起来开长度为26的数组会更节省空间,但每次插入数组和读取数组都要进行一次减法计算,数据量大的时候是比较耗时的,可以从结果中看出来:
/**
* ------result------
* memory: 12.8 MB (90%)
* speed: 52 ms (60%)
*/
int firstUniqChar(string s)
{
int map[26] = {0};
for (const char &c : s)
{
++map[c - 0x61];
}
int length = s.length();
for (int i = 0; i < length; ++i)
{
if (map[s[i] - 0x61] == 1)
{
return i;
}
}
return -1;
}
另外还有一个,不要觉得数据量小就声明为char数组,可能会溢出。因为char类型只到255。上面的代码如果换成char map[123]
就会报错。因为正好有一个用例的数据是257……