判断一个字符串中的字符是否唯一（只用基本数据结构）

最新推荐文章于 2022-07-22 23:40:56 发布

阿布哥

最新推荐文章于 2022-07-22 23:40:56 发布

阅读量1k

点赞数

分类专栏：笔试题基础知识积累 java相关

基础知识积累同时被 3 个专栏收录

56 篇文章 0 订阅

订阅专栏

java相关

43 篇文章 0 订阅

订阅专栏

笔试题

23 篇文章 0 订阅

订阅专栏

题目

原文：

Implement an algorithm to determine if a string has all unique characters. What if you can not use additional data structures?

译文：

实现一个算法来判断一个字符串中的字符是否唯一(即没有重复).不能使用额外的数据结构。 (即只使用基本的数据结构)

解答

首先，你可以问面试官，构成字符串的字符集有多大？是ASCII字符，还是只是26个字母？ 还是有更大的字符集，对于不同的情况，我们可能会有不同的解决方案。

如果我们假设字符集是ASCII字符，那么我们可以开一个大小为256的bool数组来表征每个字 符的出现。数组初始化为false，遍历一遍字符串中的字符，当bool数组对应位置的值为真， 表明该字符在之前已经出现过，即可得出该字符串中有重复字符。否则将该位置的bool数组 值置为true。代码如下：

bool isUnique1(string s)
{
    bool a[256];
    memset(a, 0, sizeof(a));
    int len = s.length();
    for(int i=0; i < len; ++i)
    {
        int v = (int)s[i];
        if(a[v]) return false;
        a[v] = true;
    }
    return true;
}
该算法的时间复杂度为O(n)。我们还可以通过位运算来减少空间的使用量。 用每一位表征相应位置字符的出现。对于ASCII字符，我们需要256位，即一个长度为8的int 数组a即可。这里的关键是要把字符对应的数字，映射到正确的位上去。比如字符'b'对应的 代码是98，那么我们应该将数组中的哪一位置为1呢？用98除以32，得到对应数组a的下标： 3。98对32取模得到相应的位：2。相应代码如下：


bool isUnique2(string s)
{
    int a[8];
    memset(a, 0, sizeof(a));
    int len = s.length();
    for(int i=0; i < len; ++i)
    {
        int v = (int)s[i];
        int idx = v/32, shift=v%32;
        if(a[idx] & (1 << shift)) return false;
        a[idx] |= (1 << shift);
    }
    return true;
}
两个算法的本质其实是一样的，只不过一个用bool单元来表征字符出现，一个用位来表征。

完整代码如下：

#include <iostream>
#include <cstring>
using namespace std;

bool isUnique1(string s)
{
    bool a[256];
    memset(a, 0, sizeof(a));
    int len = s.length();
    for(int i=0; i < len; ++i)
    {
        int v = (int)s[i];
        if(a[v]) return false;
        a[v] = true;
    }
    return true;
}

bool isUnique2(string s)
{
    int a[8];
    memset(a, 0, sizeof(a));
    int len = s.length();
    for(int i=0; i < len; ++i)
    {
        int v = (int)s[i];
        int idx = v/32, shift=v%32;
        if(a[idx] & (1 << shift)) return false;
        a[idx] |= (1 << shift);
    }
    return true;
}
int main()
{
    string s1 = "i am hawstein.";
    string s2 = "abcdefghijklmnopqrstuvwxyzABCD1234567890";
    cout << isUnique1(s1) << " " << isUnique1(s2) << endl;
    cout << isUnique2(s1) << " " << isUnique2(s2) << endl;
    return 0;
}

如果字符集只是a－z(或是A－Z)，那就更好办了，用位运算只需要一个整型数即可。
bool isUnique3(string s)
{
    int check = 0;
    int len = s.length();
    for(int i=0; i < len; ++i)
    {
        int v = (int)(s[i]-'a');
        if(check & (1 << v)) return false;
        check |= (1 << v);
    }
    return true;
}


PS：

1. “对于ASCII字符，我们需要256位，即一个长度为8的int 数组a即可。这里的关键是要把字符对应的数字，映射到正确的位上去。”这里如何对应呢？为什么要除以和模32？32是怎么来的？

  看机器：如果是32位操作系统，则一个变量空间int是32位。ASCII字符有256种，用int的每一位表征相应位置字符是否出现，故需要256/32=8个int变量。

2.a[idx]下标是否需要减1？

是不需要的，例如254=7*32+30，即ASCII码为254的字符是保存在a[7]的第30位的，而不是a[8],所以下标是不需要减1的。

3.位运算：


位运算是指按二进制进行的运算。在系统软件中，常常需要处理二进制位的问题。C语言提供了6个位操作

运算符。这些运算符只能用于整型操作数，即只能用于带符号或无符号的char,short,int与long类型。
C语言提供的位运算符列表：
运算符 含义 描述
& 按位与 如果两个相应的二进制位都为1，则该位的结果值为1，否则为0
| 按位或 两个相应的二进制位中只要有一个为1，该位的结果值为1
^ 按位异或 若参加运算的两个二进制位值相同则为0，否则为1
~ 取反 ~是一元运算符，用来对一个二进制数按位取反，即将0变1，将1变0
<< 左移 用来将一个数的各二进制位全部左移N位，右补0
>> 右移 将一个数的各二进制位右移N位，移到右端的低位被舍弃，对于无符号数，高位补0

所以此处的左移运算 1 << shift 是将1左移shift位，右补0；意思就是若某字符出现，即通过移位操作将int数组中表示该字符的位置为1，当该字符再次出现时，通过相与则会出现非0结果；如果没有出现过，通过或操作则保存了出现过的字符相应的位。

阿布哥

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
判断一个字符串中的字符是否唯一（只用基本数据结构）

算法练习：判断一个字符串中的字符是否唯一（只用基本数据结构）view sourceprint?001package codinginterview;002 003/**004 *005 * 实现一个算法来判断一个字符串中的字符是否唯一(即没有重复).006 * 不能使用额外的数据结构。 (即只使用基本的数据结构)007 * @author mingdong.che
复制链接

扫一扫