字符的判重--位运算

本文介绍了一道关于寻找最长无重复字符子串的编程题,通过两种不同的深度优先搜索(DFS)策略进行求解。第一种是回溯形式的DFS,第二种是二进制枚举形式的DFS。在解题过程中,利用位运算进行字符判重,有效减少了计算复杂性。同时,文章提供了详细的代码实现和解析。
摘要由CSDN通过智能技术生成

典型例题:最长无重复字符的串联字符串

在这里插入图片描述


题目解析

此题看完之后,字符相关且不能含重复字符,便能想到用位运算判重,而其中要求的是数组子序列串相连,这就很明显牵扯到组合问题,组合问题,我们可用多种方式枚举组合,可用二进制枚举组合,也可用dfs枚举,而dfs枚举也有两种形式:偏二进制的形式||回溯形式

这题由于最后要求返回一个最长的 无重复字符的字符串,则该字符串长度肯定不会超过26(毕竟也就26个小写字母)所以完全可以通过操控各个字符串的二进制序列来得到答案。

两种形式的dfs解决

dfs回溯形式

class Solution {
public:
    int maxLength(vector<string>& arr) {
//先去掉arr中有重复字符的字符串,由于字符的范围是小写字母--故ASCII差值不会超过26,故可用每一位计数用于判重
vector<int>newArr;
//由于此题最后的最大长度字符串不含重复字符,所以完全可用二进制位代替字符串来进行判重等迅速计算
        //建合要求二进制表
        for(auto &s:arr){
            int check = 0;
            for(auto &ch:s){
                int dist = ch - 'a';
                //一旦出现重复字符则直接跳出,否则继续建表
                if(check&(1<<dist))
                    goto end;
                check |= 1<<dist;
            }
            newArr.push_back(check);
            end:{}   
        }
        size = newArr.size();
dfs(newArr,0,0);
return res;
}
    
private:
int size;
int res = 0;
    int countSize(int t){
        int count = 0;
        while(t){
            t = t&(t-1);
            count++;
        }
        return count;
    }
    void dfs(vector<int>&arr,int x,int pos){
        //由于不确定取几个,每层都把res进行更新
            res = max(res,countSize(x));
        int temp = x;
        //temp回溯,让每一层只负责选择其中一个
        for(int i=pos;i<size;i++){
            if(x&arr[i])
                continue;
            x |= arr[i];
            dfs(arr,x,i+1);
            x = temp;
        }
    }
};

dfs二进制枚举形式

class Solution {
public:
    int maxLength(vector<string>& arr) {
//先去掉arr中有重复字符的字符串,由于字符的范围是小写字母--故ASCII差值不会超过26,故可用每一位计数用于判重
vector<int>newArr;
//由于此题最后的最大长度字符串不含重复字符,所以完全可用二进制位代替字符串来进行判重等迅速计算
        //建合要求二进制表
        for(auto &s:arr){
            int check = 0;
            for(auto &ch:s){
                int dist = ch - 'a';
                //一旦出现重复字符则直接跳出,否则继续建表
                if(check&(1<<dist))
                    goto end;
                check |= 1<<dist;
            }
            newArr.push_back(check);
            end:{}   
        }
        size = newArr.size();
dfs(newArr,0,0);
return res;
}
    
private:
int size;
int res = 0;
    int countSize(int t){
        int count = 0;
        while(t){
            t = t&(t-1);
            count++;
        }
        return count;
    }
    //取与不取相当于1和0,所以很像二进制枚举
    void dfs(vector<int>&arr,int x,int pos){
        //相当于取完了这一次的所有位置,即相当于取完了一个二进制串如01011
        if(pos==size){
            res = max(res,countSize(x));
            return;
        }
        //取该位元素
        if(!(x&arr[pos]))
            dfs(arr,x|arr[pos],pos+1);
        //不取该位元素,到下一位
        dfs(arr,x,pos+1);
    }
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
面试题,是纸上写的,发现了些错误,回来改进了下。写纸上和写计算机里并编译成功完全是两个效果。 开始没太多字符串操作,很繁琐、难点也多,后逐渐改进。 典型问题1: sizeof()局限于栈数组 char a[] = "asd213123123"; 形式,并且这种不能用'\0'判断是否结束(这种判断方式能很方便加在while条件中用于判断越界——b != '\0')。 如果是字符串常量: char *b = "dasadafasdf"; 这种情况,sizeof()就废掉了! 总之: 对号入座,前者sizeof、后者strlen~!不过sizeof(a)和strlen(b)还有另外一个区别,strlen不计算'\0',而sizeof要计算(前提是sizeof()不针对char指针) 典型问题2: 用什么来暂存并输出结果?还是只是记录下来相关位置——这是我底下未完成版本1想到的思路——用一个count[sizeof(A)]数组记录下A每个位置作为起点所能和B达到的最大重合,最后判断查找数组中最大值,此时目标子字符串的起点下标(i)和 i 对应的长度(counter[i])都有了。 这是针对不知道字符串大小并且不占用额外空间的做法,需要非常繁琐的操作,要加很多标记,越界判断也会有些麻烦(结合优势么,用字符串常量而不是栈空间中的字符数组,有'\0'——就好判断了!) (关于空间的占用,如果要用一个和字符串a一样长的数组counter来计录a中各起点对应与b最大重合子字符串,这个数组也要和a一样长,空间上也不合适,除非情形很特殊,a短b长,不然不如直接malloc()一个堆空间来储存当前最长“子字符串”,并实时更新) 先放一个改完编译测试成功的。 release1 //题目:要求比较A字符串(例如“abcdef"),B字符串(例如(bdcda)。找出重合度最大的子字符串,输出(根据OJ经验,输>出结果对即可) #include #include #include main(){ char *A = "abcderfghi"; char *B = "aderkkkkkabcd"; int i,j,c = 0,count = 0; unsigned int maxSeg = 0; int max = strlen(A) > strlen(B) ? strlen(A) : strlen(B); char* final = (char*)malloc(sizeof(char) * (max + 1)); final[max] = '\0'; for(i = 0;A[i] != '\0';i++){ for(j = 0;B[j] != '\0';j++){ while(A[i + c] == B[j] && A[i+c] != '\0' && B[j] != '\0'){ count++; c++; j++; }                         if(count > maxSeg){                                 strncpy(final,(A + i),count);                                 maxSeg = count;                         } count = 0; c = 0; } } printf("%s\n",final); free(final); } 这是能将就用的第一个版本~!关于结束符'\0'能否影响free()的使用,觉得是完全不用操心的,因为malloc的大小是系统来保存的,删除时候系统来接手就完了,而'\0'结束符只是针对一些常规字符串操作,比如printf()用%s控制输出时~! 新难点:找到的子字符串同时一样长怎么办?那我这只能叫做”第一个最长的重合字符串“用两块空间来存储?三
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值