两个字符串或者多个字符串中有哪些相同字符的算法

6 篇文章 0 订阅

例如当前有两个字符串String s 和String t,找出这两个字符串中含有相同的字符并返回,
算法一(效率最差的):

/**
     * 
     * @param s
     * @param t
     * @return 返回值未去重
     */
    static char []solution(char[] s,char[] t) {
        char[] chars = new char[Math.max(s.length,t.length)];
        int index = 0;
        for (int i = 0;i < s.length;i ++) {
            for (int j = 0;j < t.length;j ++) {
                if (s[i] == t[j]) {
                    chars[index ++] = s[i];
                }
            }
        }
        char[] result= new char[index];

        System.arraycopy(chars,0,result,0,index);
        return result;
    }

这种算法效率不高,复杂度为O(n2);
接下来看效率更高的算法二:

/**
     * 
     * @param s
     * @param t
     * @return 返回值未去重
     */
static char[]solution2(char[] s,char[] t) {
        HashSet<Character> set = new HashSet<>();
        char[] chars = new char[Math.max(s.length,t.length)];
        int index = 0;
        for (char c : s)
            set.add(c);
        int res = 0;
        
        for (char c : t) {
            if (!set.add(c)) {
                chars[index ++] = c;
            }
        }
        char[] result= new char[index];

        System.arraycopy(chars,0,result,0,index);
        return result;
    }

算法二巧用了HashSet数据结构,HashSet里使用HashMap实现的,add方法的返回值代表HashSet里是否有这个char值,如果有则是重复的,及找到了相同的字符,但是这还不是效率最高的,接下来看最优的算法三:

/**
     * 
     * @param s
     * @param t
     * @return 返回值未去重
     */
static char [] findRepeatCharZ(char[] s,char[] t) {
        char [] a = new char['z' - 'A' + 1];
        char[] tmp = new char['z' - 'A' + 1];
        for (char c : s) {
            a[c - 'A'] = 1;
        }
        int i = 0;
        for (char c : t) {
            if (a[c - 'A'] == 1) {
                tmp[i ++] = (c);
            }
        }
        char[] result= new char[i];

        System.arraycopy(tmp,0,result,0,i);
        return result;
    }

这个算法活用了ascii值之间的差值,在字符集s中通过计算字符在数组a中的index并将index的值设置为1,再在字符集t中计算每一个字符index查找这个index在a中对应的值是否为1,如果是1,那t中当前计算的这个字符就是两个字符集都有的相同字符;这个算法可以推倒到n个字符串中有哪些相同的字符:

/**
     * 
     * @param s
     * @param t
     * @return 返回值未去重
     */
static char [] findRepeatCharZ(char[] ...strings) {
      if (strings == null || strings.length == 0) {
            return null ;
        }
        if (strings.length == 1) {
            return strings[0];
        }
        char[] reslut = findRepeatCharZ(strings[0],strings[1]);
        for (int i = 2;i < strings.length;i ++) {
            reslut = findRepeatCharZ(reslut,strings[i]);
        }

        return reslut;
    }

这个算法也可以推倒查找重复中文汉字的算法,由于中文的范围比较广,所以占用的内存空间可能会比较大,但所有的中文个数也才数万个,也只需要几十k字节就可以了,但是可能char类型装不下所有的中文,可能需要使用int类型来作为index数组类型,算法这里就不给出了

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
面试题,是纸上写的,发现了些错误,回来改进了下。写纸上和写计算机里并编译成功完全是两个效果。 开始没太多字符串操作,很繁琐、难点也多,后逐渐改进。 典型问题1: sizeof()局限于栈数组 char a[] = "asd213123123"; 形式,并且这种不能用'\0'判断是否结束(这种判断方式能很方便加在while条件用于判断越界——b != '\0')。 如果是字符串常量: char *b = "dasadafasdf"; 这种情况,sizeof()就废掉了! 总之: 对号入座,前者sizeof、后者strlen~!不过sizeof(a)和strlen(b)还有另外一个区别,strlen不计算'\0',而sizeof要计算(前提是sizeof()不针对char指针) 典型问题2: 用什么来暂存并输出结果?还是只是记录下来相关位置——这是我底下未完成版本1想到的思路——用一个count[sizeof(A)]数组记录下A每个位置作为起点所能和B达到的最大重合,最后判断查找数组最大值,此时目标子字符串的起点下标(i)和 i 对应的长度(counter[i])都有了。 这是针对不知道字符串大小并且不占用额外空间的做法,需要非常繁琐的操作,要加很多标记,越界判断也会有些麻烦(结合优势么,用字符串常量而不是栈空间字符数组,有'\0'——就好判断了!) (关于空间的占用,如果要用一个和字符串a一样长的数组counter来计录a各起点对应与b最大重合子字符串,这个数组也要和a一样长,空间上也不合适,除非情形很特殊,a短b长,不然不如直接malloc()一个堆空间来储存当前最长“子字符串”,并实时更新) 先放一个改完编译测试成功的。 release1 //题目:要求比较A字符串(例如“abcdef"),B字符串(例如(bdcda)。找出重合度最大的子字符串,输出(根据OJ经验,输>出结果对即可) #include #include #include main(){ char *A = "abcderfghi"; char *B = "aderkkkkkabcd"; int i,j,c = 0,count = 0; unsigned int maxSeg = 0; int max = strlen(A) > strlen(B) ? strlen(A) : strlen(B); char* final = (char*)malloc(sizeof(char) * (max + 1)); final[max] = '\0'; for(i = 0;A[i] != '\0';i++){ for(j = 0;B[j] != '\0';j++){ while(A[i + c] == B[j] && A[i+c] != '\0' && B[j] != '\0'){ count++; c++; j++; }                         if(count > maxSeg){                                 strncpy(final,(A + i),count);                                 maxSeg = count;                         } count = 0; c = 0; } } printf("%s\n",final); free(final); } 这是能将就用的第一个版本~!关于结束符'\0'能否影响free()的使用,觉得是完全不用操心的,因为malloc的大小是系统来保存的,删除时候系统来接手就完了,而'\0'结束符只是针对一些常规字符串操作,比如printf()用%s控制输出时~! 新难点:找到的子字符串同时一样长怎么办?那我这只能叫做”第一个最长的重合字符串“用两块空间来存储?三

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值