15.三数之和-LeetCode 题解


题目链接

1. 方法一 哈希表

算法思想:利用类似于T1-twoSum哈希表的方法求取三元组。通过第一重循环固定第一个元素a,从而在内部求取两个数b,c,使得b+c = target,内部就转换成了T1两数之和的问题。时间复杂度为T(n)=O(n^2)

该方法值得注意的几个点:

  1. 由于题目要求类似于[a,b,c]或者[b,a,c]的情况不得重复出现,同时要满足a<b<c,因此在遍历之前首先要对数组进行排序,时间复杂度位O(n^2)。
  2. 在第一层循环时,如果当前的元素nums[i]在此前遍历时出现过且再次出现时,只需要跳过即可,因为对于第一个元素位nums[i]的情况在此前的循环中必然已经处理过,不需要在考虑。
  3. 另外,在twoSum函数里在确定对于三元组第三个元素时,也不考虑之前已经出现过且满足和为target的相同元素c,直接跳过。因为是数组已经排过序,所以如果此元素满足要求,在此之前必然被写入到ans的最后一个位置,因此只需验证当前元素是否等于ans最后一个元素即可知道是否已经出现过该元素;此处为什么不使用同上2的做法nums[i]==nums[i]相同元素即掠过,这是因为可能出现target=2,元素序列为1,1,1…的这类情况,第一个1显然不满足和之前的数加和等于target的要求,但对于第二个1,因此第二个1不能被直接跳过,这类情况简单概括为:“三元组的第2和第三个元素有相同的情况”,所以只能在同一元素第三次出现时跳过,而不是像第一个元素一样,出现第二次就跳过。因此要采用另一种思路:当合格的三元组第三个位置的元素第二次出现时即略过,此处的合格即是这一数字被加入到了ans,如此一来思路就直接很多。
  4. 注意ans的初始化:int **ans = (int**)malloc(sizeof(int*) * basicSize);
    i. ans是一个二级指针,亦即是一级指针数组的首地址。因为输出必然是多个三元组,每一个三元组是一个数组a【意即 int[]或者int*】,而多个三元组构成的输出即是数组的数组ans【意即int*[] (这里是指针数组,数组的每一个元素都是一个int的指针,每一个指针都指向一个三元组,指针名即是三元组的数组名)或int**】。由此第一个三元组即可表示为ans或者ans[0],第二个三元组即表示为*(ans+1)或者 ans[1],ans[*returnSize] = (int*)malloc(sizeof(int)*2);因此对于这句由于此时ans[returnSize]=NULL,因此需要为指针数组ans第returnSize个指针申请一个三元组空间,此处也可写为*(ans+*returnSize)= (int*)malloc(sizeof(int)*2);
    ii. 这里使用basicSize是因为我们起初不知道输出究竟有几个三元组,而如果直接申请一个非常大的空间对于内存是巨大的负担,为了解决这个问题,采用类似于vector类似的申请空间的办法:有一个初始的capacity,此处即是basicSize,当当前的空间被填满即*returnSize==basicSize,重新分配2倍空间并将元素迁移到新的空间中【当然此处是通过realloc函数在重分配空间的同时让计算机自动迁移,不需要显示地写出代码,这种内存的分配方法根据算法分析里面的amortized analysis即平摊分析(假设增加新元素消耗的时间和元素迁移的时间都是1),也是O(n)的时间复杂度(同dynamic table)】。
  5. 对于函数参数里的int** returnColumnSizes,这里其实是想存储每一个三元组的元素个数,当然其实每一个都是3,这个地方显得有些鸡肋。但对于此处申请空间的步骤上值得注意,虽然它同ans都是一个二级指针,但申请空间方法是不一样的。要注意*returnColumnSizes = (int*)malloc(sizeof(int) * basicSize)ans = (int**)malloc(sizeof(int*) * basicSize)的区别,这里之所以这么操作,是因为returnColumnSizes是由外部通过值传递传进来的一个二级指针,因此我们改变returnColumnSizes是没有用的事情,因此为了将信息传递回主函数,只能通过对该二级指针指向的一级指针做文章。每一个三元组对应的size都需要一个对应的int空间来存储,因此若干个三元组则需要一个整数数组int[]或者说int*,因此需要returnColumnSize指向的空间填入一个int的值,因此即有上述写法。通过returnColumnSizes即得到存储三元组size数组的首地址。当然,此处同样因为不知道三元组数量的原因,也需要通过realloc不停地重新分配空间。

C语言实现

/**
 * Return an array of arrays of size *returnSize.
 * The sizes of the arrays are returned as *returnColumnSizes array.
 * Note: Both returned array and *columnSizes array must be malloced, assume caller calls free().
 */

struct HashTable{
    int _key;
    int _val;
    UT_hash_handle hh;
};
struct HashTable *hashtable;

struct HashTable *find(int ikey){
    struct HashTable *tmp;
    HASH_FIND_INT(hashtable, &ikey, tmp);
    return tmp;
}

void insert(int ikey, int ival){
    struct HashTable *it = find(ikey);
    if(it == NULL){
        struct HashTable* tmp = malloc(sizeof(struct HashTable));
        tmp ->_key = ikey;
        tmp ->_val = ival;
        HASH_ADD_INT(hashtable, _key, tmp);
    }else{
        it ->_val = ival;
    }
}

int **twoSum(int *nums, int start, int numsSize, int target, int *returnSize){
    hashtable = NULL;
    int basicSize = 2;
    int **ans = NULL;
    for(int i = start; i < numsSize; ++i){ // 确定三元组中的第三个元素,回头在第一个元素和第三个元素之间查找第二个满足要求的的元素
    	// 此处同样是为了保证b+c=target中,c已经出现过,则不必再次统计,直接掠过
        if((*returnSize != 0) && nums[i] == ans[(*returnSize)-1][1]){
            continue;
        }
        struct HashTable* it = find(target - nums[i]);
        if(it != NULL){ // 找到了第二个数
            if(*returnSize == 0){
                ans = (int**)malloc(sizeof(int*)*basicSize);
            }
            if(*returnSize == basicSize){
                basicSize *= 2;
                ans = (int**)realloc(ans, sizeof(int*)*basicSize);
            }            
            ans[*returnSize] = (int*)malloc(sizeof(int)*2);
            ans[*returnSize][0] = it ->_key;
            ans[*returnSize][1] = nums[i];
            ++(*returnSize);
        }else{
            insert(nums[i], i);
        }
    }
    return ans;
}

// 设定排序规则:从小到大
int Compare(const void *a, const void *b){
    int *pa = (int*)a;
    int *pb = (int*)b;
    return *pa - *pb;
}

int** threeSum(int* nums, int numsSize, int* returnSize, int** returnColumnSizes){
    qsort(nums, numsSize, sizeof(int), Compare);

    int **ans = (int**)malloc(sizeof(int*) * basicSize);
    int basicSize = 8;
    *returnSize = 0;
    *returnColumnSizes = (int*)malloc(sizeof(int) * basicSize);

    for(int i = 0; i < numsSize-2; ++i){
        int curSize = 0;
        if(i > 0 && nums[i] == nums[i-1]){
            continue;
        }
        int** curAns = twoSum(nums, i+1, numsSize, -(nums[i]), &curSize);
        for(int idx = curSize-1; idx >= 0; --idx){
            if(*returnSize == basicSize){
                basicSize *= 2;
                ans = (int**)realloc(ans, sizeof(int*)*basicSize);
                (*returnColumnSizes) = (int*)realloc((*returnColumnSizes),sizeof(int)*basicSize);
            }
            ans[*returnSize] = (int*)malloc(sizeof(int)*3);
            ans[*returnSize][0]=nums[i];
            ans[*returnSize][1]=curAns[idx][0];
            ans[*returnSize][2]=curAns[idx][1];
            (*returnColumnSizes)[*returnSize] = 3;
            ++(*returnSize);
            free(curAns[idx]);
        }
		// 注意释放空间
        if(curAns != NULL){
            free(curAns);
        }
        
    }
    return ans;
}

运行结果如下:

emmmm,可以看出该方法既耗时,既占用空间,时间复杂度为O(n2),过程中不停地申请内存释放内存,传递参数都占用了 大量时间。哈希表的存在使得空间占用率也不低。

C++实现

class Solution {
public:
    vector<vector<int>> twoSum(vector<int>& nums, int start, int target){
        vector<vector<int>> ans;
        unordered_map<int, int> hashtable;
        int len = nums.size();
        for(int i = start; i < len; ++i){ // 确定三元组第三个数
            if(ans.size() != 0 && nums[i] == ans[ans.size()-1][1]){
                continue;
            }
            auto it = hashtable.find(target - nums[i]);
            if(it != hashtable.end()){ // hashtable有对应的元素a满足a+b = target
                ans.push_back({it->first, nums[i]});
            }else{
                hashtable[nums[i]] = i;
            }
        }
        return ans;
    }

    vector<vector<int>> threeSum(vector<int>& nums) {
        vector<vector<int>> ans;
        int len = nums.size();
        sort(nums.begin(), nums.end());
        for(int i = 0; i < len-2; ++i){ // 确立三元组的第一个元素
            if(i > 0 && nums[i] == nums[i-1]){
                continue;
            }
            vector<vector<int>> curAns = twoSum(nums, i+1, -(nums[i]));
            for(int j = curAns.size()-1; j >= 0; --j){ // 逆序调整输出顺序
                ans.push_back({nums[i], curAns[j][0], curAns[j][1]});
            }
        }
        return ans;
    }
};

运行结果如下:
在这里插入图片描述
执行用时和内存消耗同C语言差别不大,此方法确实对时间空间占用极高。

2. 排序+双指针

算法思想:在三层循环的暴力方法上做改进:在确立第一个元素a的情况下,根据第二个元素b找到对应的c使得b+c==target。

  1. 为了保证输出结果(a,b,c)有a<b<c且统计结果不重复,比较能直接想到的办法即是对数组进行排序。通过每次循环确立三元组的三个位置的元素,T1(n) = O(nlogn)
  2. 在确立每一个位置的元素时,如果前面曾在这个位置出现过同样的元素且已经做过统计,则直接跳过。如第一层循环for(int first = 0; first < len; ++first)如果nums[first-1] == nums[first],那么显而易见,在first-1时的情况和first情况是一样的,这时候直接跳过first即可。
  3. 事实上,在确立了第一个位置的元素a=nums[first]之后,即b+c=target, target = 0 - nums[first]。由于整个数组是有序增加的,那么在已经存在一个满足于b = nums[second], c = nums[third], b+c=target之后,second如果继续右移成为second+1,b继续增大成为b’,那么在保证b+c=target的情况下,c必然将减小,新的c'<c,而因为数组增序的原因,因此c’对应的third‘必然在之前third的左边,即third'<third。如此即可利用双指针,在b增大的同时c从最大值开始减小,在这个过程中如果找到满足条件b<c 且 b+c=target的情况,则将其加入ans中,那么在second指向b时对应的c已经统计完毕,即可迈入下一个second+1时b’,根据上述c’<c则third继续减小直到找到同b‘相匹配的c’。重复上述情况直到second==third,说明统计完毕。在当前a时的组合完成,切换下一个a’=nums[first+1]。
    时间复杂度分析:三重遍历的第二重第三重在该方法中由于second在向上增加,third向下减小,直到second=third,因此second和third的遍历情况加起来最大时也就等于len-1,因此内部两重循环的时间复杂度相较于暴力方法O(n2)变成了O(n),因此三重循环的时间复杂度为T2(n) = O(n2),总的时间复杂度为
    T(n)=T1(n) +T2(n) = O(nlogn)+O(n2)=O(n2)

C++实现:

class Solution {
public:
    vector<vector<int>> threeSum(vector<int>& nums) {
        sort(nums.begin(), nums.end()); // 排序使得三元组(a,b,c)按照a<b<c的规则被枚举到
        vector<vector<int>> ans;
        int len = nums.size();
        for(int first = 0; first < len; ++first){
            if(first > 0 && nums[first-1] == nums[first]){
                continue;
            }
            int third = len - 1;
            for(int second = first + 1; second < third; ++second){
                if(second > first + 1 && nums[second-1] == nums[second]){
                    continue;
                }
                while(second < third && nums[first] + nums[second] + nums[third] > 0){ // 注意:此处仍然要保证second<third,因为b<c
                    --third;
                }
                if(second == third){
                    break;
                }
                if(nums[first] + nums[second] + nums[third] == 0){
                    ans.push_back({nums[first],nums[second],nums[third]});
                }
            }
        }
        return ans;
    }
};

运行结果如下:
方法二(C++)
和上面作对比,发现虽然同样是T(n) = O(n^2),但用时和内存消耗明显小了一个数量级。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Milk_exe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值