剑指offer笔记1:数组中重复的数字(Python)

剑指offer笔记1:数组中重复的数字(P39)

题目一:找出数组中重复的数字

在一个长度为 n 的数组里的所有数字都在 0~n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。例如,如果输入长度为 7 的数组 {2,3,1,0,2,5,3} 那么对应的输出是重复的数字 2 或者 3 。

方法一:先排序后遍历

将数组进行排序后,从头到尾扫描一次数组,若前后两个数字相等,则该数字为重复数字。
排序时间复杂度为O(nlogn)。
python代码如下:

# 这里要特别注意~找到任意重复的一个值并赋值到duplication[0]
    # 函数返回True/False
    def duplicate1(self, numbers, duplication):
        # 方法一:先排序后遍历,时间复杂度O(nlogn),空间复杂度O(1)
        if len(numbers) <= 1:
            # 空列表和长度为1的列表不会有重复,直接返回False
            return False
        numbers.sort()
        # 使用python内置排序算法将numbers进行排序
        for i in range(1, len(numbers)):
            # 遍历排序后的列表
            if numbers[i-1] == numbers[i]:
                # 若前后两个数字相等,则为重负数字
                duplication[0] = numbers[i]
                # 将重复数字赋值给duplication[0]
                return True
        return False

方法二:哈希表

首先建立一个大小为 n 的哈希表,然后从头到尾扫描数组。在扫描过程中,判断当前数字是否存在于哈希表中,若不在则存入哈希表,若在则找到重复数字。
时间复杂度为O(n),空间复杂度为O(n)。
python代码如下:

    def duplicate2(self, numbers, duplication):
        # 方法二:将数组转存至哈希表,若冲突则为重复。时间复杂度O(n),空间复杂度O(n)
        if len(numbers) <= 1:
            # 空列表和长度为1的列表不会有重复,直接返回False
            return False
        h = [None] * len(numbers)
        # 建立一个大小为n的哈希表,每个元素赋为None
        for i in range(len(numbers)):
            # 从头到尾遍历数组numbers
            if h[numbers[i]] is None:
                # 若哈希表中对应的以当前访问的数字为下标的值为None,则将该数字填入对应位置中
                h[numbers[i]] = numbers[i]
            else:
                # 若哈希表中对应的以当前访问的数字为下标的值为该数字,则说明该数字为重复数
                duplication[0] = numbers[i]
                return True
        return False

方法三:交换数字位置

由于给出的是长度为 n 的数组,所有数字都在 0~n-1 的范围内,那么在将数组排序后,若数组中没有重复的数字,则数组中所有数字将与其下标相等。
当数组中没有重复的数字时,排序后的结果数组中所有数字与其下标相等
若数组中有重复的数字,则排序后的数组中,重复的数字会占用更多的位置,使得数字与下标错位。
当数组中有重复数字时,排序后的数组中数字与下标错位
基于以上现象,我们可以在从头到尾扫描数组的过程中,使用交换排序的方法将数字归位(即排序后数字与下标的对应)。在扫描归位的过程中,可以通过判断当前数字 m 与其下标 i 的关系来判断该数字 m 是否在其应在的位置上。若 m≠i ,则判断第 m 个位置上的数字是否为 m ,若 A[m]≠m (假设数组表示为A),则将 A[m] 与 m 调换位置,继续从第 i 个数字开始扫描;若 A[m]=m,则找到了重复的数字。
以数组 {2,3,1,0,2,5,3} 为例,查找过程如下:在这里插入图片描述在这里插入图片描述在这里插入图片描述python代码如下:

    def duplicate3(self, numbers, duplication):
        # 方法二:交换排序思想找到重复数。时间复杂度O(n),空间复杂度O(1)
        if len(numbers) <= 1:
            # 空列表和长度为1的列表不会有重复,直接返回False
            return False
        for i in range(len(numbers)):
            while i != numbers[i]:
                # 若当前访问数字与其下标不对应,则进入循环
                if numbers[numbers[i]] == numbers[i]:
                    # 若以当前访问数字为下标位置上的数字等于当前访问的数字,则出现重复
                    duplication[0] = numbers[i]
                    return True
                else:
                    # 若以当前访问数字为下标位置上的数字不等于当前访问的数字,则交换
                    temp = numbers[i]
                    numbers[i] = numbers[temp]
                    numbers[temp] = temp
        return False

小结

对于一维数组,利用数组下标来定位对应的元素
分析出问题中给出的数组大小和数字范围的关系是很重要的

—————————————————————————————————

题目二:不修改数组找出重复的数字

在一个长度为 n+1 的数组里的所有数字都在 1~n 的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为 8 的数组 {2,3,5,4,3,2,6,7} 那么对应的输出是重复的数字 2 或者 3 。

方法一:哈希表

与题目一的方法二相同,创建一个大小为 n+1 的辅助数组,将原数组中的数放到辅助数组中对应下标的位置,找出重复的数字。时间复杂度为O(n),空间复杂度为O(n)。(代码参考题目一的方法二)

方法二:二分查找

从题目中 在一个长度为 n+1 的数组里的所有数字都在 1~n 的范围内,所以数组中至少有一个数字是重复的。 这句话出发,若数字范围小于数组长度,则一定有重复。这样我们可以根据二分查找的思想,逐步缩小查找范围来找出重复的数字,但这种方法不能保证找出所有重复的数字。
在这里插入图片描述
设区间左端点为start,区间右端点为end,取 m i d d l e = e n d + s t a r t 2 middle=\frac{end+start}{2} middle=2end+start 将原区间分为两部分,start~middle 和 middle+1~end。分别对满足两区间的数字的个数进行统计,若统计个数大于区间长度,则该区间内存在重复数。进一步讲该区间二分,重复上述步骤,直到区间长度为1为止,若该区间内数字计数大于1,则存在重复,且重复数字即为区间端点,否则无重复数字。时间复杂度O(nlogn),空间复杂度O(1)。
python代码如下:

    def duplicate4(self, numbers, duplication):
        # 题目二方法二:二分查找思想找出重复数字同时不改动原数组。时间复杂度O(nlogn),空间复杂度O(1)。
        if len(numbers) <= 1:
            # 空列表和长度为1的列表不会有重复,直接返回False
            return False
        start = 1
        end = len(numbers)-1
        while end >= start:
            # 区间长度大于等于1的时候进入循环
            middle = ((end - start) >> 1) + start
            # 求区间中点
            # (end-start)>>1 == int((end-start)/2)
            # (end-start)<<1 == int((end-start)*2)
            count = self.countRange(numbers, start, middle)
            # 统计左半区间内数字的个数
            if count > (middle - start + 1):
                # 若统计个数大于区间长度,则说明区间内有重复数,将区间重置为左半部分,在左半区间继续查找
                end = middle
            else:
                # 否则在右半区间继续查找
                start = middle + 1
            if end == start:
                # 当区间大小为1时
                if count > 1:
                    # 若统计个数大于1,则该数字为重复数字
                    duplication[0] = start
                    return True
                else:
                    # 否则该数组中无重复数字,退出循环
                    break
        return False

    def countRange(self, numbers, start, end):
        count = 0
        for i in range(len(numbers)):
            if numbers[i] in range(start, end + 1):
                count += 1
        return count

小结

该算法不能保证找出所有重复的数字。例如,在区间长度为3的区间内,刚好找到3个符合该区间的数字,在本算法中,这个区间会被忽略掉,但这3个数字无法保证是不重复的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值