数组中重复的数字

面试题3:数组中重复的数字
题目一:找出数组中重复的数字。
在一个长度为n的数组里的所有数字都在0~n-1的范围内。数组中某
些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了
几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数
组{2,3, 1,0,2,5, 3},那么对应的输出是重复的数字2或者3。

解决这个问题的一个简单的方法是先把输入的数组排序。从排序的数组中找出重复的数字是一件很容易的事情,只需要从头到尾扫描排序后的数组就可以了。排序一个长度为n的数组需要O(nlogn)的时间。还可以利用哈希表来解决这个问题。从头到尾按顺序扫描数组的每个数字,每扫描到一个数字的时候,都可以用0(1)的时间来判断哈希表里是否已经包含了该数字。如果哈希表里还没有这个数字,就把它加入哈希表。如果哈希表里已经存在该数字,就找到一个重复的数字。这个算法的时间复杂度是0(n).但它提高时间效率是以一个大小为O(n)的哈希表为代价的。我们再看看有没有空间复杂度是0(1)的算法。我们注意到数组中的数字都在0~n-l的范围内。如果这个数组中没有重复的数字,那么当数组排序之后数字i将出现在下标为i的位置。由于数组中有重复的数字,有些位置可能存在多个数字,同时有些位置可能没有数字。现在让我们重排这个数组。从头到尾依次扫描这个数组中的每个数字。当扫描到下标为i的数字时,首先比较这个数字(用m表示)是不是等于i。如果是,则接着扫描下一一个数字:如果不是,则再拿它和第m个数字进行比较。如果它和第m个数字相等,就找到了一个重复的数字(该数字在下标为i和m的位置都出现了);如果它和第m个数字不相等,就把第i个数字和第m个数字交换,把m放到属于它的位置。接下来再重复这个比较、交换的过程,直到我们发现个 重复的数字。以数组{2, 3, 1, 0,2, 5, 3}为例来分析找到重复数字的步骤。数组的第0个数字(从0开始计数,和数组的下标保持一-致) 是2,与它的下标不相等,于是把它和下标为2的数字交换。交换之后的数组是(1, 32.0.2,5.3),此时第0个数字是1.仍然与它的下标不相等,继续把它和下标为1的数字3交换,得到数组{3,1, 2,0,2,5,3}。接下来继续交换第0个数字3和第3个数字0,得到数组{0, 1,2,3,2,5, 3}。此时第0个数字的数值为0,接着扫描下一个数字。在接下来的几个数字中,下标为1、2、3的3个数字分别为1、2、3,它们的下标和数值都分别相等,因此不需要执行任何操作。接下来扫描到下标为4的数字2。由于它的数值与它的下标不相等,再比较它和下标为2的数字。注意到此时数组中下标为2的数字也是2,也就是数字2在下标为2和下标为4的两个位置都出现了,因此找到一个重复的数字。

def duplicate(lis):
    if lis ==None or len(lis) == 0:
        return False
    Len = len(lis)
    for i in lis:
        if i < 0 or i >Len-1:
            return False
    Flag = True
    for i in range(Len):
        while i!=lis[i]:
            m = lis[i]
            if m == lis[m]:
                Flag = False
                break
            lis[i],lis[m] =lis[m],lis[i]
        if Flag==True:
            print(" 没找到重复数子")
            return False
        else:
            return lis[i]

题目二:不修改数组找出重复的数字。
在一个长度为
n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出是重复的数字2或者3。

这题看起来和上面的面试题类似。 由于题目要求不能修改输入的数组我们可以创建一个长度为的辅助数组, 然后还把原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是m,则把它复制到辅
助数维中下标为m的位置。这样很容易就能发现哪个数字是重复的。由于需要创建一个数组,该方案需要Oy)的辅助空间。接下来我们尝试避免使用O(m的辅助空间。为什么数组中会有重复的数字?假如没有重复的数字,那么在从1到n的范围里只有n个数字。由于数组里包含超过n个数字,所以-一定包含了重复的数字。看起来在某范围里数字的个数对解决这个问题很重要。我们把从1到n的数字从中间的数字m分为两部分,前面一半为1到m,后面一半为m+1到n。如果1到m的数字的数目超过m,那么这一半的区间里一定包含重复的数字;否则,另一半m+1~n的区间里一定包含 重复的数字。我们可以继续把包含重复数字的区间一分为二, 直到找到一个重复的数字。这个过程和二分查找算法很类似,只是多了一步统计区间里数字的数目。我们以长度为8的数组{2,3,5, 4.3.2,6, 7}为例分析查找的过程。根据
题目要求,这个长度为8的所有数字都在1到7的范围内。中间的数字4把1到7的范围分为两段,一段是1到4, 另一段是5到7。接下来我们统计1到4这4个数字在数组中出现的次数,它们共出现了5次,因此这4个数字中一定有重复的数字。接下来我们再把1~4的范围分为二,一段是1、 2两个数字,另一
段是3、4两个数字。数字1或者2在数组中一共出现了两次。我们再统计数字3或者4在数组中出现的次数,它们一 共出现了三次。这意味着3、两个数字中一定有一个重复了。我们再分别统计这两个数字在数组中出现的次数。接着我们发现数字3出现了两次,是一个重复的数字。

# 面试题3-2不修改数组找重复数字
def getDupliation(lis):
    if lis ==None or len(lis)==0:
        return False
    Len= len(lis)
    for i in lis:
        if i <1 or i >Len-1:
            return False
    start ,end = 1,Len-1
    while end>=start:
        middle = start +int((end-start)/2)
        count = countRange(lis,start,middle)
        if end ==start:
            if count >1:
                return start
            else:
                print("无重复")
                break
        if count>(middle-start+1):
            end = middle
        else:
            start = middle+1
    return False
def countRange(lis,start,end):
    count = 0
    for i in lis:
        if i>=start and i<=end:
            count =count+1
    return count
if __name__ == '__main__':
    lis = []
    print(getDupliation(lis))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值