查找出现次数大于n/k的重复元素 ---非多重集算法

本文是对一篇英文论文的总结:Finding Repeated Elements。想看原文,请Google之。

这个问题的简单形式是“查找出现次数大于n/2的重复元素”。我们先从简单问题开始,然后再做扩展。

1.查找出现次数大于n/2的重复元素

  《编程之美》中有同样的一道题《寻找发帖水王》,具体思路是每次删除两个不同的元素,最后剩下的就是要求的元素。这个结论的证明如下:

  已知:n,m是正整数,n表示数组的长度,m是出现次数大于n/2的元素的个数,即m>n/2。

  需要求证的结论包括两个:

 (1)我们用v表示出现次数大于n/2的元素。当删除两个不同元素,且其中有一个元素是v时,则m减小1,同时n要减小2。

  求证:m-1>(n-2)/2    

  证明:m-1>n/2-1=(n-2)/2

 (2)当删除两个不同元素,且其中有一个元素不是v时,则只需要n减小2。

  求证:m>(n-2)/2 。这个结论是显然的。

代码如下:

int find(int array[], int n)
{
    int candidate;
    int count=0;
    for(int i=0;i<n;++i)
    {
        if(count==0)
        {
             candidate=array[i];count=1;
        }
        
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 题目描述:给定一个包含n个元素的多重集合s,找出其中重数最大的元素,即众数。 解题思路:可以使用哈希表来统计每个元素出现次数,然后找出出现次数最多的元素即可。 具体实现:首先定义一个哈希表,遍历多重集合s,将每个元素出现次数记录在哈希表中。然后遍历哈希表,找出出现次数最多的元素,即为众数。 代码实现: ``` def find_mode(s): # 定义一个哈希表 count = {} # 遍历多重集合s,统计每个元素出现次数 for x in s: if x in count: count[x] += 1 else: count[x] = 1 # 找出出现次数最多的元素 mode = max(count, key=count.get) return mode ``` 测试样例: ``` s = [1, 2, 2, 2, 3, 5] print(find_mode(s)) # 输出2 ``` ### 回答2: 众数问题是一个经典的算法问题,其解法通常可以用于数据挖掘、统计分析等领域。在本问题中,我们需要设计算法来寻找多重集合中的众数,即出现次数最多的元素。 一种简单的解法是使用哈希表来记录元素出现次数,然后遍历哈希表,找到出现次数最多的元素。具体步骤如下: 1. 创建一个哈希表,用于记录每个元素出现次数。 2. 遍历多重集合s,对每个元素进行如下操作: a. 如果元素在哈希表中不存在,则将其添加到哈希表中,并将出现次数设置为1。 b. 如果元素在哈希表中已经存在,则将其出现次数加1。 3. 遍历哈希表,找到出现次数最多的元素,即为众数。 该算法的时间复杂度为O(n),其中n为多重集合中元素的个数。由于哈希表的查找和添加操作的时间复杂度都为O(1),因此该算法在实际应用中具有较高的效率。 除了使用哈希表,还有一种更为简洁的解法。我们可以利用抵消的思想来寻找众数。具体步骤如下: 1. 初始化候选众数为s中的第一个元素,计数器初始化为1。 2. 遍历多重集合s的剩余部分,对每个元素进行如下操作: a. 如果该元素等于候选众数,则将计数器加1。 b. 如果该元素不等于候选众数,则将计数器减1。 如果计数器减为0,则将候选众数更换为当前元素,并将计数器重新设置为1。 3. 最终剩下的元素为候选众数。我们可以遍历整个多重集合s来确认该元素是否为真正的众数。 该算法的时间复杂度为O(n),由于只需要遍历一遍多重集合s,因此该算法在实际应用中具有更高的效率。同时,由于这种算法只需要常数级别的额外空间,因此在空间受限的情况下也具有较高的可行性。 ### 回答3: 众数问题是算法设计中的一类经典问题,其主要目的是求出给定的多重集合中的众数以及其重数。众数是指在多重集合中出现次数最多的那个元素,其重数是指该元素在多重集合中出现次数。 为了求解众数问题,可以采用多种不同的算法。其中最简单直接的算法是暴力枚举,即枚举多重集合中的每一个元素并统计其出现次数,最后找出出现次数最多的那个元素。虽然暴力枚举算法常简单,但是其时间复杂度为O(n^2),对于较大规模的多重集合来说效率比较低。 为了提高效率,可以采用分治、排序、哈希等算法进行优化。其中较为常用的算法是排序。具体来说,可以使用快速排序或者归并排序的算法对多重集合中的元素进行排序,然后再遍历一遍排好序的元素,统计每个元素出现次数,最终找出出现次数最多的那个元素。排序算法的时间复杂度为O(nlogn),比暴力枚举算法要快得多。 除了排序算法,还可以使用哈希算法进行优化。具体来说,可以将多重集合中的每个元素都转换为一个哈希值,并使用哈希表数据结构来存储每个元素出现次数。遍历一遍哈希表,找出出现次数最多的那个元素,即为众数。哈希算法的时间复杂度为O(n),相对于排序算法有着更快的运行速度。 总之,众数问题在算法设计中属于比较基础的问题,广泛应用于各个领域。在实际应用中可以根据数据规模、性能要求和实际场景等多个因素选择不同的算法来进行优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值