查找出现次数大于n/k的重复元素 --- 多重集算法

继续前一篇文章...

相对于前一篇文章讲的算法来说,“多重集算法”比较容易理解。

我们把原始数组看成一个多重集,每次从数组中删除k个不同的元素,直到不能再删了为止。那么最后数组中剩余的元素就是候选元素。

例如 {1,2,3,3,4,4,3,5,3} ,这里n=9,k=3。我们要查找出现次数大于n/k=3的元素。

下划线表示被删除的元素:

{123,3,4,4,3,5,3} => 

{34,4,3,5,3}=>

{4,3,3} 

然后,再检验4,3在数组中出现的次数是否大于3。算法复杂度是O(n*log(k))。

代码(不包括检验过程,执行完之后,t中就是候选元素):

struct Pair
{
   int v;
   mutable int c;
};

struct Comp
{
   bool operator()(const Pair& lhs, const Pair& rhs)
   {
        return lhs.v<rhs.v;
   }
};

void find_repeated_elements(int b[],int n,int k)
{
    int d=0;//表示t中不同的元素个数,也就是t的大小
    set<Pair,Comp> t;
    for(int i=0;i<n;++i)
    {
        struct Pair p;
        p.v=b[i];
        p.c=1;
        set<Pair,Comp>::iterator ret=t.find(p);
        if(ret==t.end())//在t中没有找到b[i]
        {
            t.insert(p);
            ++d;
            if(d==k)//t中不同的元素数量达到了k个
            {
                 for(set<Pair,Comp>::iterator it=t.begin();it!=t.end();)
                 {
                       if(it->c>1)
                       {
                            --(it->c);
                            ++it;
                       }
                       else
                            t.erase(it++);
                 }
                 d=t.size();//如果t中某些元素被删掉,需要更新d的值
            }
        }
        else//在t中找到了b[i]
        {
            ++(ret->c);
        }
    }
}

还有一种是“决策树”算法,比“多重集”算法效率更高。我们下回再讲。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值