C - Crusher’s Code( 概率dp )

C - Crusher’s Code( 概率dp )

题目链接:https://codeforces.com/gym/101655/attachments/download/6474/20132014-acmicpc-pacific-northwest-regional-contest-en.pdf 

题意(翻译润色了一下):

^▽^神秘的三角洲一直流传着一个关于排序的问题。
你在旅途中遇到了Monly和Carlos,他们都对自己解决这个问题的方案很有信心。

Monty的代码是这样的:

    while (!sorted(a))
    {
        int i = random(n) ;
        int j = random(n) ;
        if (a[min(i,j)] > a[max(i,j)])
            swap(a[i], a[j]) ;
    }

这是Carlos的代码:

    while (!sorted(a))
    {
        int i = random(n-1) ;
        int j = i + 1 ;
        if (a[i] > a[j])
            swap(a[i], a[j]) ;
    }

请聪明的你帮争论不休的他们确定哪种算法更好。
数组最长为8,计算两种算法在给定的序列情况下,完成排序需要迭代次数的期望。

思路:

容易想到是概率dp,所有的状态只有8!=40320种,hash一下数组可以进行维护,考虑状态迁移,每个状态都往更有序的状态才能进行迁移,比如[2 3 1] 往 [1 3 2] 和 [ 2 1 3 ]迁移,往其他地方迁移就等于本身,那么所有状态迁移到最后都是[1 2 3] 无法再进行迁移了,那么我们就让dp[1 2 3] = 0, 往上更新,反推dp的定义就是当前状态到123期望需要几步。

对于第一个算法

now表示当前状态的hash值, nxt表示往下迁移一次的hash值。

dp[now] =( \sum (dp[nxt]+1)*\frac{1}{n^{2}} )+ (dp[now]+1)*\frac{n^{2}-C}{n^{2}}

那么当前的状态now,必定由它换位置可以转移到的所有情况next状态的期望各自*概率( 概率是1/n方根据题意得到 ),再加上它自己原封不动的期望*不动的概率(因为有可能不交换),最后+1表示过了一回合。

C表示状态迁移的种类个数。

因为涉及到自己到自己进行更新,所以进行移项,很常用的技巧。

移项化简后得到

dp[now] = \frac{\sum dp[nxt]+n^{2}}{C}

对于第二个算法

dp[now] =( \sum (dp[nxt]+1)*\frac{1}{n-1} )+ (dp[now]+1)*\frac{n-1-C}{n-1}

移项化简后得到

dp[now] = \frac{\sum dp[nxt]+n-1}{C}

代码:

#include <bits/stdc++.h>

using namespace std;

int a[12],b[12],n,bot;
map<int,double> mp;

int Hash( int *c )
{
    int now = 0;
    for ( int i=0; i<n; i++ ) now=now*8+c[i];
    return now;
}

double dfs( int *c )
{
    int has = Hash(c);
    if ( has==bot ) return 0;
    if ( mp[has]>0 ) return mp[has];
    double sum = 0;
    int cnt = 0;
    for ( int i=0; i<n; i++ ) {
        for ( int j=0; j<n; j++ ) {
            int ii = min(i,j);
            int jj = max(i,j);
            if ( c[ii]>c[jj] ) {
                cnt ++;
                swap(c[ii],c[jj]);
                sum += dfs(c);
                swap(c[ii],c[jj]);
            }
        }
    }
    sum += n*n;
    sum /= cnt;
    return mp[has] = sum;
}

double dfs2( int *c )
{
    int has = Hash(c);
    if ( has==bot ) return 0;
    if ( mp[has]>0 ) return mp[has];
    double sum = 0;
    int cnt = 0;
    for ( int i=0; i<n-1; i++ ) {
        int ii = i;
        int jj = i+1;
        if ( c[ii]>c[jj] ) {
            cnt ++;
            swap(c[ii],c[jj]);
            sum += dfs2(c);
            swap(c[ii],c[jj]);
        }
    }
    sum += (n-1);
    sum /= cnt;
    return mp[has] = sum;
}

int main()
{
    int T;cin>>T;
    while ( T-- ) {
        cin>>n; mp.clear();
        for ( int i=0; i<n; i++ ) cin>>a[i];
        for ( int i=0; i<n; i++ ) b[i] = a[i]; /// 离散化,方便hash
        sort(b,b+n);
        for ( int i=0; i<n; i++ ) a[i]=lower_bound(b,b+n,a[i])-b;
        for ( int i=0; i<n; i++ ) b[i]=a[i];
        sort(b,b+n);
        bot = 0;
        for ( int i=0; i<n; i++ ) bot=bot*8+b[i];
        double ans = dfs(a);mp.clear();
        double ans2 = dfs2(a);
        printf("Monty %.6f Carlos %.6f\n",ans,ans2);
    }

    return 0;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值