提高编码能力,强化算法应用训练赛II

问题 A: 叠卡片1012

题目描述

你能在多大程度上将一叠卡片悬挂在桌子上?如果你有一张卡,则可以创建最长半张卡长度。(我们假设卡片必须垂直于桌子)使用两张卡片,你可以使顶部卡片从卡片长度的一半到底部,而底部卡片在卡片长度的三分之一处伸出桌面,总长度为1/2 + 1/3 = 5/6卡长度。一般来说,你可以通过1/2 + 1/3 + 1/4 + ... + 1 /(n + 1)卡长度使n卡悬空,其中顶部卡悬伸出第二个卡的部分为1/2,第二个悬伸出第三个卡的部分为1/3,第三个悬伸出第四个卡的部分为1/4等,底部卡悬伸出桌子的部分为1 /(n + 1)。 这在下图中说明。 
 

输入

输入包含一个或多个测试用例,最后为一个包含数字0.00的行,表示输入结束。每个测试用例是包含正浮点数c的单行, 0.01<=c<=5.20; c正好包含三位数。

输出

对于每个测试用例,输出实现c长度的悬垂至少所需的卡数。使用示例中显示的确切输出格式。

样例输入

1.00
3.71
0.04
5.19
0.00

样例输出

3 card(s)
61 card(s)
1 card(s)
273 card(s)

题解:

c++语言基础题,循环即可


#include<bits/stdc++.h>
using namespace std;
float n;
int main()
{
    while(cin>>n&&n!=0)//注意n!=0
    {
        float sum=0;
        int ans=0;
        for(int i=2;i<=INT_MAX;i++)
        {
            if(sum>=n)break;
            sum=sum+1.0/i;
            ans++;//有几张卡片
        }
        printf("%d card(s)\n",ans);//输出
    }
} 

问题 B: 计算e1013

题目描述

e的简单数学公式是e=1/0!+1/1!+... + 1/n!,允许n为无穷大。这实际上可以使用相对较小的n值产生非常精确的e近似值。 

输入

没有输入。

输出

输出所有由上述公式生成的e的近似值,其中n的值为从0到9。输出的开头应类似于下图所示。 

样例输出

n e
- -----------
0 1
1 2
2 2.5
3 2.666666667
4 2.708333333

题解:

这输出挺烦的,注意在输出时小数位后面的0要舍去(例如2.5不要输成2.500000)

所以前三组输出单独输出,再循环求阶乘。

#include<bits/stdc++.h>
using namespace std;
int main()
{
   int i,j;
   long 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. Q-learning算法在游戏智能中的应用:Q-learning算法是一种经典的强化学习算法,可以用于训练游戏AI。比如,在打砖块游戏中,可以通过Q-learning算法让游戏AI学习如何最优地击破砖块,提高游戏的可玩性和趣味性。 2. Actor-Critic算法在机器人控制中的应用:Actor-Critic算法是一种结合了值函数和策略函数的强化学习算法,可以用于训练机器人控制。比如,在自主驾驶汽车中,可以使用Actor-Critic算法学习如何最优地控制汽车行驶,提高行驶的安全性和效率。 3. Deep Q-network算法在推荐系统中的应用:Deep Q-network算法是一种结合了深度学习和Q-learning的强化学习算法,可以用于训练推荐系统。比如,在电商平台中,可以使用Deep Q-network算法学习用户的购买行为,提高推荐系统的准确性和效率。 4. SARSA算法在交通信号控制中的应用:SARSA算法是一种基于状态-动作-奖励-状态-动作的强化学习算法,可以用于训练交通信号控制。比如,在城市交通中,可以使用SARSA算法学习如何最优地控制交通信号,提高交通的效率和安全性。 5. Monte Carlo算法在棋类游戏中的应用:Monte Carlo算法是一种基于随机采样的强化学习算法,可以用于训练棋类游戏AI。比如,在围棋中,可以使用Monte Carlo算法学习如何最优地下棋,提高游戏的挑战性和趣味性。 6. Policy Gradient算法在语音识别中的应用:Policy Gradient算法是一种基于概率分布的强化学习算法,可以用于训练语音识别系统。比如,在智能语音助手中,可以使用Policy Gradient算法学习如何最优地识别用户的语音指令,提高语音识别的准确性和效率。 7. Deep Reinforcement Learning算法在自然语言处理中的应用:Deep Reinforcement Learning算法是一种结合了深度学习和强化学习的算法,可以用于训练自然语言处理系统。比如,在智能客服中,可以使用Deep Reinforcement Learning算法学习如何最优地回答用户的问题,提高客服的效率和用户体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值