- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 强化学习七日打卡营终极复现之flappy bird
实战的7天很快就过去了,调参调到怀疑人生,“标准答案”却出奇的简单,大概是把问题想得太复杂了。恰好最后有一个终极复现可以自由发挥,这就来实现曾经想玩的flappy bird。这里是目录原理基本概念Q学习环境实现过程结论与展望致谢原理基本概念强化学习是一种在与环境交互过程中学习的方法。通过动作施加影响动作的收益反馈环境的变化智能主体环境比如在日常生活中,前方有一棵树(环境)人向前走了一步(动作)撞到了树(环境变化)并且觉得痛(收益)下次碰到树换个方向走(更新策略)强化学习的问题定义
2020-06-27 01:20:07 686 4
原创 PaddlePaddle深度学习7日打卡营第五期心得
本期打卡营(CV专题)以疫情为主题,相比上一期实践性更强。飞桨使用的体验和感受飞桨更新到1.7版本了,对动态图的支持更加全面,在动态图中,paddlepaddle与numpy混合使用是非常舒服的,特别是可以实现一些paddlepaddle中本没有的算子,比如自定义学习率衰减和损失函数。对深度学习有哪些新的认识?这次打卡营学习了一些CV方面的理论知识,学习了一些经典的CNN模型特别是LeNe...
2020-04-11 16:34:50 223 1
原创 PaddlePaddle深度学习体会
飞桨使用的体验和感受刚接触时通过手写数字识别的例子入手,跑通并且成功部署,感觉还不错。和tensorflow比起来paddlepaddle的代码更短,写起来也更方便,比如全连接层,直接给定输入变量和输出维度一行就能写好。paddlepaddle的文档非常的友好,它是中文的,我想要什么算子,直接搜索就可以找到对应的api,然后可以看到详细使用说明。之前觉得飞桨不如tensorflow灵活,不...
2020-03-17 12:48:06 296
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人