人工智能
bnpzsx
这个作者很懒,什么都没留下…
展开
-
强化学习七日打卡营终极复现之flappy bird
实战的7天很快就过去了,调参调到怀疑人生,“标准答案”却出奇的简单,大概是把问题想得太复杂了。恰好最后有一个终极复现可以自由发挥,这就来实现曾经想玩的flappy bird。 这里是目录原理基本概念Q学习环境实现过程结论与展望致谢 原理 基本概念 强化学习是一种在与环境交互过程中学习的方法。 通过动作施加影响动作的收益反馈环境的变化智能主体环境 比如在日常生活中, 前方有一棵树(环境) 人向前走了一步(动作) 撞到了树(环境变化) 并且觉得痛(收益) 下次碰到树换个方向走(更新策略) 强化学习的问题定义原创 2020-06-27 01:20:07 · 684 阅读 · 4 评论 -
PaddlePaddle深度学习7日打卡营第五期心得
本期打卡营(CV专题)以疫情为主题,相比上一期实践性更强。 飞桨使用的体验和感受 飞桨更新到1.7版本了,对动态图的支持更加全面,在动态图中,paddlepaddle与numpy混合使用是非常舒服的,特别是可以实现一些paddlepaddle中本没有的算子,比如自定义学习率衰减和损失函数。 对深度学习有哪些新的认识? 这次打卡营学习了一些CV方面的理论知识,学习了一些经典的CNN模型特别是LeNe...原创 2020-04-11 16:34:50 · 223 阅读 · 1 评论 -
PaddlePaddle深度学习体会
飞桨使用的体验和感受 刚接触时通过手写数字识别的例子入手,跑通并且成功部署,感觉还不错。 和tensorflow比起来paddlepaddle的代码更短,写起来也更方便,比如全连接层,直接给定输入变量和输出维度一行就能写好。 paddlepaddle的文档非常的友好,它是中文的,我想要什么算子,直接搜索就可以找到对应的api,然后可以看到详细使用说明。 之前觉得飞桨不如tensorflow灵活,不...原创 2020-03-17 12:48:06 · 296 阅读 · 0 评论