- 博客(6)
- 资源 (8)
- 收藏
- 关注
原创 强化学习简单示例——SARSA算法
【注】我也是刚刚接触强化学习的内容,对这部分理解不是很透彻,代码写的可能也会有不对或不完善的地方,还请各位批评指正。这个问题是个作业,这是我自己编的代码,老师提供的答案出来后再更。【问题描述】图中S为起点,G为终点,每次能前、后、左、右、左前、左后、右前、右后移动。当到达第4-9列的某一列时,会在某一状态的基础上向上被吹一格。如某一时刻到达了第4行第4列,则会被吹到第3行第4列。在
2016-11-29 09:07:12 9126 6
原创 最优控制理论总结——动态规划
此总结为中国科学院大学《最优控制理论》课程的总结,不是很详细,适合有一定基础、梳理思路用。课程未结束,不定期更新。
2016-11-23 22:24:00 8115
原创 最优控制理论总结——极小值原理PMP
此总结为中国科学院大学《最优控制理论》课程的总结,不是很详细,适合有一定基础、梳理思路用。课程未结束,不定期更新。
2016-11-23 22:20:56 8855 2
原创 git多人协作示意图
组员首先fork组长的项目,在c9下执行命令:git clone +自己github下项目的URL。组员每次在修改代码时执行一段命令,以保持自己与组长的github的同步。修改代码后执行命令到自己的github,再在github中向组长提交修改申请。此过程相当于组长和组员共同维护组长的github,每个人的贡献度会显示在组长的github上,具体见下图。关于组长的C9与github的互推我还没调好
2016-11-21 23:06:25 839
原创 Fortran计算月食初亏——以2017年第一次月食为例
以2017年第一次月食为例,利用JPL提供的DE421历表和子程序计算月食初亏时刻。
2016-11-21 17:54:22 2072 2
workshop_of_NAS_ICLR2020.rar
2020-05-19
deeplearning.ai第二门课——权重初始化
2017-10-11
deeplearning.ai
2017-10-10
Deep Learning Tutorial李宏毅ppt
2017-02-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人