- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 TRPO下界不等式的数学证明
TRPO原文给出了策略单调改进保证的下界不等式,并在附录中给出了证明;由于其证明过程的”$\alpha-$ 耦合策略对“过于抽象,本文直接给出了数学证明,并对其最小界进行了讨论。
2022-06-02 15:37:26 266
原创 小方格世界的DP、Q-learning、sarsa和MC算法
本文基于小方格世界模型,实现了DP(动态规划)、Q-learning、sarsa和MC(蒙特卡洛)算法。
2022-06-02 10:59:48 427
原创 numpy构建BIRNN双向循环神经网络
本文基于python+numpy构建了一个含10个单元的BIRNN神经网络,然后采用吴恩达老师深度学习课程的数据集dinos.txt进行训练,并给出了训练结果。
2022-06-01 16:27:52 539
原创 numpy 构建RNN和LSTM网络生成新的恐龙名字
本文在学习吴恩达老师深度学习课程-“序列模型”的基础上,使用python+numpy实现RNN、LSTM网络,利用课程中的数据集dinos.txt完成了课后作业。
2022-06-01 11:38:01 407
原创 numpy构建LeNet卷积神经网络识别图片中的猫
LeNet是Yann LeCun于1988年提出的用于数字识别的网络结构,是深度CNN网络的基石,理解和掌握LeNet对于学习现在主流深度学习框架有很大的帮助。本文结合吴恩达老师深度学习课程的数据集,采用python+numpy硬编码实现LeNet-5算法以识别图片中的猫。
2022-06-01 09:06:54 421
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人