- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 AI强化学习-策略迭代实战
以下代码演示策略迭代强化算法前提:python语言 OpenAI gym库主要演示AI自动寻路的算法。如图:图中格子从做到右,从上到下依次编号,1~8.暗黄色的圆球,初始随机出现在1~5位置,在格子上移动。移动到黑色点失败,移动到黄色点胜利。首先,写一个gym环境:grid_map.py,代码如下import loggingimport numpyimport randomfrom gym ...
2018-05-29 11:45:32 1568
转载 tensorflow-梯度下降,有这一篇就足够了
前言最近机器学习越来越火了,前段时间斯丹福大学副教授吴恩达都亲自录制了关于Deep Learning Specialization的教程,在国内掀起了巨大的学习热潮。本着不被时代抛弃的念头,自己也开始研究有关机器学习的知识。都说机器学习的学习难度非常大,但不亲自尝试一下又怎么会知道其中的奥妙与乐趣呢?只有不断的尝试才能找到最适合自己的道路。请容忍我上述的自我煽情,下面进入主题。这篇文章主要对机器学...
2018-05-19 09:56:14 2860 1
移动版本可用的C# 版 fastJSON
2014-09-24
博弈-关于策略的63个有趣话题
2013-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人