- 博客(3)
- 收藏
- 关注
原创 [强化学习]区分Model-free和Model-based方法
所以,如果你想查看这个强化学习算法是model-based还是model-free的,你就问你自己这个问题:在agent执行它的动作之前,它是否能对下一步的状态和回报做出预测,如果可以,那么就是model-based方法,如果不能,即为model-free方法
2017-11-13 20:20:41 47757 13
原创 详解神经网络中矩阵实现的梯度计算
对神经网络有一定了解的同学知道:一般的神经网络的具体实现都是通过矩阵实现的,包括误差反向传导,梯度计算和更新等等,比如y=w*x+b,这里的所有变量都是矩阵,我们通常会叫w和b为参数矩阵,矩阵相乘首先效率比较高,然后也比较好操作,那么对于矩阵形式的导数该怎么计算?比如w矩阵的具体导数dw应该如何计算?首先我们来看一个只有输入和输出层的网络,我们输入X矩阵大小为 N*D, N为batch的大小,也就是
2017-11-09 20:28:14 29888 28
原创 Git超级傻瓜教程[快速创建Git远程项目并上传本地代码]
这里我给出一个如何快速创建Git远程项目并上传本地代码的教程前提条件注册并登录了Github本地安装了git工具(Ubantu系统安装 sudo apt-get install git)Step 1在github上创建新的远程仓库, 这里我把这个项目取名为gitDemo, 然后点击确定:然后我们来到了这个初始界面, 表示远程仓库创建成功, 但是是空的, 那么我们需要将本地的东西提交到这个空的远
2017-11-08 23:54:09 1437
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人