- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 策略梯度之---actor critic
Actor crtic算法的思路,流程如下图所示 actor critic算法伪代码如下图所示其中,critic使用基于值函数近似的方法,近似函数为线性函数,参数为w ,为TD error ...
2019-03-12 00:47:25 1240
原创 深度学习笔记--个人
y=h(b+w1X1+w2X2) h,w...统称为参数----训练集计算loss函数,然后梯度下降求得感知机的激活函数为阶跃函数)激活函数(连接感知机和神经网络的桥梁): 回归问题------->恒等函数 分类问题------->softmax函数为了发挥叠加层的优势,神经网络的激活函数必须为非线性函数,如果是线性函数的话,一层就能搞定...
2019-03-11 19:49:42 451
炒鸡好用的国外免费Expertpdf软件,看论文神器!!!更改不加封面保存!!轻量!比福昕好用
2018-11-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人