【三阶魔方】深度学习+深度强化学习

2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许深度学习算法,框架,模型都将成为“经典”,共孩子们娱乐,成为他们(她们)的三阶魔方。

1. 深度学习

1.1 CNN

AleNN
GleNN
ResNN
DenseNN

1.2 RNN

GRU
LSTM

2. 深度强化学习

[Theory] Bellman Equation:

V(s) = E(a ∈ A) E(s' ∈ S) [R(s,a) + gamma*V(s') ]
//TODO

2.1 基于Q值

2.1.1 TABULAR Q-LEARNING

ReplayBuffer: (s, a, r, s`)

Model:

Key Value
(s,a) Q(s,a)

Fit(train):

  • random select, n episodes
  • update Model
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值