2023年被认为是AI元年(也许有不同的意见)。无论如何,AI的影响力已经扩大到了普通人的生活中,而且也许在不久的将来会迎来更多的突破。若干年后,回首今天,也许深度学习算法,框架,模型都将成为“经典”,共孩子们娱乐,成为他们(她们)的三阶魔方。
1. 深度学习
1.1 CNN
AleNN
GleNN
ResNN
DenseNN
1.2 RNN
GRU
LSTM
2. 深度强化学习
[Theory] Bellman Equation:
V(s) = E(a ∈ A) E(s' ∈ S) [R(s,a) + gamma*V(s') ]
//TODO
2.1 基于Q值
2.1.1 TABULAR Q-LEARNING
ReplayBuffer: (s, a, r, s`)
Model:
Key | Value |
---|---|
(s,a) | Q(s,a) |
Fit(train):
- random select, n episodes
- update Model