读NNDL疑难点三
第三章【线性模型】
3.1多分类时,类别的不可判断区域的判定:
3.3softmax参数学习中风险系数 R ( w ) R(w) R(w)关于W的梯度以及推导:
∂
R
(
w
)
∂
W
=
−
1
N
∑
n
=
1
N
x
(
n
)
(
x
(
n
)
−
y
^
(
n
)
)
T
\frac{\partial R(w)}{\partial W}=-\frac1N\sum_{n=1}^Nx^{(n)}\left(x^{(n)}-\hat y^{(n)}\right)^T
∂W∂R(w)=−N1n=1∑Nx(n)(x(n)−y^(n))T
对于上面的推导过程,3.46的
d
i
a
g
(
y
^
(
n
)
)
−
1
diag(\hat y^{(n)})^{-1}
diag(y^(n))−1的变换
感知器: