pdf的版本式30September2019的
3-1:决策平面的法向量不就是权重向量\omega嘛
3-2:略
3-3每次更新\omega的时候都有样本特征向量出现;
3-6:我觉得是可以的,因为|sigma的取值范围是0~1,而在这个平方损失函数里正好是单调的
3-7:见p64(虽然我没有很明白,如果仅仅从数学上为何要去考虑数值增益的事情,而且要是这样的话,哪怕分两类也要类似考虑):
要注意的是,Softmax 回归中使用的C 个权重向量是冗余的,即对所有的
权重向量都减去一个同样的向量v,不改变其输出结果。因此,Softmax
回归往往需要使用正则化来约束其参数。此外,我们还可以利用这个特
性来避免计算softmax 函数时在数值计算上溢出问题。
3-10:直觉
3-11:代入即可