习题3-2 在线性空间中,证明一个点x到平面的距离为
设平面上有点x1,使得x-x1与该平面垂直
w也与该平面垂直,所以w和x-x1平行 即:x-x1=kw(k是常数)
点x到平面的距离为|k| ||w||
即
两边同时取模得
点到平面的距离即证得
习题3-5 在Logistic回归中,是否可以用去逼近正确的标签y,并用平方损失最小化来优化参数w
在以sigmoid为激活函数时,不能使用平方损失作为loss function,效果远不如cross entropy
(1)当以平方损失作为loss function时
当趋近正无穷和负无穷时,sigmoid函数趋于平缓,靠近中间,导数几乎为0,导致趋近0,w 很难去优化
(2)当以cross entropy作为loss function时
可以看到梯度公式中没有,权重受影响,所以当误差大时权重更新快,误差小时权重更新慢,所以当使用sigmoid 作为激活函数时,常用交叉熵损失函数而不用均方误差损失函数
习题3-6 在Softmax回归的风险函数(公式(3.39))中,如果加上正则化项会有什么影响 ?
加入正则化后:
加入正则化后,在参数更新时每次需要减使参数不会太大,不会造成溢出之类的错误,同时也抑制过拟合
ref: