NNDL 作业2

第二章课后题

习题2-1 分析为什么平方损失函数不适用于分类问题,交叉熵损失函数不适用于回归问题。

1.什么是平方损失函数?

平方损失函数为:L(y,f(x))=\frac{1}{2}(y-f(x))^{2},计算的是真实值y与预测值f(X)的平方差,计算的是两者之间的差距,非负的对称,连续可导。

2.什么是交叉熵损失函数?

交叉熵损失函数为H(p,q)=-\sum_{i=1}^{n}p(x_{i})log(q(x_{i})),交叉熵用于度量两个概率分布之间的差异性,在二分类损失函数中L=-\left [ ylog\widehat{y}+(1-y)log(1-\widehat{y}) \right ],展示真实的概率分布与预测概率分布之间的差异。

3.为什么平方损失函数不适用于分类任务?

 首先明确分类任务是在多分类任务中y=\left \{ 1,2,3,...n \right \}可以看出来分类问题是输出结果是离散的。分类任务是对离散值进行预测,比如是或者不是,或者说是属于哪一类,平方损失函数是以预测值为均值的高斯分布。损失函数是在这个情况下真实值的似然估计,softmax损失意味着真实标签的似然度,分类任务中每个标签之间的距离是没有实际意义的,预测值和标签两个向量之间的平方差不能反映分类问题的优化程度。

使用平方损失函数以为默认数据服从正态分布,显然二分类任务服从伯努利分布,假设样本为\left \{ +1,-1 \right \},因此当y_{_{i}}f(x;w)>0,分类正确,对于二分类又可以改写成(1-yf(x;w))^{^{2}}

这是凹函数,不能保证最小化。

4.为什么交叉熵损失函数不适用于回归任务?

回归任务是对连续值进行预测(如值为多少),交叉熵损失函数只针对于分类正确的结果,回归任务中需要考虑错误的,需要让回归中的函数满足所有的样本,交叉熵损失函数中的y表示真实值,0或者1,只有两个取值,\widehat{y}代表预测值/估计值,取值范围为0~1,让正确类变大,错误分类平均。而且计算时无需知道相邻像素是否为边界,因此不适用于回归任务。

习题2-2  对于一个三分类问题,数据集的真实标签和模型的预测标签如下:

 

分别计算模型的精确率、召回率、F1值以及它们的宏平均和微平均

    真实情况            预测结果
      正例      反例
      正例   TP(真正例)   FN(假反例)
      反例   FP(假正例)   TN(真反例)

精确率(查准率):P=\frac{TP}{TP+FP}

P_{1}=\frac{1}{1+1}=\frac{1}{2}

P_{2}=\frac{2}{2+2}=\frac{1}{2}

P_{3}=\frac{2}{2+1}=\frac{2}{3}

召回率(查全率):R_{1}=\frac{TP}{TP+FN}

R_{1}=\frac{1}{1+1}=\frac{1}{2}

R_{2}=\frac{2}{2+1}=\frac{2}{3}

R_{3}=\frac{2}{2+2}=\frac{1}{2}

F1=\frac{(1+\beta ^{2})*P*R}{\beta ^{2}*P+R}

F1_{1}=\frac{2*\frac{1}{2}*\frac{1}{2}}{1*\frac{1}{2}+\frac{1}{2}}=\frac{1}{2}

F1_{2}=\frac{4}{7}

F1_{3}=\frac{4}{7}

宏平均:

P_{macro}=(0.5+0.5+0.67)/3=\frac{5}{9}

R_{macro}=(0.5+0.5+0.67)/3=\frac{5}{9}

F1_{macro}=(2*0.56*0.56)/(0.56+0.56)=\frac{5}{9}

微平均:

P_{micro}=\frac{5}9{}

R_{micro}=\frac{5}{9}

F1_{micro}=(2*0.56*5.56)/(0.56+0.56)=\frac{5}{9}

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值