HBU_神经网络与深度学习作业1 机器学习概述

ZodiAc7

已于 2022-09-19 10:02:02 修改

阅读量637

点赞数 1

于 2022-09-18 17:03:46 首次发布

本文链接：https://blog.csdn.net/m0_61227501/article/details/126918106

版权

写在前面的一些内容

本次习题来源于神经网络与深度学习 pdf电子书的第66页和第67页（对应纸质版第51页和第52页）的习题2-1和习题2-12。
水平有限，难免有误，如有错漏之处敬请指正。

习题2-1

分析为什么平方损失函数不适用于分类问题。

答：
①平方损失函数定义如下：
$\begin{align} \mathcal{L}(y,f(\boldsymbol{x};\theta))=\frac{1}{2}(y-f(\boldsymbol{x};\theta))^2\end{align}$ 该函数通过计算预测值和真实值的偏差程度来计算误差，通过在正态分布的数据上进行极大似然估计。但是并非所有分类问题的分布都服从正态分布。
②分类问题可以拿“非黑即白”来形容——即分类问题的标签之间并没有连续的关系，分类分对了就是正确、分错了就是错误。所以说，不能用损失函数的大小来确定你的分类是否正确，因此预测值和标签之间的平方差无法反应分类问题的优化程度，也就不能使用平方损失函数来当作分类问题的损失函数。

习题2-12

对于一个三分类问题，数据集的真实标签和模型的预测标签如下：


真实标签	1	1	2	2	2	3	3	3	3
预测标签	1	2	2	2	3	3	3	1	2

分别计算模型的精确率、召回率、F1值以及它们的宏平均和微平均。

答：①精确率
$\begin{align} P_1=\frac{TP_1}{TP_1+FP_1}=\frac{1}{1+1}=\frac{1}{2} \end{align}$
$\begin{align} P_2=\frac{TP_2}{TP_2+FP_2}=\frac{2}{2+2}=\frac{1}{2} \end{align}$
$\begin{align} P_3=\frac{TP_3}{TP_3+FP_3}=\frac{2}{2+1}=\frac{2}{3} \end{align}$ ②召回率
$\begin{align} R_1=\frac{TP_1}{TP_1+FN_1}=\frac{1}{1+1}=\frac{1}{2} \end{align}$
$\begin{align} R_2=\frac{TP_2}{TP_2+FN_2}=\frac{2}{2+1}=\frac{2}{3} \end{align}$
$\begin{align} R_3=\frac{TP_3}{TP_3+FN_3}=\frac{2}{2+2}=\frac{1}{2} \end{align}$ ③F1值 $\beta$ =1
$\begin{align} F1_1=\frac{(1+\beta^2)×P_1×R_1}{\beta^2×P_1×R_1}=\frac{2*\frac{1}{2}*\frac{1}{2}}{1*\frac{1}{2}+\frac{1}{2}}=\frac{1}{2} \end{align}$
$\begin{align} F1_2=\frac{(1+\beta^2)×P_2×R_2}{\beta^2×P_2×R_2}=\frac{2*\frac{1}{2}*\frac{2}{3}}{1*\frac{1}{2}+\frac{2}{3}}=\frac{4}{7} \end{align}$
$\begin{align} F1_3=\frac{(1+\beta^2)×P_3×R_3}{\beta^2×P_3×R_3}=\frac{2*\frac{2}{3}*\frac{1}{2}}{1*\frac{2}{3}+\frac{1}{2}}=\frac{4}{7} \end{align}$
④宏平均
$\begin{align} Macro_P=\frac{1}{3}\sum_1^3P_i=\frac{5}{9} \end{align}$
$\begin{align} Macro_R=\frac{1}{3}\sum_1^3R_i=\frac{5}{9} \end{align}$
$\begin{align} Macro_F=\frac{2×Macro_P×Macro_R}{Macro_P+Macro_R}=\frac{5}{9} \end{align}$
⑤微平均
$\begin{align} Micro_P=\frac{\sum TP_i}{\sum TP_i+\sum FP_i}=\frac{5}{8} \end{align}$
$\begin{align} Micro_R=\frac{\sum TP_i}{\sum TP_i+\sum FN_i}=\frac{5}{9} \end{align}$
$\begin{align} Micro_F=\frac{2×Micro_P×Micro_R}{Micro_P+Micro_R}=\frac{10}{17} \end{align}$