模型评价指标---分类，聚类，回归

最新推荐文章于 2024-07-13 18:02:48 发布

guying1998

最新推荐文章于 2024-07-13 18:02:48 发布

阅读量864

点赞数 24

分类专栏： AI相关文章标签：分类聚类回归

本文链接：https://blog.csdn.net/weixin_49744683/article/details/135957966

版权

AI相关专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文详细介绍了模型评价指标在回归任务（如R方、R2、MSE、RMSE、MAE等）和分类任务（如准确率、召回率、精度、F1分数、ROC曲线和AUC值）中的应用，以及聚类评估中的轮廓系数。

摘要由CSDN通过智能技术生成

模型评价指标---分类，聚类，回归

模型评价指标

模型评价指标

模型在训练完成之后，如何评价这个模型对任务的匹配程度，用评价评价指标进行判断。不同的任务需要采取不同的评价指标，下面对不同的任务的评价指标做一个总结。

回归

回归的指标可分为三大类别：1.模型拟合优度评价 2.模型预测值和真实值之间差异的评价 3.极大似然法的估计准则

模型拟合优度评价(R方,改良R方)

$R^{2}$

自变量可以解释因变量的比例，可以通俗地理解为使用均值作为误差基准，看预测误差是否大于或者小于均值基准误差。

$R^{2} = 1-\frac{SSE}{SST}$
其中
$SSE=\sum (y_{i}-\hat{y_{i}})^2$ – 残差平方和，表示预测值和真实值之间的差异，差异越大，说明模型不能解释的部分越多。
$SST=\sum (y_{i}-\bar{y})^2$ – 总体平方和，表示数据分散的程度
$SSR=\sum (\hat{y_{i}} -\bar{y} )^2$ – 回归平方和，表示预测值的分散程度。
$SSE = SST - SSR$

$R^{2}$ 并不是R的平方，其值有正有负，
$R^{2}=1$ ，预测值 == 真实值，模型对数据解释程度好
$R^{2}=0$ ，预测值 == 真实值均值
$R^{2} < 0$ ，模型等于盲猜，还不如直接求均值,数据可能不存在线性关系

改良版 $R^{2}$

$R^{2}$ 随着自变量X（特征数）的个数增加， $R^{2}$ 会越来越大， $R^{2}$ 越来越大就会认为模型拟合越来越好，但是实际上可能是由于自变量个数的增加导致的 $R^{2}$ 增大。

$R^{2} = 1 -（1-R^{2}）\frac{n-1}{n-k-1}$

调整后的 $R^{2}$ 同时考虑了样本量n和自变量个数k(特征数），且调整后 $R^{2}$ 不会随自变量个数的增大而增大。

预测值和真实值之间差异评价

MSE 均方误差，又称L2范数损失
$\frac{1}{n} \sum_{n}^{i=1} (\hat{y_{i}} -y_{i})^{2}$
RWSE 均方误差根
$\sqrt{ \frac{1}{n} \sum_{n}^{i=1} (\hat{y_{i}} -y_{i})^{2}}$

MSE对比于RMSE，RMSE消除了量纲的影响

MAE 平方绝对误差
$\frac{1}{n} \sum_{n}^{i=1} |\hat{y_{i}} -y_{i}|$
MAPE 平均绝对百分误差
$\frac{1}{n} \sum_{n}^{i=1} |\frac{\hat{y_{i}} -y_{i}}{y_{i}}|$

MAE和RMSE一样，衡量的是真实值与预测值的偏离的绝对大小情况；而MAPE衡量的是偏离的相对大小（即百分率）
相对来说，MAE和MAPE不容易受极端值的影响；而MSE/RMSE采用误差的平方，会放大预测误差，所以对于离群数据更敏感，可以突出影响较大的误差值

极大似然法的估计准则（AIC，BIC）

AIC 赤池信息准则
$AIC = -2LL_{max} + 2k$
BIC 贝叶斯信息量准则
$BIC = -2LL_{max} + kln(N)$

$LL_{max}$ 对数似然估计值,k 是参数量，N是样本量
模型的AIC值和BIC值越小，说明模型估计越准确。

分类

混淆矩阵

label	预测正	预测负	合计
正例	TP(真正例)	FN（假反例）	P（正元组）
负例	FP(假正例)	TN（真反例）	N（负元组）
TP+TN （总预测对的样本）FN+FP（总预测错的样本） P+N（总样本量）

准确率（Accuracy）

准确率，也叫分类准确率，总预测对的样本/ 总样本数
$\frac{TP+TN}{P+N}$
分类正确的样本占总样本个数的比例，最直观的评价指标，但同时存在明显的缺陷，这个评价指标很容易受到样本数量以及样本不均衡带来的影响

召回率（Recall）

召回率，也叫（查全率，敏感度、真正例率）
$\frac{TP}{P}$
分类正确的正样本个数占真正的正样本个数的比例

精度（Precision）

$\frac{TP}{TP+FP}$

分类模型中正确的正样本个数占分类器判定为正样本的样本个数的比例

F1分数

$\frac{2\times precision\times recall }{precision + recall}$

精确率和召回率的加权调和平均数
为了通俗理解举个栗子：
1.地震，为了不漏报，宁愿报错不愿漏报，提升召回率（recall）
2.银行人脸识别：不能接受误检，提升精度（Precision）

在诊断为癌症的一堆人中，到底有多少人真得了癌症？—用Precision
在一堆得了癌症的病人中，到底有多少人能被成功检测出癌症？— 用recall
在一堆癌症病人和正常人中，有多少人被系统给出了正确诊断结果（患癌或没患癌）？— 用Accuracy

ROC曲线和AUC值

ROC（Receiver Operating Characteristic，受试者工作特征）曲线，分类器性能的图形工具，它显示了在不同阈值下分类器的真阳性率（True Positive Rate，TPR）和假阳性率（False Positive Rate，FPR）之间的关系
AUC值：AUC（Area Under the Curve）值表示ROC曲线下的面积，用于衡量分类器性能。AUC值越接近1，表示分类器性能越好；反之，AUC值越接近0，表示分类器性能越差。

聚类

轮廓系数

$\frac{b-a}{max(a,b)}$

a是内聚度可以理解为反映一个样本点与类内元素的紧密程度。
b是分离度可以理解为反映一个样本点与类外元素的紧密程度
轮廓系数提供了对聚类质量的整体衡量范围[1,-1]之间，
类内的距离小于类间距离，则聚类结果更紧凑。S的值会趋近于1，接近1意味着紧凑且分离良好。
类内的距离大于类间距离，说明聚类的结果很松散。S的值会趋近于-1，越趋近于-1则聚类的效果越差
在0附近表示重叠。

参考链接

guying1998

关注

24
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
模型评价指标---分类，聚类，回归

在一堆癌症病人和正常人中，有多少人被系统给出了正确诊断结果（患癌或没患癌）？– 残差平方和，表示预测值和真实值之间的差异，差异越大，说明模型不能解释的部分越多。在一堆得了癌症的病人中，到底有多少人能被成功检测出癌症？在诊断为癌症的一堆人中，到底有多少人真得了癌症？—用Precision。1.地震，为了不漏报，宁愿报错不愿漏报，提升召回率（recall）2.银行人脸识别：不能接受误检，提升精度（Precision）– 回归平方和，表示预测值的分散程度。– 总体平方和，表示数据分散的程度。
复制链接

扫一扫