02 机器学习中的评估指标

最新推荐文章于 2023-04-03 21:05:37 发布

Song_Lynn

最新推荐文章于 2023-04-03 21:05:37 发布

阅读量442

点赞数

分类专栏：机器学习文章标签：机器学习评估指标评估方法

本文链接：https://blog.csdn.net/Song_Lynn/article/details/80015295

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

机器学习中的评估指标

1. 机器学习的目标

根本目标：

在给定的训练数据上，试图训练出能够归纳数据的规律的模型，并且能在未知样本上也有好的效果。
泛化能力强的模型最好

能很好地适用于未知样本，如错误率低，精度高

2. 评估方法

使用测试集数据进行可靠的评估

测试集：测试集（用于评估）应该与训练集（用于模型学习）“互斥”

常见方法：

留出法 hold-out
- 保持数据分布一致（如：分层采样）
- 多次重复划分（如：100次随机划分）
- 数量适中，20-30%

这里写图片描述

交叉验证法 cross-validation
- k折交叉验证
- 若k = m，则得到留一法（leave-one-out，LOO）

这里写图片描述

自助法 bootstrap
- 基于“自助采样”的方法（bootstrap smapling）
- 别称：“有放回采样”，“可重复采样”
- 约有36.8%的样本不出现
  - 训练集与原样本集同规模，且数据分布有所改变（可能会重复出现）
  - 测试集：训练集中未出现的原样本

lim m \to + \infty (1 - 1 m) m = 0.368 (13)

$\begin{align} \lim_{m\rightarrow+\infty} (1-\frac{1}{m})^m = 0.368 \end{align}$

3. 评估度量标准

性能度量 performance measure：

衡量模型泛化能力的数值评价标准，反应了当前问题（任务需求）

使用不同的性能度量可能会导致不同的评判结果

模型的“好坏”，不仅取决于算法和数据，还取决于**当前任务需求**

常用性能度量：

- 分类问题

1. 错误率：

E (f; D) = 1 m \sum i = 1 m I (f (x) \neq y i) (14)

$\begin{align} E(f;D) = \frac{1}{m}\sum_{i=1}^m\mathbb I(f(x)\neq y_i) \end{align}$

2. 精度：

a c c (f; D) = 1 m \sum i = 1 m I (f (x) = y i) = 1 - E (f; D) (15)

$\begin{align} acc(f;D) = \frac{1}{m}\sum_{i=1}^m\mathbb I(f(x) = y_i) = 1 - E(f;D) \end{align}$

指示函数，当括号内的条件成立时取 1 ，不成立时取 0

二分类混淆矩阵：

真实情况	预测情况
真实情况	正例	反例
正例	TP（真正例）	FN（假反例）
反例	FP（假正例）	TN（真反例）

3.查准率（准确率）：预测出的正例中真实的正例所占比例

P = T P T P + F P (16)

$\begin{align} P = \frac{TP}{TP+FP} \end{align}$

4.查全率（召回率）：真实的正例中预测正确的比例

R = T P T P + F N (17)

$\begin{align} R = \frac{TP}{TP+FN} \end{align}$

5.F1值：

F 1 = 2 \times P \times R P + R = 2 \times T P m + T P - T N (18)

$\begin{align} F1 = \frac{2 \times P \times R}{P + R} = \frac{2 \times TP}{m + TP - TN} \end{align}$

F β = ( 1 + β 2 \times P \times R ) ( β 2 \times P ) + R (19)

$\begin{align} F_\beta = \frac{(1 + \beta^2 \times P \times R)}{(\beta^2 \times P) + R} \end{align}$

通过设置权重 \beta ，调整查准率与查全率的重要度
\beta > 1 时，查全率有更大影响；
\beta < 1 时，查准率有更大影响；

6.ROC && AUC

ROC：Receiver Operating Characteristic Cruve
AUC：Area Under thd ROC Cruve，即曲线下方的面积

A U C = 1 - 1 m + m - \sum x + \in D \sum x - \in D (I (f (x +) < f (x -)) + 1 2 I (f (x +) = f (x -))) (20)

$\begin{align} AUC = 1 - \frac{1}{m^+m^-}\sum_{x^+ \in D}\sum_{x^- \in D}(\mathbb I(f(x^+) < f(x^-)) + \frac{1}{2}\mathbb I(f(x^+) = f(x^-))) \end{align}$

AUC值范围 0~1，值越大，结果越好

- 回归问题

1.平均绝对误差：MAE(Mean Absolute Error)

M A E = 1 n \sum i = 1 n ∣ f i - y i ∣ (57)

$\begin{align} MAE = \frac{1}{n}\sum_{i=1}^n\mid f_i - y_i \mid \end{align}$

2.均方误差：MSE(Mean Square Error)

M A E = 1 n \sum i = 1 n (f i - y i) 2 (58)

$\begin{align} MAE = \frac{1}{n}\sum_{i=1}^n( f_i - y_i)^2 \end{align}$

3.均方根误差：RMSE(Root Mean Square Error)

R M S E = M S E - - - - - \sqrt (59)

$\begin{align} RMSE = \sqrt{MSE} \end{align}$

4.R平方

r 2 = 1 - S S r e s S S t o t = 1 - \sum ( y i - f i ) 2 \sum ( y i - y m e a n ) 2 (60)

$\begin{align} r^2 =1 - \frac{SS_{res}}{SS_{tot}} = 1 - \frac{\sum(y_i - f_i)^2}{\sum(y_i - y_{mean})^2} \end{align}$

其它详细内容：https://blog.csdn.net/batuwuhanpei/article/details/51884351

Song_Lynn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
02 机器学习中的评估指标

机器学习中的评估指标1. 机器学习的目标根本目标：在给定的训练数据上，试图训练出能够归纳数据的规律的模型，并且能在未知样本上也有好的效果。泛化能力强的模型最好能很好地适用于未知样本，如错误率低，精度高2. 评估方法使用测试集数据进行可靠的评估测试集：测试集（用于评估）应该与训练集（用于模型学习）“互斥”常见方法：留出法 hold-out 保持数...
复制链接

扫一扫

专栏目录