机器学习系列(5)——模型评估与选择方法

本文介绍模型评估与性能度量方法。

 

0x01、损失函数与风险函数

机器学习模型关于单个样本的预测值与真实值的差称为损失。损失越小,模型越好,如果预测值与真实值相等,就是没有损失。损失函数(或代价函数)度量模型一次预测的好坏,风险函数度量平均意义下模型预测的好坏。

1、常用的损失函数

(1)0-1损失函数(0-1 loss function)

        L(Y,f(X))=\left\{\begin{matrix} 1,~ Y \neq f(X) & \\ 0, ~Y = f(X) & \end{matrix}\right.    

(2)平方损失函数(quadratic loss function)

        L(Y,f(X))=(Y-f(X))^2   

(3)绝对损失函数(absolute loss function)

        L(Y,f(X))=|Y-f(X)|   

(4)对数损失函数(logarithmic loss function)或对数似然损失函数(log-likelihood loss function)

        L(Y,P(Y|X))=-logP(Y|X)  

损失函数值越小,模型就越好。由于模型的输入、输出 (X,Y) 是随机变量,遵循联合分布 P(X,Y),所以损失函数的期望是:

        R_{exp}(f)=E_{p}[L(Y,f(X))]=\int _{\chi \times \gamma }L(y,f(x))P(x,y)dxdy   

这是理论上模型 f(X) 关于联合分布 P(X,Y) 的平均意义下的损失,称为风险函数(risk function)或期望损失(expected loss)。学习的目标就是选择期望风险最小的模型。

给定一个训练数据集 T=\left\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N) \right\} ,模型 f(X) 关于训练数据集的平均损失称为经验风险(empirical risk)或经验损失(empirical loss)记作:

        R_{emp}(f)=\frac{1}{N} \sum_{i=1}^{N}L(y_i,f(x_i))   

期望风险 R_{exp}(f) 是模型关于联合分布的期望损失,经验风险

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值