机器学习与数据挖掘 第四讲 误差和噪声

噪音

  • 输入特征不准确
  • 输出错误

目标分布

在有噪音的情况下 y y y的输出带有了概率性,即 y y y服从如下分布: X ∼ P ( X ) X ∼P(X) XP(X) y ∼ P ( y ∣ X ) y ∼P(y|X) yP(yX) P ( y ∣ x ) = f ( x ) + n o i s e P(y|x)=f(x)+noise P(yx)=f(x)+noise,X 条 件 下 条件下 Y$ 出现的概率分布。
P ( y ∣ x ) P(y|x) P(yx)为目标分布,进而可以得到mini target function f ( x ) f(x) f(x)

误差衡量

  • 0/1错误 预测≠目标,通常用于分类
  • 平方错误,衡量预测与目标之间的距离,通常用于回归

根据不同的应用,我们需要选择不同的错误衡量方式。在二元分类中,根据不同的应用场景,可对false reject and false accept造成损失的代价不同,赋予不同的权重,以便在选择近似函数时对错误衡量有所偏重。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值