机器学习笔记

  1. 最大似然估计会系统性低估分布的方差,从而导致过拟合。设想样本来自高斯分布,我们希望从样本恢复分布(参数),最大似然估计给出的方差实际上是样本方差,是以样本均值为中心的二阶矩。样本均值虽然以真实均值为中心分布,但存在方差,由于以样本均值为中心的二阶矩小于以实际均值为中心的二阶矩,因此样本方差的期望小于实际方差,实际上前者比后者少了一个自由度。但是需要注意的是,我们说“过拟合”并不是指这种拟合或预测是错误的,而是指他们是“不合适”的,在简单的曲线拟合问题中,使用多个自由参数零误差拟合样本点是没有问题的,给出的预测的确是“似然概率最大”的结果,但其意义建立在两条几乎都不成立的假设之上——样本点无噪声以及参数等概率均匀分布。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值