统计学习方法笔记——第一章

在这里插入图片描述
1.模型
带^的是最优值 不带^的是所有的假设空间中的值
在这里插入图片描述
在这里插入图片描述
找最优θ的问题
找条件概率的方式也是同理
在这里插入图片描述
2.策略
在这里插入图片描述
在这里插入图片描述模型评估和模型选择
在这里插入图片描述
在这里插入图片描述
带^的是训练集上的经验风险,训练集上的经验风险和期望风险之间差值用一个误差delta可以控制 (N样本量 d备用模型个数 delta)
在这里插入图片描述
生成模型还需要考虑X,Y的联合分布,在判别方法中不去考虑X是不是随机的,但是在生成方法中X,Y是随机的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
回归问题得到的值是连续的值,分类是离散的值

极大似然估计和贝叶斯估计

在这里插入图片描述
在已经有了θ,根据实验结果写出出现这个结果的概率
联合概率可以用连乘的形式,因为几个概率之间都是相互独立的,所以可以写成连乘的形式
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
根据样本的概率分布 写出样本联合概率的似然函数 然后最大化似然函数 求出联合概率的估计值,极大似然估计只用到了样本信息。

贝叶斯估计

除了样本信息还要用到先验信息
在估计之前已经有了θ一个先验的取值 假设其分布满足β分布 有了一个概率密度函数
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
样本量大的情况两者类似,样本量小的情况贝叶斯估计更好 比如1
在这里插入图片描述

贝叶斯估计例题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
分母全概率如果是离散的就是求和 连续的就是求积分
在这里插入图片描述
在这里插入图片描述

极大似然估计例题

在这里插入图片描述
连乘的原因:假设独立同分布
为什么是概密函数而不是概率 因为某个点的概率等于面积 常数项没影响所以可以用概率密度来替代
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值