《统计学习方法》笔记一

统计学习对象 统计学习对象是数据,从数据出发,提取出特征,抽象出数据模型,发现数据知识,用于对回溯的分析和预测中统计学习方法 获取新年数据集合 确定所有可能包含模型的假设空间,即学习模型的集合(模型) 确定模型选择准则(策略) 实现最优求解模型的算法(算法) 选择最优模型 利用最优模型分析预测新数据 监督学习每一个输入实例由一个输入向量表示 回归:输入输出变
摘要由CSDN通过智能技术生成
统计学习对象

统计学习对象是数据,从数据出发,提取出特征,抽象出数据模型,发现数据知识,用于对回溯的分析和预测中

统计学习方法
  • 获取新年数据集合
  • 确定所有可能包含模型的假设空间,即学习模型的集合(模型)
  • 确定模型选择准则(策略)
  • 实现最优求解模型的算法(算法)
  • 选择最优模型
  • 利用最优模型分析预测新数据
监督学习

每一个输入实例由一个输入向量表示
这里写图片描述

  • 回归:输入输出变量均为连续值
  • 分类:输出变量为有限哥离散值
  • 标注:输入输出变量均为变量序列

统计学习基本假设:训练数据与测试数据独立同分布

统计学习三要素:模型,策略,算法

常见损失函数

这里写图片描述

期望损失

这里写图片描述

经验损失

这里写图片描述

由大数定律,样本增加,经验损失趋近(依概率收敛)于期望损失

结构风险(奥卡姆剃刀原则)
  • 经验风险小的模型在小数据集上容易过拟合,结构风险最小化等价于正则化
  • 结构风险在经验风险的基础上增加增加模型复杂度正则化项(罚项)

这里写图片描述
这里写图片描述

训练误差与测试误差

这里写图片描述

  • 泛化能力:对未知样本的预测能力
  • 泛化误差:本质是模型的期望风险
生成模型与判别模型

这里写图片描述

判别模型是数据得出决策函数f(x)或者条件概率分布P(Y/X)作为预测的模型

分类指标

这里写图片描述

感知机:

二分线性分类,判别模型,误分类驱动,随机梯度下降优化

感知机函数

这里写图片描述

感知机损失函数

损失函数:误分类点集到超平面的距离和

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值