《统计学习方法》笔记一

最新推荐文章于 2019-01-03 18:02:14 发布

chucksonwheel

最新推荐文章于 2019-01-03 18:02:14 发布

阅读量193

点赞数

分类专栏：学习笔记数据分析机器学习文章标签：数据分机器学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chucksonwheel/article/details/79442054

版权

学习笔记同时被 3 个专栏收录

16 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

一统计学习方法概论

1.1统计学习

学习：一个系统能够通过执行某个过程而得到性能的提升，那么这个过程就是学习。

对象：数据
处理过程：数据→特征→模型→知识→预测
学习方法分类：监督、半监督、非监督、强化学习

基本假设：

数据独立同分布
要学习的模型属于某个函数的集合

1.2监督学习

监督学习：学习一个模型，使得对任意给定的输入，对其输出进行好的预测

输入空间可以为特征空间，也可以为输入向量映射到特征向量得到的空间

输入输出均为连续变量——回归
输出为有限个离散变量——分类
输入输出均为变量序列——标注

假设：存在输入输出随机向量的联合分布函数P(X,Y)，训练数据与测试数据都是由该分布独立同分布产生的
假设空间（模型空间）：由输入空间到输出空间的映射的集合
模型的表示：Y=f(X) 或 p(Y|X)

1.3统计学习三要素

统计学习三要素：模型，策略，算法
模型：要学习的预测函数或条件概率分布函数
策略：学习准则或模型最优标准
算法：学习模型的具体计算方法

损失函数：一次预测好坏的评判

0-1
绝对值
平方
对数

风险函数：平均意义下的预测好坏评判，即损失函数的期望

学习的目标：选择期望风险最小的模型

两种途径：

用（训练样本的）经验风险近似期望风险（样本量大时有效）——最大似然估计
用加上与模型复杂的成正比的罚项构成结构风险近似期望风险（防止过拟合）——贝叶斯估计中的最大后验概率估计

具体算法：最优化
过拟合现象：模型的复杂度过高，对已知数据预测很好，对未知数据预测能力很差
为防止过拟合现象出现，应当选择合适的模型复杂度，使得预测误差最小，具体操作：

向最优化目标函数中加入正则化项（罚项）
例如：参数向量的1、2范数
交叉检验
例如：针对不同参数个数的模型的选择、针对不同训练集测试集数据分配产生模型的选择

泛化误差：模型对于未知数据的预测误差

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》笔记一

一统计学习方法概论1.1统计学习学习：一个系统能够通过执行某个过程而得到性能的提升，那么这个过程就是学习。对象：数据处理过程：数据→特征→模型→知识→预测学习方法分类：监督、半监督、非监督、强化学习基本假设：数据独立同分布要学习的模型属于某个函数的集合1.2监督学习监督学习：学习一个模型，使得对任意给定的输入，对其输出进行好的预测输入空间可以...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。