李航-统计学习方法学习笔记-第一章

本文是李航《统计学习方法》第一章的学习笔记,主要探讨统计学习的三要素:模型、策略和算法。介绍了如何通过数据集确定模型、选择策略以及运用算法寻找最优模型,并对监督学习的基本概念进行了阐述,包括输入空间、输出空间、特征空间、联合概率分布和假设空间。
摘要由CSDN通过智能技术生成

统计学习方法李航

统计学习方法的三要素

1)模型

2)策略

3)算法


实现统计学习的步骤:

1)得到用来训练模型和测试模型的数据集(输入和输出(实际值)+需要进行预测的输入数据)

2)确定包含所有可能的模型的假设空间(模型的假设空间就是确定的带参的函数族,之所以说是有无数个是因为参数的选取相对来说是任意的),就是学习模型的集合

3)确定怎么样在假设空间中的带参的无限多个函数中间来选取最终模型的准则(就是说应该给予什么约束来确定最终模型),这种准则就是学习的策略

一般是用代价函数最为准则(策略)来确定最终模型的。代价函数指的就是带参的模型的估计值和实际值之间的差距(一般用以度量的代价函数就是平方损失,概率估计等),代价函数的选取就是确定学习的策略,还要加上规范化项(正则项)来约束这个模型(中的权重系数,使得权重系数不至于过大,因为权重系数过大可能会出现模型的过拟合,过拟合就是模型在训练样本中的估计情况比较好但是在测试样本中的表现就不行了)

4)有上述第三步确定了是由代价函数和规范化项来约束模型参数的选取的,最优模型当然是约束下的代价函数和规范化项取得最小值时候的参数了,这里如何求得代价函数和规范化项的最小值的算法就是学习的算法了(学习的意思就是通过算法求解模型的参数)

学习的算法有梯度下降法,正规矩阵求解等多元函数求导方法

5)通过学习方法(求解系数的算法)来求解最优模型

6)利用求得的最优模型来对新数据(测试数据或者是需要进行预测的数据)进行模型的检验或者是用模型进行预判


监督学习(重点):具有输出数据(标签)(可以根据输入数据和输出数据的离散还是连续来分为分类,回归和标注)

无监督学习:不具有输出数据,仅具有输入数据(一般是聚类分析)

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值