ESL读书笔记2a:监督学习框架总览(未完待续)

本文为Element of Statistical Learning (ESL, https://web.stanford.edu/~hastie/ElemStatLearn/)的读书笔记。文中并不全是对原书的总结整理,很多内容是基于原书,笔者自己的演绎,不具有权威性,欢迎指教。


变量类型与表示方法

变量包括输入 X ,目标值(/真值)Y/G,预测输出 Y^ 。(文中还提到了ordered categorical的概念,但这里只提到一小段,到第四章再研究研究。
变量的格式类型包括:qualitative(离散的)和quantitive(连续的)。

根据变量类型不同,对其采用不同的表示方法。
1. 离散变量通常使用编码结果表示,一种常用的方法是dummy variables(/one-hot),即每个bit表示一类,同时只可能有一个bit设为1。这种表示的一个显著好处是不引入先验,所有目标值之间的距离相同(而且结果的可解释性强);这种方法的一个例子是:Hinton Neural Networks课程笔记4a:使用神经网络做逻辑推理。与dummy variables相对的表示离散变量的方式为压缩编码,常见的如果存在k类,则使用 ceil(log2k) bits表示。这种编码方式虽然可以节约空间,使用最少比特数存储信息,但是其中引入大量无意义的先验,这种表示通常是不被采用的。还有一种引入有意义先验的方法,即通过人为设置每个bit对应意义,对变量进行表示,这种方法的一个例子是LeNet的输出:LeNet论文阅读:LeNet结构以及参数个数计算
2. 连续变量通常是用浮点数值表示;但也有有意对其进行转化,表示为离散变量,如PixelCNN和WaveNet。

不同的变量和变量表示方式方法的组合,决定了解决问题和模型的不同。
1. 根据目标值 Y 格式的不同,可以将监督学习分为classification(分类)和regression(回归)两类问题。其中分类问题对应于离散的真值,而回归问题对应于连续的真值。
2. 输入X格式的不同,决定了模型的适用性。有的模型是基于离散输入开发,有的基于连续输入开发,还有的则两者皆可。

须注明的是,
1. 采用何种表示方法与模型对其的处理方法不相关。例如使用one-hot的方法对真值 Y 进行编码之后,通常将其看做连续的变量,与预测输出Y^进行加减乘除。
2. 变量本身的天然类型与实际使用的表示方法不相关。例如WaveNet对音频的幅值做离散化表示。


未完待续

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《统计学习基础》是斯坦福大学教授Trevor Hastie、Robert Tibshirani和Jerome Friedman合著的一本经典教材,是统计学习领域的权威之作。该书系统地介绍了统计学习的基本概念、原理和方法,并提供了丰富的实例和练习题,可作为统计学习入门者的参考教材。 这本书主要包含了监督学习、非监督学习和半监督学习三个方面的内容。在监督学习部分,介绍了线性回归、逻辑回归、支持向量机等经典方法,以及决策树、随机森林和提升方法等集成学习方法。在非监督学习部分,详细讨论了聚类分析、主成分分析、混合模型等方法。在半监督学习部分,介绍了利用有标签数据和无标签数据相结合的方法。 《统计学习基础》着重于理论和实践相结合,每个方法都有相关的数学推导和算法描述,并以实例和图表的形式直观展示。同时,书中也介绍了一些统计学习中的常用工具和技巧,如交叉验证、正则化、特征选择等,以帮助读者更好地理解和应用统计学习方法。 对于统计学习入门者而言,读完《统计学习基础》可以获得对统计学习的整体认识和基本掌握。然而,由于书中内容深入且繁杂,需要读者具备一定的数学和统计基础才能更好地理解和应用其中的方法。因此,建议读者在阅读该书之前,先对数学和统计学的基本理论有所了解,以更好地理解书中内容,同时辅以相关实例和练习题的训练,实践掌握统计学习的方法和技巧。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值