ESL读书笔记2a：监督学习框架总览（未完待续）

最新推荐文章于 2024-05-25 14:58:26 发布

silent56_th

最新推荐文章于 2024-05-25 14:58:26 发布

阅读量907

点赞数

分类专栏：监督学习 ESL 文章标签：框架读书笔记机器学习

本文链接：https://blog.csdn.net/silent56_th/article/details/78003518

版权

ESL 同时被 2 个专栏收录

5 篇文章 1 订阅

订阅专栏

监督学习

1 篇文章 0 订阅

订阅专栏

本文为Element of Statistical Learning (ESL, https://web.stanford.edu/~hastie/ElemStatLearn/)的读书笔记。文中并不全是对原书的总结整理，很多内容是基于原书，笔者自己的演绎，不具有权威性，欢迎指教。

变量类型与表示方法

变量包括输入 $X$ ，目标值（/真值） $Y/G$ ，预测输出 $\hat Y$ 。（文中还提到了ordered categorical的概念，但这里只提到一小段，到第四章再研究研究。）
变量的格式类型包括：qualitative（离散的）和quantitive（连续的）。

根据变量类型不同，对其采用不同的表示方法。
1. 离散变量通常使用编码结果表示，一种常用的方法是dummy variables（/one-hot），即每个bit表示一类，同时只可能有一个bit设为1。这种表示的一个显著好处是不引入先验，所有目标值之间的距离相同（而且结果的可解释性强）；这种方法的一个例子是：Hinton Neural Networks课程笔记4a：使用神经网络做逻辑推理。与dummy variables相对的表示离散变量的方式为压缩编码，常见的如果存在k类，则使用 $\text{ceil}(\log_2k)$ bits表示。这种编码方式虽然可以节约空间，使用最少比特数存储信息，但是其中引入大量无意义的先验，这种表示通常是不被采用的。还有一种引入有意义先验的方法，即通过人为设置每个bit对应意义，对变量进行表示，这种方法的一个例子是LeNet的输出：LeNet论文阅读：LeNet结构以及参数个数计算。
2. 连续变量通常是用浮点数值表示；但也有有意对其进行转化，表示为离散变量，如PixelCNN和WaveNet。

不同的变量和变量表示方式方法的组合，决定了解决问题和模型的不同。
1. 根据目标值 $Y$ 格式的不同，可以将监督学习分为classification（分类）和regression（回归）两类问题。其中分类问题对应于离散的真值，而回归问题对应于连续的真值。
2. 输入 $X$ 格式的不同，决定了模型的适用性。有的模型是基于离散输入开发，有的基于连续输入开发，还有的则两者皆可。