机器学习导论第二章--学习心得1

最新推荐文章于 2022-07-01 17:14:02 发布

学习小玩家

最新推荐文章于 2022-07-01 17:14:02 发布

阅读量602

点赞数

文章标签：机器学习预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ab_1_2_3_4_5_6_7_8_9/article/details/78985801

版权

今天想写一些关于机器学习--监督学习的内容。

监督学习分为分类和回归两大问题。

一、分类

1、最简单的，0/1分类。

输入是训练集，输出是0/1。通过训练，计算机得到输入-输出的关系，确定一个假设类H（存在多种假设h(x)）。假设h(x)对实例x做出预测，根据预测结果得到假设h的误差。计算机要在这个假设类中找到最接近真实输出的假设（误差最小）。

这里要考虑一个泛化的问题，即我们的假设对不在训练集中的未来实例的分类准确率如何。

VC维：假定一个数据集包含N个点。这N个点可以用2的N次方种方法标记为正例(1)和负例(0)。因此，这N个数据点可以定义2的N次方中不同的学习问题。如果对于这些问题中的如何一个，我们能够找到一个假设h(属于H)将正例和负例分开，则我们就称H散列(shatter)N个点。

VC维度量的是假设类H的学习能力。

2、学习多类

输入训练集，输出有K个类，K>2

二、回归

根据输入-输出的映射关系，找到合适的假设模型，对未来的数据进行预测。

噪声：存在我们无法观测到的额外隐藏变量(训练集中没有的变量)。

1、模型选择。要求：假设的复杂性与潜在数据的函数的复杂性相当。

若假设复杂性高于函数的复杂性：过拟合。六次多项式拟合三次多项式

若假设复杂性低于函数的复杂性：欠拟合。直线拟合三次多项式

建立训练集、验证集、检验集

训练集：得到不同阶数的假设函数

验证集：求出所有假设函数中损失函数最小的那个假设函数（检验假设的泛化能力）

检验集：试验。

2、损失函数

预测值和真实值的差值的平方之和。也有绝对值之和

3、最优化过程

使损失函数最小化的过程。（梯度下降法、模拟退火、遗传算法）

学习小玩家

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。