机器学习笔记DAY1

最新推荐文章于 2024-10-16 18:54:27 发布

haliaddel

最新推荐文章于 2024-10-16 18:54:27 发布

阅读量473

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haliaddel/article/details/102698880

版权

本文介绍了机器学习的基础术语，包括学习任务的分类、聚类学习、监督学习与无监督学习的区别，强调了泛化能力的重要性。同时，探讨了过拟合、误差评估方法如留出法、交叉验证和自助法，以及性能度量如均方误差、错误率、精度、查准率、查全率和F1度量。最后，讨论了代价敏感错误率和泛化误差的分解。

摘要由CSDN通过智能技术生成

一些基础术语

从数据中学得模型的过程称为学习或训练，这个过程通过执行某个学习算法来完成，训练过程中使用的数据称为训练数据，其中每个样本成为训练样本，训练样本组成的集合称为训练集。
如果预测的是离散值，此类学习任务称为分类，如果我们预测的是连续值，此类学习任务称为回归。
对西瓜做聚类将训练集中的西瓜分成若干组，每组称为一个簇，这些自动形成的簇可能对应一些潜在的概念划分。在聚类学习过程中，具体能划分哪些簇是我们事先不知道的，而却训练样本中通常不拥有标记信息。
根据训练数据是否拥有标记信息，学习任务可大致分为两大类：监督学习 和无监督学习，分类和回归是前者的代表，而聚类则是后者的代表。
学得模型适用于新样本的能力，称为泛化能力。
“从样例中学习”，被称为归纳学习，要求从训练数据中学得概念，因此也被称为概念学习或概念形成。

举个例子，现在有一批训练数据集，有三个维度，色泽，根蒂，敲声，来判断是否是一个“好瓜”的概念。于是我们学得的将是**“好瓜是某种色泽、某种根蒂、某种敲声的瓜”**，在这里&#x

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。