机器学习基础

最新推荐文章于 2024-09-03 16:59:08 发布

xuechanba

最新推荐文章于 2024-09-03 16:59:08 发布

阅读量722

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuechanba/article/details/124304889

版权

机器学习专栏收录该内容

19 篇文章 19 订阅

订阅专栏

机器学习

1、建立模型： 如：y=wx+b（房价模型）
2、学习模型： 如：确定 w，b
3、预测： 如：使用模型预测房价

学习算法： 从数据中产生模型的（计）算（方）法。

在这里插入图片描述

机器学习就是通过学习算法从数据中学习模型的过程。

数据集（data set）/样本集（sample set）

样本（sample）、属性（attribute）/特征（feature）、标记/标签（label）
在这里插入图片描述
学习模型/假设（hypothesis）/学习器（learner）:估计函数

真相/真实（ground truth）

标记/标签（label）：预测和分类的结果。房价、鸢尾花品种都是标记。对这种有标记的数据集进行的学习称之为监督学习。

监督学习

监督学习分为两种：分类（regression）和回归（classification）。

回归：预测连续值。

分类：预测离散值。
在这里插入图片描述

无监督学习

在样本数据 没有标记 的情况下，挖掘出 数据内部蕴含的关系。

聚类并不关心这一类是什么，因此不需要标记。只要能对抽取出来的特征计算距离就可以了。

对于同样的样本，抽取出来的特征不同，聚类的结果也会不同。
在这里插入图片描述
图2为鸢尾花数据集，没有标记，我们仅仅根据鸢尾花花瓣的长度和宽度也可以对它们进行聚类。图中红圈圈中的就是聚类的结果，结果很明显的分出了两类。那么在这两类中是否还包含了第三类呢？在没有标记的情况下就不太好区分了。

图3为标记好的鸢尾花数据集，两者进行比较后会发现还存在有第三个类别。

半监督学习

对于数据标记需要大量的人力资源，而我们日常生活中存在的是大量的没有标记的数据。因此为了更好的利用这些数据，就出现了半监督学习，半监督学习是一种将有监督学习和无监督学习相结合的范式。

机器学习的发展和应用

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

xuechanba 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。