第06课:机器学习三要素之数据、模型、算法

本文详细介绍了机器学习中的三要素:数据(包括源数据、向量空间模型和有标注数据)、模型(作为机器学习的结果,通过训练得到)和算法(如梯度下降法,用于优化模型)。重点讨论了数据转换、特征工程、模型训练及有监督学习中的损失函数和优化算法。强调了高质量标注数据对模型质量的重要性。
摘要由CSDN通过智能技术生成

机器学习三要素包括数据、模型、算法。简单来说,这三要素之间的关系,可以用下面这幅图来表示:

enter image description here

总结成一句话:算法通过在数据上进行运算产生模型

下面我们先分别来看三个要素。

数据

enter image description here

关于数据,其实我们之前已经给出了例子。

源数据

上一篇中,图1老鼠和其他动物图2小马宝莉六女主就是现实中的两份样本集合。如果我们要训练“老鼠分类器”,或者做“小马种族聚类” 分析的话,它们就是原始数据(Raw Data)。

不过,我们之前也说了,计算机能够处理的是数值,而不是图片或者文字。

向量空间模型和无标注数据

那么,我们就需要构建一个向量空间模型(Vector Space Model/VSM)。VSM 负责将一个个各种格式(文字、图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

叶锦鲤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值