机器学习入门 笔记(二) 机器学习基础概念

本文介绍了机器学习的基础,包括机器学习的数据、主要任务、监督学习与非监督学习的区别。通过鸢尾花数据集阐述了特征、样本和标记的概念,重点讨论了监督学习中的分类和回归任务。此外,还探讨了批量学习、在线学习、参数学习和非参数学习的差异,以及机器学习中数据和算法的重要性。
摘要由CSDN通过智能技术生成

1、机器的数据

在这里插入图片描述
我们以鸢尾花的数据为例。收集大量鸢尾花的数据,花瓣的萼片长度、萼片宽度、花瓣长度、花瓣宽度,同时标记属于se、ve、vi三种鸢尾花之一。

  • 数据的整体叫做数据集
    我们收集的所有鸢尾花的数据就是一个数据集。

  • 每一行数据称为一个样本
    (萼片长度=5.1,萼片宽度=3.5,花瓣长度=1.4、花瓣宽度=0.2、花期=se(0)),这样一行记录,称之为一个样本。

  • 除最后一列,每一列表达样本的一个特征
    我们把萼片长度、萼片宽度、花瓣长度、花瓣宽度,叫做样本的特征。
    (萼片长度=5.1,萼片宽度=3.5,花瓣长度=1.4、花瓣宽度=0.2)称为一个样本的特征向量。赋予语义以后,通常用一个列向量表示。
    在这里插入图片描述

  • 最后一列,称之为标记
    根据花朵的所有特征以及采集时花朵的状态,我们可以对花朵的花朵的花期进行标记,标记为待开的se(0)、盛放的ve(1)、凋谢的vi(2)三种。

  • 用大写字母X表示特征矩阵,用小写字母表示y表示标记。第i个样本行写作

在这里插入图片描述
第i个样本第j个特征值
在这里插入图片描述
第i个样本的标记写作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值