Python3入门机器学习之1.1机器学习世界的数据

Python3入门机器学习

1.1 机器学习世界的数据

以著名的鸢尾花数据为例,如下:
在这里插入图片描述
提取出关于它的数据,如下:
在这里插入图片描述

  • 数据整体叫数据集(data set)
  • 每一行数据成为一个样本(sample)
  • 除最后一列,每一列表达样本的一个特征(feature)
  • 最后一列,称为标记(label)
  • 第i个样本行写作:在这里插入图片描述
    第i个样本第j个特征值写作:在这里插入图片描述
  • 第i个样本的标记写作:在这里插入图片描述

每一个样本可以用一个特征向量来表示,整个数据集可用一个矩阵来表示,如下:
在这里插入图片描述

在每一样本中,可以在维度空间中用一个点来表示。例如,为了表示方便,我们只选取鸢尾花的萼片长度和宽度两个特征来描绘点,如下为n朵花的图:
在这里插入图片描述

  • 特征空间(feature space)
  • 分类任务本质就是在特征空间切分
  • 在高维空间同理

但是,特征可以很抽象,比如下面的图像:
在这里插入图片描述

  • 如一个图像,每一个像素点都是特征
  • 28 * 28的图像有28 * 28=784个特征
  • 如果是彩色图像特征更多
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值