机器学习前言之基本概念

目录


https://blog.csdn.net/qq_33208851/article/details/95230847

基本概念

  • 在机器学习中,一般将样本分成独立的三部分:
    训练集(train set):用于建立模型
    验证集(validation set):用来确定网络结构或者控制模型复杂程度的参数(优化)
    测试集(test set):则检验最终选择最优的模型的性能如何
  • 特征向量(feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
  • 标记(label):实例类别的标记
    如下图: 4个训练集,6个属性,标记是享受运动中的是或否
    图1 分类训练集
  • 正(反)例(positive/negative example):如上图中享受运动的标记为“是”的是正例,为“否”的是反例
  • 分类(classification)和回归(regression):目标标记为类别型数据的是分类;目标标记为连续型数值的是回归
    在这里插入图片描述
    回归示例如下:
    图2 回归训练集
  • 有监督学习(supervised learning):训练集有类别标记。教会机器怎么学习
    无监督学习(unsupervised learning):训练集无类别标记。让机器自己学习
    半监督学习(semi-supervised learning):有类别标记的训练集+有无类别标记的训练集
    例如:研究肿瘤的良、恶性于尺寸,颜色之间的关系
    特征值:肿瘤尺寸,颜色
    标记:良性/恶性
    在给定训练集中,有特征值的数据信息而且有类别标记则为有监督学习,以此类推
    在这里插入图片描述
  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值