机器学习中的基本概念

基本概念有:
训练集,测试集,特征向量,概念学习,监督学习,非监督学习,半监督学习,分类,回归
 
  1. 训练集:用来进行训练,也就是产生模型或者算法的数据集
  2. 测试集:用来专门进行测试已经学习好的模型或者算法的数据集
  3. 特征向量:属性的集合,通常用一个向量来表示,附属于一个实例
  4. 概念学习:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数
  5. 监督学习:训练集有类别标记(label,即下面的 c(x))
  6. 非监督学习:训练集无类别标记(不知道训练结果)
  7. 半监督学习:有类别标记的训练集 + 无标记的训练集
  8. 分类:目标标记为类别型数据(如是、否)
  9. 回归:目标标记为连续性数值(如1000、3000、5000)
 
举例(关于上述概念1、2、3、4):学习 “享受运动"  这一概念:
     
     小明进行水上运动,是否享受运动取决于很多因素
 
     
样例天气温度湿度风力水温预报享受运动
1普通一样
2一样
3变化
4变化
 
     天气:晴,阴,雨
     温度:暖,冷
     湿度:普通,大
     风力:强,弱
     水温:暖,冷
     预报:一样,变化
     享受运动:是,否
 
     概念定义在实例(instance)集合之上,这个集合表示为X。(X:所有可能的日子,每个日子的值由天气,温度,湿度,风力,水温,预报6个属性表示。
     待学习的概念或目标函数成为目标概念(target concept), 记做c。
     c(x) = 1, 当享受运动时, c(x) = 0 当不享受运动时,c(x)也可叫做y
     x: 每一个实例
     X: 样例, 所有实例的集合
     学习目标:f: X -> Y
     标记(label): c(x), 实例类别的标记
 
上例中要学习的概念是“享受运动”;其中样例1、2、3、4前六个属性的集合为训练集;前六个属性的值可以用一个向量来表示,该向量就是特征向量;测试集可以根据需要来设定,如“晴、暖、普通、弱、变化”等。
 
 
 
 
 
 
 

转载于:https://www.cnblogs.com/zzq-zhangzhiqiang/p/6929918.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值