机器学习基本概念心得笔记(一)

1. 基本概念:训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归

2. 概念学习:人类学习概念:鸟,车,计算机

    定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数

 概念定义在实例(instance)集合之上,这个集合表示为X。(X:所有可能的日子,每个日子的值由 天气,温度,湿度,风力,水温,预          报6个属性表示。
     待学习的概念或目标函数成为目标概念(target concept), 记做c。
     c(x) = 1, 当享受运动时, c(x) = 0 当不享受运动时,c(x)也可叫做y
     x: 每一个实例
     X: 样例, 所有实例的集合
     学习目标:f: X -> Y
4. 训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集
    测试集(testing set/data)/测试样例 (testing examples):用来专门进行测试已经学习好的模型或者算法的数据集
    特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
    标记(label): c(x), 实例类别的标记
    正例(positive example)
    反例(negative example)
6.  分类 (classification): 目标标记为类别型数据(category) 
    回归(regression): 目标标记为连续性数值 (continuous numeric value)
本身了解过机器学习的概念,所以上面的概念基本没什么可说的,对于老师讲的这里有点体会,更明确了分类和回归所面对的,可能以前也知道,但是自己没有总结说,分类为类别数据,回归是连续型数据,暂且这样认知。
7. 例子:研究肿瘤良性,恶性于尺寸,颜色的关系
     特征值:肿瘤尺寸,颜色
     标记:良性/恶性
     
     有监督学习(supervised learning): 训练集有类别标记(class label)
     无监督学习(unsupervised learning): 无类别标记(class label)
     半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集
     以前理解的这里是有监督的是需要人工标注,无监督的是不需要人工标注,现在这样的区分好像更确切一些。简单说,有监督的就是x,y都已知,我们根据数据中x,y 的关系得到方程(关系式),然后分类其他的;无监督的是没有y值,只有x值,让他自己计算分类。


8. 机器学习步骤框架

     8.1 把数据拆分为训练集和测试集
     8.2 用训练集和训练集的特征向量来训练算法
     8.2 用学习来的算法运用在测试集上来评估算法 (可能要设计到调整参数(parameter tuning), 用验证集(validation set)




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值