机器学习的基本概念

1.基本概念:训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类回归

2.概念学习:人类学习概念:鸟,车,计算机

                     定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。

3.例子:学习“享受运动”这一概念:

              小明进行水上运动,是否享受运动取决于很多因素

样例天气温度湿度风力水温预报享受运动
1普通一样
2一样
3变化
4变化

天气:晴、阴、雨

温度:暖、冷

湿度:普通、大

风力:强、弱

水温:暖、冷

预报:一样、变化

享受运动:是、否

 

概念定义在实例(instance)集合智商,这个集合表示为X。(X:所有可能的日子,每个日子的值由天气,温度,湿度,风力,水温,预报6个属性)。

待学习的概念或目标函数成为目标概念(target concept)记做c。

当享受运动时,c(x)= 1,当不享受运动时,c(x)= 0,c(x)也可以叫做y

x:每一个实例

X:样例,所有实例的集合

学习目标:f:X->Y

4.训练集(training set/data)/训练样例(training examples):用来进行训练,也就是产生模型或者算法的数据集。

   测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集。

   特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例

   标记(label):c(x),实例类别的标记

   正例(positive example)

   反例(negative example)

5.例子:研究美国硅谷房价

   影响房价的两个重要因素:面积(平方米),学区(评分1-10)

样例面积(平方米)学区(1-10)房价(1000$)
110081000
212091300
3606800
48091100
595850

 

6.分类(classification):目标标记为类别型数据(category)

   回归(regression):目标标记为连续性数值(continuous numeric value)

7.例子:研究肿瘤良性,恶性与尺寸、颜色的关系

              特征值:肿瘤尺寸、颜色

              标记:良性/恶性

              有监督学习(supervised learning):训练集有类别标记(class label)

              无监督学习(unsupervised learning):无类别标记(class label)

              半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集

8.机器学习步骤框架

         8.1 把数据拆分为训练集和测试集

         8.2 用训练集和训练集的特征向量训练一个算法

         8.3 用学习来的算法运用在测试集上来评估算法(可能要设计到调整参数,用验证集)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AlexGeek

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值