第一章 机器学习基本概念

1.机器学习主要是通过计算机在已有的数据上(经验)产生相应的模型(学习算法),在面临新的情况时,模型能给出相应的判断。所以说机器学习是研究学习算法的学问。

2基本术语

2.1以西瓜是否成熟为例,(色泽=青绿;根蒂=蜷缩;敲声=浊响)这一条记录称为一个示例或样本sample。样本组成的集合称为数据集;每一个示例包含几个属性,上例中包含三个属性,我们称之为三维,这个示例也可以看成是一个特征向量。一般的D={X1,X2,X3....}为一个数据集。

2.2从数据中学习的模型的过程称之为“学习”或”训练“,这个过程使用的数据称之为训练数据,得到模型。学到的模型反应了数据的某种潜在的规律,因此也称为假设。这种规律本身称之为真相(ground truth)。一切为了逼近真相。样本一般满足一个分布D,训练数据一般满足独立同分布,所以训练集越大,越容易准确预测。

2.3光有样本sample还不行,要建立可预测的模型需要示例的结果,样例(example),如((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)。

2.4如果我们预测的是像好瓜,坏瓜这样的离散值,此类学习任务称之为“分类”,预测成熟度0.98这样的连续值,此类学习任务称之为”回归“(regression)。

预测任务是希望通过对训练集{(X1,y1),(X2,y2)...}进行学习建立一个从输入空间X到输出空间Y的映射,对于二分类Y={0,1},对于回归Y=R实数集

2.5根据训练数据是否有标记数据,分为无监督学习(聚类)和有监督学习(分类和回归)。

2.6

转载于:https://www.cnblogs.com/jetHu/p/7856036.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值