机器学习初轮廓——很好理解的几个知识点

这部分知识主要是通过翻阅书籍来学习的,希望能够对和我一样的小白有所启迪!

1. 机器学习系统具备的特点

在这里就不介绍机器学习的发展历程了,直接总结一下机器学习具备的特点:

  • 许多机器学习系统所解决的都是无法直接使用固定规则或流程代码完成的问题,通常这类问题对人类而言非常简单。比如,计算机和手机中的计算器程序就不属于具备智能的系统,因为里面的计算方法都有清楚而且固定的规程;但是,如果要求一台机器去辨别一张相片中都有哪些人或物体,这对我们人类来讲非常容易,然而机器很难做到。
  • 所谓“具备学习”能力的程序都是指它能够不断地从经历和数据中吸取经验教训,从而应对未来的预测任务。
  • 机器学习系统更加有魅力在于它具备不断完善自身应对具体任务的能力。

总之,如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认定为是“具备学习能力的”,那么它一定需要展现出:利用现有的经验(E),不断改善其完成既定任务(T)的性能的特质(P).

2. 机器学习三要素

由以上知识可知,机器学习的三要素包括任务、经验、性能,以下详细阐述:

(1)任务

机器学习的任务有很多种类,最为经典的两类即是:监督学习和无监督学习

监督学习包括分类问题回归问题,它关注对事物未知表现的预测。

分类问题,就是对其所在的类别进行预测。类别即使离散的,同时也是预先知道数量的。比如已知一个人的身高、体重和三围数据,预测其性别。性别是离散的也是预先知晓数量的。

回归同样是预测问题,知识预测的目标是连续变量。比如根据房屋面积、房间数量来预测房价销售。

非监督学习倾向于对事物本身特性的分析,常用的技术有数据降维聚类问题

数据降维是对事物的特性进行压缩和筛选,这比较抽象。如果我们没有特定的领域知识,是无法预先确定采样哪些数据的。如今,筛选有效信息的成本比较昂贵。比如,在识别图像中人脸的任务中,可以直接读取到图像的像素信息,但这样数据的维度非常高。因此,通常会用数据降维技术对图像做预处理,保留最具有区分度的像素组合。

聚类则是依赖于数据的相似度,把相似的样本划分为一个簇。不同于分类,我们在大多数情况下不会预先知道簇的数量和每个簇的具体含义。

(2)经验

我们习惯性地把数据视作经验;事实上,只有那些对学习任务有用的特定信息才会别列入考虑范围。而我们通常把这些反映数据内在规律的信息叫做特征。

对于监督学习问题,我们拥有的经验包括特征和标记/目标(Label/target)两个部分。一般用一个特征向量来描述一个数据样本;标记/目标的表现形式取决于监督学习种类。

无监督学习无法从事预测任务,更加适合对数据结构的分析。

(3)性能

所谓性能,是评价所完成人物质量的指标。为了评价学习模型完成任务的质量,我们需要具备相同特征的数控,并将模型的预测结果同对应的正确答案进行比对。称这样的数据集为测试集。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值