机器学习基本概念

一、什么是机器学习

百度百科的定义:
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

通俗理解:让计算机拥有自己学习的能力,即每次把True or False记录下来形成经验,下次不会犯同样的错误,以此来不断提高自身的智力。举例:下棋程序。

二、什么是监督学习

百度百科的定义:
监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。

通俗理解:利用现有的样本,通过调整参数到合适的值,以此预测出未来的结果。

1)线性回归
例子:房价与平米的关系 – 线性回归。
之所以叫做“监督”,是因为我们可以根据经验,预测出结果。
之所以叫做“回归”,是因为要预测的变量是连续的。

分类:要预测的变量是不连续的,即离散的。
例子:通过算法来预测肿瘤是否是恶性的。

维度1. 横轴是肿瘤大小,纵轴表示良性还是恶性(True or False)
维度2. 横轴是患者的年龄,纵轴表示良性还是恶性(True or False)
此外,还需要用到的维度有很多,比如细胞大小、细胞形状等等。
当有n个维度时,我们就不能在图中画出来。有个叫做“支持向量机”法,可以把数据映射到不限维空间中。

三、无监督学习

百度百科的定义:
现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。

举例:对图片进行聚类。把图片进行聚类和采用无监督算法后,可构建出在3D视频中漫游的效果。这样的实现对于人类来说是几乎不可能的,但图片聚类可以做到。

无监督算法还可用于市场营销(把用户分成若干类,模拟真实用户行为),或用于航空航天领域。

无监督算法还可以把两个人一起说话的合音,分成两个人各自的声音。

四、强化学习

百度百科的定义:
强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。

通俗理解:强化学习需要你做一个决策:对or错。
举例:你训练狗时,它每做一件事,你都会奖励或者惩罚它,这样它逐渐形成了经验。
强化算法的关键,是你怎样定义这是“好的行为”,或定义这是“坏的行为”
例如,汽车自己学习怎样避开障碍物,机器蛇怎样爬行最佳等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值