Task01

  1. 机器学习的概念

机器学习正是这样一门学科 , 它致力于研究如何通过计算的手段 , 利用经验来改善系统自身的性能 , 在计算机系统中 , “ 经验 ” 通常以 “ 数据 ” 形式存在 , 因此 , 机器学习所研究的主要内容 , 是关于在计算机上从数据中产生 “ 模型 ” (model) 的算法 , 即 “ 学习算法 ” (learning algorithm) 。

  1. 基本术语:

引用:

从数据中学得模型的过程称为 “ 学习 ” (learning) 或 “ 训练 ” (training) ,这个过程通过执行某个学习算法来完成 . 训练过程中使用的数据称为 “ 训练数据 ” (training data) , 其中每个样本称为一个 “ 训练样本 ” (training sample) ,训练样本组成的集合称为 “ 训练集 ” (training set). 学得模型对应了关于数据的某种潜在的规律 , 因此亦称 “ 假设 ” (hypothesis); 这种潜在规律自身 , 则称为 “ 真相 ” 或 “ 真实 ” (ground-truth) , 学习过程就是为了找出或逼近真相 . 本书有时将模型称为 “ 学习器 ” (learner) , 可看作学习算法在给定数据和参数空间上的实例化。建立这样的关于 “ 预测 ” (prediction) 的模型 , 我们需获得训练样本的 “ 结果 ” 信息 ,这里关于示例结果的信息 , 例如 “ 好瓜 ”称为 “ 标记 ” (label); 拥有了标记信息的示例 , 则称为 “ 样例 ” (example)。(《机器学习》-周志华,第一章绪论)
  1. 假设空间:

我们可以把学习过程看作一个在所有假设 ( hypothesis ) 组成的空间中进行搜索的过程 , 搜索目标是找到与训练集 “ 匹配 ” 的假设 , 即能够将训练集中的瓜判断正确的假设 , 假设的表示一旦确定 , 假设空间及其规模大小就确定了 。

  1. 归纳偏好:

对于一个具体的学习算法而言 , 它必须要产生一个模型 。然而它对应的模型可能有很多个,那么要选择哪一个模型,就属于这个算法的”偏好“。这个”偏好“不是我们认为决定的,它取决于算法能否取得好的性能 ,这样算法的”偏好“才会与问题本身匹配。

引用:

所以 , NFL 定理最重要的寓意 , 是让我们清楚地认识到 , 脱离具体问题 , 空泛地谈论 “ 什么学习算法更好 ” 毫无意义 , 因为若考虑所有潜在的问题 , 则所有学习算法都一样好 , 要谈论算法的相对优劣 , 必须要针对具体的学习问题 ; 在某些问题上表现好的学习算法 , 在另一些问题上却可能不尽如人意 , 学习算法自身的归纳偏好与问题是否相配 , 往往会起到决定性的作用 。(《机器学习》-周志华,第一章绪论)
  1. 发展历程:

  • 二十世纪五十年代到七十年代初 , 人工智能研究处于 “ 推理期 ”。

  • 从二十世纪七十年代中期开始 , 人工智能研究进入了 “ 知识期”。

  • 机器学习在二十世纪八十年代正是被视为 “ 解决知识工程瓶颈问题的关键 ” 而走上人工智能主舞台的 。

  • 机器学习现在己经发展成为一个相当大的学科领域 。

  1. 应用现状:

人类社会的各个角落都积累了大量数据 , 亟需能有效地对数据进行分析利用的计算机算法 , 而机器学习恰顺应了大时代的这个迫切需求 。

案例:

  • 机器学习还为许多交叉学科提供了重要的技术支撑

  • “数据科学”和“数据挖掘”需要机器学习提供数据分析的支撑

  • 谷歌、百度等搜索引擎需要机器学习技术

  • 机器学习的应用在奥巴马选举过程中起到了很大作用

  • 机器学习对无人驾驶汽车的推动

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值