CS229 Lecture 1：Introduction and Basic Concepts

最新推荐文章于 2024-09-14 21:20:48 发布

weixin_34272308

最新推荐文章于 2024-09-14 21:20:48 发布

阅读量191

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/Edison25/p/11046522.html

版权

1 课程讲师

Tengyu Ma and Chris Re

马腾宇的领英工作经历介绍：https://www.linkedin.com/in/tengyuma/

2 课程先修知识

概率论：分布，随机变量，期望，条件概率、方差、密度

线性代数：矩阵乘法、特征向量

基本编程：Python

3 机器学习的定义

Arthur Samuel（1959）：机器学习是一门研究领域，它使计算机无需明确编程即可学习。

Tom Mitchell（1998）：如果计算机程序在t任务中的性能（用p衡量）随着经验e的提高而提高，那么它就可以从经验e中学习某些任务t和性能度量p。

4 机器学习的分类

4.1 监督学习

监督学习是指：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中，每个实例都是由一个输入对象（通常为矢量）和一个期望的输出值（也称为监督信号）组成。监督学习算法是分析该训练数据，并产生一个推断的功能，其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。

监督学习是从标记的训练数据来推断一个功能的机器学习任务。

4.2 无监督学习

无监督学习：现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。

4.3 强化学习

强化学习：是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏，强化学习不同于连接主义学习中的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少，RLS必须靠自身的经历进行学习。通过这种方式，RLS在行动-评价的环境中获得知识，改进行动方案以适应环境。

转载于:https://www.cnblogs.com/Edison25/p/11046522.html

weixin_34272308

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。