浙大胡教授ML课学习记录_1_导学

哇咔咔负负得正

于 2021-10-09 19:48:42 发布

阅读量312

点赞数

分类专栏： ml 文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39906884/article/details/120675611

版权

ml 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

ML导学

1. ML定义

Arthur Samuel 1959 年对机器学习的定义：
机器学习是这样的领域，它赋予计算机学习的能力，（这种学习能力）不是通过显著式编程获得的。

显著式编程：告诉计算机菊花是黄色，玫瑰花是红色，计算机按照人为设定的条件去分类，这就是显著式编程。
非显著式编程：只给计算机很多菊花的图片和玫瑰的图片，编写程序让计算机自己去总结菊花和玫瑰花的区别，计算机可能通过大量的图片也能总结出菊花是黄色的，玫瑰是红色的这一规律，也有可能总结出菊花花瓣长，而玫瑰花的花瓣圆等其他规律（也就是特征提取）。让计算机自己去总结规律的编程方法，叫做非显著式编程。

Tom Mitshell 1998 年对机器学习的定义：计算机程序针对某个任务 T 和某个性能指标 P，从经验 E 中学习，其特点是在 T 上被 P 所衡量的性能会随着经验 E 的增加而提高。

例如：
任务 T => 识别菊花和玫瑰
经验 E => 一大堆菊花和玫瑰的图片（训练样本）
性能指标 P => 识别率，训练样本 E 越多，识别率也会越高
显著式编程一开始就定义了输入和输出，识别率不会随着 E 的增加而变化

Tom Mitshell 的定义更加数学化，根据 E 来提高 P 的过程就是一个典型的最优化问题。

2. ML分类

像垃圾邮件识别和人脸识别这样需要为训练样本打标签的任务，经验 E => 训练样本和标签的集合，所有的经验 E 都是人工采集输入计算机的。这样的机器学习称为监督学习。

像计算机自动下棋和自动驾驶这样的任务，经验 E 是由计算机和环境交互获得的，计算机产生行为，我们的程序只需要定义这些行为的收益函数，对行为进行奖励或者惩罚，通过算法让计算机改变自己的行为模式去最大化收益函数。计算机在与环境的互动中逐渐强化自己的行为模式，这样的机器学习称为强化学习。

这样的划分并不绝对，强化学习中也会用到监督学习的方法。比如，AlphaGo 先通过监督学习方法学习高手对局得到初始围棋程序，然后再对初始围棋程序进行强化学习进而提升棋力。

监督学习根据数据标签存在与否分类：

传统监督学习：每个样本都有对应的标签
1.1 支持向量机
1.2 人工神经网络
1.3 深度神经网络
非监督学习：所有训练样本都没有对应的标签。需要假设同一类训练数据在空间中分布很近，算法将其聚集为两类。

2.1 聚类
2.2 EM
2.3 主成分分析
半监督学习：训练数据中一部分有标签，一部分无标签。互联网有大量数据，标注数据成本很大。利用少量少量标注数据和大量未标注数据一起训练一个更好的机器学习算法。（最近比较流行）

监督学习根据数据标签离散还是连续值分类：

分类问题（离散）
回归问题（连续）

3. ML 过程

提取特征，特征选择
提取特征并不是 ML 主要研究的内容，但是提取了好的特征即使用到了较差的算法，也能得到不错的性能。

4. 没有免费午餐定理

任何一个预测函数，如果在一些训练样本上表现好，那么必然在另一些训练样本上表现不好，如果对数据在特征空间的先验分布有一定假设，那么表现好与表现不好的情况一样多。

哇咔咔负负得正

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
浙大胡教授ML课学习记录_1_导学

1. ML导学1.1 ML定义Arthur Samuel 1959 年对机器学习的定义：机器学习是这样的领域，它赋予计算机学习的能力，（这种学习能力）不是通过显著式编程获得的。显著式编程：告诉计算机菊花是黄色，玫瑰花是红色，计算机按照人为设定的条件去分类，这就是显著式编程。非显著式编程：只给计算机很多菊花的图片和玫瑰的图片，编写程序让计算机自己去总结菊花和玫瑰花的区别，计算机可能通过大量的图片也能总结出菊花是黄色的，玫瑰是红色的这一规律，也有可能总结出菊花花瓣长，而玫瑰花的花瓣圆等其他规律（也就
复制链接

扫一扫

专栏目录

哇咔咔负负得正 CSDN认证博客专家 CSDN认证企业博客

码龄7年

184: 原创

22万+: 周排名

2万+: 总排名

20万+: 访问

: 等级

2871: 积分

333: 粉丝

351: 获赞

126: 评论

1105: 收藏

私信

关注

热门文章

分类专栏

行测 15篇
Netty 1篇
Pytorch 13篇
NLP 7篇
CV 18篇
Attention 5篇
快速上手 4篇
JUC 8篇
JVM 3篇
设计模式 3篇
算法 36篇
大数据
ml 10篇
考试复习 6篇
排坑记录 1篇
Spring Boot 16篇
数据库 15篇
数据结构 4篇
计算机网络原理 3篇
OS 8篇
Docker 2篇
Linux 9篇
随笔 1篇

最新评论

Pytorch Transformer
土豆也想变瘦妞: 去掉前面的d2l，就用自己定义的多头注意力函数。还是需要自己思考问题的
工程伦理课堂记录
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
工程伦理课堂记录
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
OS_PV操作_5.行人与机动车过路口问题
霁689: 可不可以把20行的count++写到16和17行中间，再把17行的判断改成count==1,
OS_PV操作_5.行人与机动车过路口问题
哇咔咔负负得正: 这个我当时想得是这样的，路人不需要关心车有多少，只要路人一到，后面的车都得等着，只有全部路人过完了，车才能过，人的优先级大。这个我好像是参考的王道书上写的，时间太长有点忘记了。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

哇咔咔负负得正 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。