机器学习Day1-定义及分类

菜菜小林然

已于 2023-02-02 18:27:59 修改

阅读量248

点赞数

分类专栏：个人学习-机器学习文章标签：人工智能机器人 Powered by 金山文档

于 2023-02-02 18:25:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51580177/article/details/128852377

版权

个人学习-机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、机器学习的定义

1.引入

Machine Learning（机器学习）

什么是机器学习?

ARTHURE SAMUEL 是机器学习领域的先驱之一

他编写了世界上第一个棋类游戏的人工智能程序

ARTHURE SAMUEL 对机器学习的定义：

Machine Learning is Fields of study that gives computers the ability to learning without being explictly programmed

机器学习是这样的领域，他赋予计算机学习的能力，(这种学习能力)不是通过显著式编程获得的

什么叫做显著式编程?

例如我们认为告诉计算机，菊花是黄色的，玫瑰是红色的，那么计算机看到黄色就把它识别为菊花，看到红色就把它识别为玫瑰，这就是显著式编程

非显著式编程

我们给计算机一堆菊花的图片，一堆玫瑰的图片，让计算机自动去总结菊花和玫瑰的区别，以及其各自的特点，通过编写比较完美的代码，计算机就很有可能通过大量的图片，也能总结出菊花是黄色的，玫瑰是红色的，当然也可能总结出其他的规律

我们事前并不约束计算机必须总结什么规律，而是，让计算机从一大堆可能的规律中挑出最能区分菊花和玫瑰的一些规律，我们把这种让计算机自动总结规律的编程，叫做非显著式编程

Arthur Samuel所定义的机器学习是专指这种非显著式编程的方式

2.机器人例子

让机器人到教室外面去充咖啡

那么显著式编程就要把这个过程的每一步，写到计算机的程序中，像什么距离，左转，动作啥的，都要事先规划好

那么对比显著式编程，非显著式编程的优势就体现出来了，

在这里有一个概念【收益函数】-》做某些行为带来的收益

例如：机器人采取某些行为导致任务失败，或者并不是想得到的结果，如下，那么其收益函数就是负值

反之：如果机器人完成了任务，我们就认为其收益函数为正值

3.机器人小结

当我们规定了行为和收益函数后，此时我们就可以喝喝茶了，构造一个算法，让计算机自己去寻找最大收益函数的行为，

那么很明显，一开始，计算机是采用随机化的行为；但是只要我们的程序编写的足够好，计算机是很有可能去找到一个最大收益函数的行为模式的，也就是下方的总结，【正如Arthur Samuel所定义的，机器学习关注的正是这种非显著式编程】

3.机器学习的第二个定义

这个定义是Tom Mitshell在1988年，在他的教科书【Machine Leraning】所定义的，现在我们公认他的这本教科书是机器学习领域第一本成熟的教科书

Tom Mitshell 在《Machine Learning》中对机器学习的定义：

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T ,as measured by P, improves with experience E.

3-1菊花-玫瑰例子

例如：在这个例子中【我们让P指的是：识别率[Recognition Rate]->让更多的菊花被识别为菊花】

那么我们可以得到机器学习的定义：机器学习就是针对菊花和玫瑰这样的任务，构造某种算法，

这种算法的特点是当训练的菊花和玫瑰越来越多的时候，【也就是经验越来越多，识别率也会越来越高】

很明显，显著式编程是无法达到这一目的的，因为显著式编程一开始就把程序写死了，识别率是不会随着训练样本的增加而增加的

3-2 机器人例子

4.小结

Tom Mitshell 的定义比Arthur Samuel的定义，更加的数学化，【数学在机器学习中占有重要的地位】

5.思考题

E、计算机下棋的场数 P：规定场数胜利的次数

E、邮件识别次数 P:规定识别次数中，正确识别垃圾邮件的次数

E、人脸识别的次数 P：规定识别次数中，识别成功的正确率

E、驾驶的次数 P：规定次数中，正确到达目的地的次数

二、机器学习的分类

1.引入

那么划分的标准是什么呢？【其实就是经验E】

2、监督学习

在2和3中经验完全是由人搜集起来，输入计算机的，

例如在2中，我们要搜集起来，哪个是垃圾邮件哪个不是垃圾邮件

例如在3中，我们要搜集起来，告诉计算机每张人脸图片是谁

我们把训练样本告诉计算机是什么的过程，叫做为训练数据打标签【Labeling for training data】

那么为数据打标签这一工作，需要大量的人力进行，例如现代的人力识别系统中，需要数千万张，带有人脸标签的图片，这经常要耗费很长时间，因此今年来：

我们，把这一类输入计算机数据，并打标签的行为，叫做监督学习【Supervised Learning】

3.监督学习的分类一

3-1 传统监督学习【Traditional Supervised Learning】

在后续，将学习：支持向量机【Support Vector Machine】

人工神经网络【Neural Networks】

深度神经网络【Deep Neural Networks】

3-2 非监督学习【Unsupervised Learning】

实例：

在这门课程中，我们将会学习如下算法：

聚类【Clustering】

EM算法【Expectation-Maximization algorithm】

主成分分析【Principle Component Analysis】

3-3 半监督学习【Semi-Supervised Learning】

这一学习方式越来越流行，数据标注是一项很大的工程，因此研究少量标注数据和大量未标注数据去得到一个更好的机器学习算法，成为了研究领域的热点之一

例子：

4.监督学习分类方式二

4-1分类【Classification】

像人脸识别是同一个人，标签为1，否则为0

4-2 回归【Regression】

例如，房价的走势,在这里，训练样本是时间，标签是房价

其实分类和离散的界限是模糊的，因为连续和离散的概念是相互转化的，因此我们课程的研究内容是研究分类问题

4.强化学习【Reinforcement Learning】

而1和4的经验E是由计算机和环境互动得到的，计算机产生行为，该行为得到的收益函数反馈给计算机【给予该行为奖励或者惩罚】，

例如在计算机下棋这个程序中，下赢了，就给予奖励，下输了，就给予惩罚

例如在计算机自动驾驶这个程序中，安全到达目的地，就给予奖励，中途出了事故，就给予惩罚

同时我们设计算法，让计算机通过改变自己的行为模式，去获得最大的收益函数，完成机器学习的过程

我们把这一种机器学习的任务叫做，强化学习【让计算机通过与环境的互动，逐渐强化自己的行为模式】

5.小结

机器学习大致可以划分为这两类，但是也不绝对，例如在现代机器学习中，就同时采用了监督学习和强化学习的合作模式

在后期着重学习监督学习，部分学习强化学习

6.思考题

菜菜小林然

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

菜菜小林然 CSDN认证博客专家 CSDN认证企业博客

码龄4年

70: 原创

106万+: 周排名

6万+: 总排名

4万+: 访问

: 等级

1367: 积分

546: 粉丝

663: 获赞

14: 评论

635: 收藏

私信

关注

热门文章

分类专栏

最新评论

前端技术栈三(vue+Axios)
2301_78193967: 试过安装淘宝镜像失败了，一搜说是淘宝镜像被淘汰了，楼主你知道怎么解决吗...
前端技术栈三(vue+Axios)
征途黯然.: I'm impressed by this article about 前端技术栈三vueAxios. The expertise is impressive.
0基础学java-day26(满汉楼实战）
菜菜小林然: 可私信我要相关工具类的链接
个人python学习-Day10-飞机大战
m0_72906484: 哥们，网盘文件能发一下吗
计算机网络（day1-3）概述-计算机网络的性能
CSDN-Ada助手: 恭喜你撰写了第20篇博客！标题“计算机网络（day1-3）概述-计算机网络的性能”非常吸引人。你的文章内容真实而有深度，对计算机网络的性能进行了详细的概述，让读者对这个领域有了更清晰的认识。对于下一步的创作建议，我想谦虚地提出一些建议。首先，你可以进一步探索计算机网络性能的不同方面，比如带宽、延迟、吞吐量等。这些指标对网络性能的影响非常重要，可以帮助读者更好地理解网络性能的本质。其次，你可以考虑通过案例研究或实际应用来加深读者的理解。通过实际的示例，读者可以更好地理解网络性能在实际场景中的应用和意义。最后，我鼓励你继续保持对新技术的关注，并将其应用于你的博客创作中。计算机网络是一个不断发展的领域，了解最新的技术和趋势可以使你的博客更有价值和吸引力。再次恭喜你的辛勤创作，期待读到更多精彩的博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

菜菜小林然 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。