机器学习笔记（1）— 机器学习的基本概念和分类

Crabfishhhhh

已于 2024-03-18 20:35:47 修改

阅读量987

点赞数 25

分类专栏： AndrewNg-ML-吴恩达《机器学习》文章标签：机器学习笔记人工智能

于 2024-03-18 20:34:13 首次发布

本文链接：https://blog.csdn.net/Crabfishhhhh/article/details/136502988

版权

AndrewNg-ML-吴恩达《机器学习》专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本文介绍了机器学习的基础概念，包括其起源、主要类型（监督学习、无监督学习和强化学习）、应用价值，以及吴恩达（AndrewNg）的重要角色。文章强调了理论知识的重要性，同时提到了在AI快速发展的背景下，掌握机器学习是必要的。还概述了监督学习和无监督学习的区别，以及强化学习的探索-利用策略。

摘要由CSDN通过智能技术生成

前言

介绍

理论内容

What is Machine-Learning？

Why do we need Machhine-Learning?

Types of Machine-Learning.

监督学习 Supervised Learning

无监督学习 Unsupervised Learning

强化学习 Reinforcement learning

习题or实战

前言

在当今人工智能如此火热的时代，机器学习已经是一门不可忽视的学科，作为一名AI爱好者，学习机器学习基本上就是入门必修课程。

想要上手完成一个模型的训练、部署等等操作，一定需要你会多少机器学习或深度学习的知识吗?

答案是不一定。

在当今，‘迁移学习’的泛概念出现，我们随时随地都可以在任何一个CodeRepositories拉取一个项目，只要你稍微了解一门语言（如python、c++等），你就可以对模型进行个性化操作。

那作为人工智能入门者，还需要学习过多的理论知识吗？

答案是肯定的。

如今人工智能的发展日新月异，我们都是有目共睹的。与其他工作者相比，以AI为自身发展方向的人更应该清楚，行业的门槛会随着AI的发展而愈发变高（比如IOT大队研发的Devin）。如果不随着行业发展来提升自己的能力，那么就会成为人工智能替代的第一批人。

凡事不可操之过急。牢固的知识基础是必须的也是必要的。

介绍

AndrewNg，中文名吴恩达，被称为机器学习之父，他的公开课是万千AI初学者的入门课程，跟着他来学习机器学习以及深度学习，将会是一个很棒的体验。

第一节，就跟随博士一起了解一下机器学习的基本概念和分类。

理论内容

What is Machine-Learning？

什么是机器学习？第一个机器学习的定义来自于Arthur Samuel。他定义机器学习为，在进行特定编程的情况下，给予计算机学习能力的领域。

直至目前为止，其实我仍然难以划清深度学习与机器学习的界限，在日常的研究过程中，也很少有人将其分开。虽然总是在概念上区分两者，但是在实际的研究与应用中，这两者总是分不开的。

什么是机器学习？ -From Wikipedia

什么是深度学习？ -From Wikipedia

对于深度学习而言，机器学习是一个更加大的概念。所以，先学习机器学习，对于后续学习深度学习帮助还是很大的。

Why do we need Machhine-Learning?

我们为什么要学习和使用机器学习？看起来似乎还是一个很难解释的问题呢？但是其实答案也很显然。科技总是往着推动人类文明进步的方向发展着的，机器学习就是这样一个产物。在现实生活中，涉及机器学习技术的产品和服务已经渗透到我们生活的方方面面。人工智能的大时代，我们享受着算法带来的遍历。至于我们为什么需要它，我想你的心里也已经有了自己的答案。

Types of Machine-Learning.

机器学习目前主流分为两类：监督学习和无监督学习，现在已经有了第三类，叫做强化学习，在Dr.Ng的课程中并没有提及强化学习，所以我会在这里做一定的补充。

在学习不同的分类之前，我们先来了解Tom Mitchell对机器学习的任务定义。

机器学习任务的定义：

一个程序被认为能从经验E中学习，解决任务T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理T时的性能有所提升。

如果用下棋来举例，

E: 算法程序对下棋的自我练习和演算获得的经验

T：下棋

P：算法程序获胜的概率

希望你能对这个概念有个大致的体会。如果仍然有疑惑，不妨在后面的学习中，再深入了解在其他任务中，这三个值分别表示什么。

监督学习 Supervised Learning

在Dr.Ng的课程中，以房价预测和肿瘤性质作为例子，解释了什么是监督学习。

严谨来说，一个监督学习过程，是由训练资料中学到或者建立一个模式（learning model），并且依此推测新的实例，完成整个学习过程。这个训练资料，就是输入对象和预期输出组成的。

通俗易懂地讲，就是我们给模型一个数据集，这个数据集由“正确答案”组成，也就是我们常说的，带有标签（label）的数据。

在房价预测中，我们向模型提供一系列房子的售价；在肿瘤性质预测中，我们向模型提供肿瘤的大小以及它是良性还是恶性的这一性质。我们想要知道的是数据之外的时间点上，这套房子的房价将会是多少，或者是其他的肿瘤病例中，这一肿瘤良性和恶性的概率分别是多少。

监督学习中不同问题的分类

回归问题

假设我们要预测的结果是一系列离散的数值，又或者是一系列连续的数值，即总量无法确定的，我们会认为，该类问题属于回归问题，如房价预测。

分类问题

假设我们要预测结果是几个离散的数值，又或者是几个连续的数值，即总量是可以确定的，那么我们就会认为，该类问题属于分类问题，如肿瘤的良性或者恶性，产品是次品还是正品。

特征（Feature）

在房价预测中，想要预测未来房价，我们可以向模型提供房子的大小、房子目前的售价等其他的信息；

在癌症分类中，想要判断肿瘤良性与否、是第几期癌症，我们可以提供肿瘤的尺寸大小、肿瘤的颜色、肿块的密度、形状等等。

学习算法通过学习和处理这些特征得到相关的结果来做推测，这就是机器学习和模式识别中，被测对象的可测量性或特性，被称之为特征（Feature）。

无监督学习 Unsupervised Learning

如果你已经了解了监督学习的概念，那么对于无监督学习，你也可以获得一个大致的概念了。

无监督学习，又叫做非监督学习。向算法提供无标签（unlabeled）的数据，学习算法自动对输入的数据进行分类或分群，最后得出我们想要的结果。

聚类算法（cluster analysis）

你可能会好奇，‘如果没有正确答案，那么机器要如何知道什么样的特征会得到某种结果呢？’ 在无监督学习中，算法会将数据集分为两种不同的聚类簇，并通过不同的簇完成学习任务。

例如，在癌症分类问题中，具有不同特征的数据会被排列到坐标系中，算法会将具有相似特征的数据聚为一簇，这就是无监督学习中的聚类算法。

关系规则（association rule）

关系规则是反映一个事物与其他事物之间的相互依存性和关联性，是数据挖掘的一个重要技术，也是无监督学习中除聚类算法之外的另一种学习方法，是一种描述性方法。

无监督学习中，我们并没有向机器提供‘正确答案’，那么机器就需要自己挖掘数据之间的关系。‘无心插柳柳成荫’，机器总会从有趣的角度得出些数据之间有趣的关系（interesting）。大数据分析笔记 (4) -关联规则(Association Rules)_大数据关联规则-CSDN博客

如果你想更深入了解关系规则，就看一下这个博客。

维度缩减（dimensionality reduce）

数据降维其实是一种比较常见的处理方法，常用于神经网络对特征的归一化。在机器学习中，所谓的降维就是采用某种映射方式，将高维空间中的数据点映射到低纬度空间中。

为什么要进行数据降维?

在原始的高维空间中，如果数据内存在一些冗余和噪声，那么将会在实际应用中影响置信度和准确率，降维可以在一定程度上提取数据内部的本质特征。

常见的降维方法有主成分分析（Principal Component Analysis）、等距映射（Isometric Mapping）、局部线性嵌入（Locally Linear Embedding）等

如果你想深入了解，可以去查看这一个文章。

数据降维

强化学习 Reinforcement learning

强化学习是一种基于环境行动以求利益最大化的一种学习方法。

相对于监督学习而言，强化学习不需要带标签的输入输出对，也不需要对非最优解进行精准的纠正。算法关注的是如何在有限理性的条件下，寻找和利用的平衡，进行‘探索-利用’的交换。

相信你对仿生这个概念并不陌生，仿生学同样应用在机器学习中，但强化学习是仿‘心’学。

强化学习的灵感来源于心理学的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。

也就是说，强化学习最大的一个特点就是，它在环境中探索，通过短期或者长期的反馈对算法本身的解进行调优，以达到一个相对平衡的状态。

在机器学习中，环境通常被抽象为马尔科夫决策过程（Markov decision processes）,也就是我们现在常说的MDP，很多强化学习算法在这种假设下才能使用动态规划进行Search-Use的交换。（单纯的、有限环境下的动态规划算法是需要MDP的）。

ps:在Wikipedia里面，对强化学习有这样一句话，可以回味一下。

“传统的动态规划方法和强化学习算法的主要区别是，后者不需要关于MDP的知识，而且针对无法找到确切方法的大规模MDP”

习题or实战

None

_____________________________________________________________________

这一节属于引言，所以在Dr.Ng的课程中出现的习题都比较简单。

也因为是理论知识，所以实战就没有啦。

希望大家今天生活愉快~

下一篇文章是单一变量线性回归模型的一些介绍

（线性代数知识的回顾我打算跳过，学过的同学建议自己去回顾啦~）

week1 finish （1/2）

Crabfishhhhh

关注

25
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记（1）— 机器学习的基本概念和分类

在当今人工智能如此火热的时代，机器学习已经是一门不可忽视的学科，作为一名AI爱好者，学习机器学习基本上就是入门必修课程。想要上手完成一个模型的训练、部署等等操作，一定需要你会多少机器学习或深度学习的知识吗?答案是不需要的，在当今，‘迁移学习’的泛概念出现，我们随时随地都可以在任何一个CodeRepositories拉取一个项目，只要你稍微了解一门语言（如python、c++等），你就可以对模型进行个性化操作。那作为人工智能入门者，还需要学习过多的理论知识吗？答案是肯定的。
复制链接

扫一扫