机器学习笔记(1)— 机器学习的基本概念和分类

本文介绍了机器学习的基础概念,包括其起源、主要类型(监督学习、无监督学习和强化学习)、应用价值,以及吴恩达(AndrewNg)的重要角色。文章强调了理论知识的重要性,同时提到了在AI快速发展的背景下,掌握机器学习是必要的。还概述了监督学习和无监督学习的区别,以及强化学习的探索-利用策略。
摘要由CSDN通过智能技术生成

目录

前言

介绍

理论内容

What is Machine-Learning?

Why do we need Machhine-Learning?

Types of Machine-Learning.

监督学习 Supervised Learning

无监督学习 Unsupervised Learning

强化学习 Reinforcement learning

习题or实战


前言

在当今人工智能如此火热的时代,机器学习已经是一门不可忽视的学科,作为一名AI爱好者,学习机器学习基本上就是入门必修课程。

想要上手完成一个模型的训练、部署等等操作,一定需要你会多少机器学习或深度学习的知识吗?

答案是不一定。

在当今,‘迁移学习’的泛概念出现,我们随时随地都可以在任何一个CodeRepositories拉取一个项目,只要你稍微了解一门语言(如python、c++等),你就可以对模型进行个性化操作。

那作为人工智能入门者,还需要学习过多的理论知识吗?

答案是肯定的

如今人工智能的发展日新月异,我们都是有目共睹的。与其他工作者相比,以AI为自身发展方向的人更应该清楚,行业的门槛会随着AI的发展而愈发变高(比如IOT大队研发的Devin)。如果不随着行业发展来提升自己的能力,那么就会成为人工智能替代的第一批人。

凡事不可操之过急。牢固的知识基础是必须的也是必要的。

介绍

AndrewNg,中文名吴恩达,被称为机器学习之父,他的公开课是万千AI初学者的入门课程,跟着他来学习机器学习以及深度学习,将会是一个很棒的体验。

第一节,就跟随博士一起了解一下机器学习的基本概念和分类。

理论内容

What is Machine-Learning?

什么是机器学习?第一个机器学习的定义来自于Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。

直至目前为止,其实我仍然难以划清深度学习与机器学习的界限,在日常的研究过程中,也很少有人将其分开。虽然总是在概念上区分两者,但是在实际的研究与应用中,这两者总是分不开的。

什么是机器学习? -From Wikipedia

什么是深度学习? -From Wikipedia

对于深度学习而言,机器学习是一个更加大的概念。所以,先学习机器学习,对于后续学习深度学习帮助还是很大的。

Why do we need Machhine-Learning?

我们为什么要学习和使用机器学习?看起来似乎还是一个很难解释的问题呢?但是其实答案也很显然。科技总是往着推动人类文明进步的方向发展着的,机器学习就是这样一个产物。在现实生活中,涉及机器学习技术的产品和服务已经渗透到我们生活的方方面面。人工智能的大时代,我们享受着算法带来的遍历。至于我们为什么需要它,我想你的心里也已经有了自己的答案。

Types of Machine-Learning.

机器学习目前主流分为两类:监督学习无监督学习,现在已经有了第三类,叫做强化学习,在Dr.Ng的课程中并没有提及强化学习,所以我会在这里做一定的补充。

在学习不同的分类之前,我们先来了解Tom Mitchell对机器学习的任务定义。

  • 机器学习任务的定义:

一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。 

如果用下棋来举例,

E: 算法程序对下棋的自我练习和演算获得的经验

T:下棋

P:算法程序获胜的概率

希望你能对这个概念有个大致的体会。如果仍然有疑惑,不妨在后面的学习中,再深入了解在其他任务中,这三个值分别表示什么。

监督学习 Supervised Learning

在Dr.Ng的课程中,以房价预测和肿瘤性质作为例子,解释了什么是监督学习。

严谨来说,一个监督学习过程,是由训练资料中学到或者建立一个模式(learning model),并且依此推测新的实例,完成整个学习过程。这个训练资料,就是输入对象和预期输出组成的。

通俗易懂地讲,就是我们给模型一个数据集,这个数据集由“正确答案”组成,也就是我们常说的,带有标签(label)的数据

在房价预测中,我们向模型提供一系列房子的售价;在肿瘤性质预测中,我们向模型提供肿瘤的大小以及它是良性还是恶性的这一性质。我们想要知道的是数据之外的时间点上,这套房子的房价将会是多少,或者是其他的肿瘤病例中,这一肿瘤良性和恶性的概率分别是多少。

  •  监督学习中不同问题的分类

回归问题

假设我们要预测的结果是一系列离散的数值,又或者是一系列连续的数值,即总量无法确定的,我们会认为,该类问题属于回归问题,如房价预测。

分类问题

假设我们要预测结果是几个离散的数值,又或者是几个连续的数值,即总量是可以确定的,那么我们就会认为,该类问题属于分类问题,如肿瘤的良性或者恶性,产品是次品还是正品。

  • 特征(Feature)

在房价预测中,想要预测未来房价,我们可以向模型提供房子的大小、房子目前的售价等其他的信息;

在癌症分类中,想要判断肿瘤良性与否、是第几期癌症,我们可以提供肿瘤的尺寸大小、肿瘤的颜色、肿块的密度、形状等等。

学习算法通过学习和处理这些特征得到相关的结果来做推测,这就是机器学习和模式识别中,被测对象的可测量性或特性,被称之为特征(Feature)

无监督学习 Unsupervised Learning

如果你已经了解了监督学习的概念,那么对于无监督学习,你也可以获得一个大致的概念了。

无监督学习,又叫做非监督学习。向算法提供无标签(unlabeled)的数据,学习算法自动对输入的数据进行分类或分群,最后得出我们想要的结果。

  • 聚类算法(cluster analysis)

你可能会好奇,‘如果没有正确答案,那么机器要如何知道什么样的特征会得到某种结果呢?’ 在无监督学习中,算法会将数据集分为两种不同的聚类簇,并通过不同的簇完成学习任务。

例如,在癌症分类问题中,具有不同特征的数据会被排列到坐标系中,算法会将具有相似特征的数据聚为一簇,这就是无监督学习中的聚类算法。

  • 关系规则(association rule)

关系规则是反映一个事物与其他事物之间的相互依存性和关联性,是数据挖掘的一个重要技术,也是无监督学习中除聚类算法之外的另一种学习方法,是一种描述性方法。

无监督学习中,我们并没有向机器提供‘正确答案’,那么机器就需要自己挖掘数据之间的关系。‘无心插柳柳成荫’,机器总会从有趣的角度得出些数据之间有趣的关系(interesting)。大数据分析笔记 (4) -关联规则(Association Rules)_大数据关联规则-CSDN博客

如果你想更深入了解关系规则,就看一下这个博客。

  • 维度缩减(dimensionality reduce)

数据降维其实是一种比较常见的处理方法,常用于神经网络对特征的归一化。在机器学习中,所谓的降维就是采用某种映射方式,将高维空间中的数据点映射到低纬度空间中

为什么要进行数据降维?

在原始的高维空间中,如果数据内存在一些冗余和噪声,那么将会在实际应用中影响置信度和准确率,降维可以在一定程度上提取数据内部的本质特征。

常见的降维方法有主成分分析(Principal Component Analysis)、等距映射(Isometric Mapping)、局部线性嵌入(Locally Linear Embedding)等

如果你想深入了解,可以去查看这一个文章。

数据降维

强化学习 Reinforcement learning

强化学习是一种基于环境行动以求利益最大化的一种学习方法。

相对于监督学习而言,强化学习不需要带标签的输入输出对,也不需要对非最优解进行精准的纠正。算法关注的是如何在有限理性的条件下,寻找和利用的平衡,进行‘探索-利用’的交换。

相信你对仿生这个概念并不陌生,仿生学同样应用在机器学习中,但强化学习是仿‘心’学。

强化学习的灵感来源于心理学的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

也就是说,强化学习最大的一个特点就是,它在环境中探索,通过短期或者长期的反馈对算法本身的解进行调优,以达到一个相对平衡的状态。

在机器学习中,环境通常被抽象为马尔科夫决策过程(Markov decision processes),也就是我们现在常说的MDP,很多强化学习算法在这种假设下才能使用动态规划进行Search-Use的交换。(单纯的、有限环境下的动态规划算法是需要MDP的)。

ps:在Wikipedia里面,对强化学习有这样一句话,可以回味一下。

“传统的动态规划方法和强化学习算法的主要区别是,后者不需要关于MDP的知识,而且针对无法找到确切方法的大规模MDP”

习题or实战

None

_____________________________________________________________________

这一节属于引言,所以在Dr.Ng的课程中出现的习题都比较简单。

也因为是理论知识,所以实战就没有啦。

希望大家今天生活愉快~

下一篇文章是单一变量线性回归模型的一些介绍

(线性代数知识的回顾我打算跳过,学过的同学建议自己去回顾啦~)

week1 finish (1/2)

  • 25
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值