2021-10-27

机器学习系列01-机器学习概念及介绍

一、什么是机器学习
计算机程序利用经验 E,学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。—— 汤姆·米切尔,1997

机器学习是一类算法的总称,这些算法从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。
在这里插入图片描述

二、机器学习三步骤
通常机器学习分为以下三步骤:

1. Model
选择一个合适的模型,通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型。模型就是一组函数的集合。

2. Goodness of function(model)
判断一个模型的好坏,需要确定一个衡量标准,也就是我们通常说的损失函数(Loss Function)。损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。

3. Pick the “Best” Function
找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。
在这里插入图片描述
在学习得到 the“Best” Function 后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。

model(function set) 选择模型
在解任务的过程中,第一步是要选一个function的set,选不同的function set,会得到不同的结果;而选不同的function set就是选不同的model,model又分为很多种:

Linear Model(线性模型):最简单的模型

Non-linear Model(非线性模型):最常用的模型,包括:

deep learning:如alpha-go下围棋,输入是当前的棋盘格局,输出是下一步要落子的位置;由于棋盘是1919的,因此可以把它看成是一个有1919个选项的选择题。

  • SVM
  • decision tree
  • K-NN

三、机器学习类型

1. Supervised Learning(监督学习)
监督学习需要大量的training data,这些training data告诉我们说,一个我们要找的function,它的input和output之间有什么样的关系。而这种function的output,通常被叫做label(标签),也就是说,我们要使用supervised learning这样一种技术,我们需要告诉机器,function的input和output分别是什么,而这种output通常是通过人工的方式标注出来的,因此称为人工标注的label,它的缺点是需要大量的人工劳力。

Regression(回归)
回归是machine learning的一个task,特点是通过regression找到的function,它的输出是一个scalar数值。回归问题通常是用来预测一个值,它的预测结果是连续的,如预测房价、未来的天气情况等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。
在这里插入图片描述

Classification(分类)
regression和classification的区别是,我们要机器输出的东西的类型是不一样的,在regression里机器输出的是scalar,而classification又分为两类:
在这里插入图片描述

  • Binary Classification(二元分类)
    在binary classification里,我们要机器输出的是yes or no,是或否。比如G-mail的spam filtering(垃圾邮件过滤器),输入是邮件,输出是该邮件是否是垃圾邮件。

  • Multi-class classification(多元分类)
    在multi-class classification里,机器要做的是选择题,等于给他数个选项,每一个选项就是一个类别,它要从数个类别里面选择正确的类别。比如document classification(新闻文章分类),输入是一则新闻,输出是这个新闻属于哪一个类别(选项)。

常见算法:k-近邻算法、决策树与随机森林、逻辑回归、神经网络、朴素贝叶斯、Logistic回归、支持向量机、AdaBoost算法、线性回归、局部加权线性回归、收缩和树回归等。

2. Semi-supervised Learning(半监督学习)

举例:如果想要做一个区分猫和狗的function。

手头上有少量的labeled data,它们标注了图片上哪只是猫哪只是狗;同时又有大量的unlabeled data,它们仅仅只有猫和狗的图片,但没有标注去告诉机器哪只是猫哪只是狗。
在Semi-supervised Learning的技术里面,这些没有labeled的data,能提高机器学习模型的性能。(在标签数据上训练模型,然后使用经过训练的模型来预测无标签数据的标签,从而创建伪标签。此外,将标签数据和新生成的伪标签数据结合起来作为新的训练数据。)
在这里插入图片描述
3、Transfer Learning(迁移学习)

假设一样我们要做猫和狗的分类问题。

我们也一样只有少量的有labeled的data;但是我们现在有大量的不相干的data(不是猫和狗的图片,而是一些其他不相干的图片),在这些大量的data里面,它可能有label也可能没有label。
Transfer Learning要解决的问题是,这一堆不相干的data可以对结果带来什么样的帮助。迁移学习简单来说就是能否举一反三。
在这里插入图片描述
4、Unsupervised Learning(无监督学习)
区别于supervised learning,监督学习就像有老师指导一样,老师会告诉我们该怎么做。而unsupervised learning希望机器学到无师自通,在完全没有任何label的情况下,机器到底能学到什么样的知识。

举例来说,如果我们给机器看大量的文章,机器看过大量的文章之后,它到底能够学到什么事情?它能不能学会每个词汇的意思?

学会每个词汇的意思可以理解为:我们要找一个function,然后把一个词汇丢进去,机器要输出告诉你说这个词汇是什么意思,也许他用一个向量来表示这个词汇的不同的特性,不同的attribute。

又比如,我们带机器去逛动物园,给他看大量的动物的图片,对于unsupervised learning来说,我们的data中只有给function的输入的大量图片,没有任何的输出标注;在这种情况下,机器该怎么学会根据testing data的输入来自己生成新的图片?
在这里插入图片描述
常见算法:k-means、Apriori、FP-Growth等

5、Structured Learning(结构化学习)

在之前的学习中,输入和输出都是向量。然而在现实生活中,我们需要解决的问题并不都是此类问题。在structured Learning里,我们要机器输出的是,一个有结构性的东西。

在分类的问题中,机器输出的只是一个选项;在structured类的problem里面,机器要输出的是一个复杂的物件。

举例来说,在语音识别的情境下,机器的输入是一个声音信号,输出是一个句子;句子是由许多词汇拼凑而成,它是一个有结构性的object。或者说机器翻译、人脸识别(标出不同的人的名称)。比如GAN也是structured Learning的一种方法。

因此我们需要一个更加强大的函数。
在这里插入图片描述
其输入输出都是对象,而对象可能是序列、列表、树或者是边界盒等等。
在这里插入图片描述
6、Reinforcement Learning(强化学习)

Supervised Learning:我们会告诉机器正确的答案是什么 ,其特点是Learning from teacher.

  • 比如训练一个聊天机器人,告诉他如果使用者说了“Hello”,你就说“Hi”;如果使用者说了“Bye bye”,你就说“Good bye”;就好像有一个家教在它的旁边手把手地教他每一件事情。

Reinforcement Learning:我们没有告诉机器正确的答案是什么,机器最终得到的只有一个分数,就是它做的好还是不好,但他不知道自己到底哪里做的不好,他也没有正确的答案;很像真实社会中的学习,你没有一个正确的答案,你只知道自己是做得好还是不好。其特点是Learning from critics.

  • 比如训练一个聊天机器人,让它跟客人直接对话;如果客人勃然大怒把电话挂掉了,那机器就学到一件事情,刚才做错了,它不知道自己哪里做错了,必须自己回去反省检讨到底要如何改进,比如一开始不应该打招呼吗?还是中间不能骂脏话之类的。
    在这里插入图片描述

再拿下棋这件事举例,supervised Learning是说看到眼前这个棋盘,告诉机器下一步要走什么位置;而reinforcement Learning是说让机器和对手互弈,下了好几手之后赢了,机器就知道这一局棋下的不错,但是到底哪一步是赢的关键,机器是不知道的,他只知道自己是赢了还是输了。
其实Alpha Go是用supervised Learning+reinforcement Learning的方式去学习的,机器先是从棋谱学习,有棋谱就可以做supervised的学习;之后再做reinforcement Learning,机器的对手是另外一台机器,Alpha Go就是和自己下棋,然后不断的进步。

下一篇:机器学习系列02-回归案例研究

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值