Task01 机器学习介绍


前言

人工智能的快速兴起,使得人们积极投身机器学习的研究,本文简单介绍了什么是机器学习、一些机器学习的相关技术以及在未来超有潜力的一个职业—AI训练师。


一、机器学习介绍


首先很多人对于人工智能(最初称为人工智慧)、机器学习、深度学习三者之间究竟有着怎样的关系很是疑惑,上图很好的展示了三者之间的关系。
人工智能— 希望机器像人一样聪明,这是我们的终极目标
机器学习—实现人工智能的手段
深度学习—机器学习的一种方法
在这里插入图片描述
机器学习通俗来讲就是让机器具有学习的能力。通过编写程序使机器变聪明,具备自己学习的能力。

机器学习的步骤如下:
Step 1:从一组function的集合里寻找一个function
Step 2:衡量找到的function的好坏
Step 3:选择最好的function

如上图所示,我们的任务为:图像辨识,按照机器学习的步骤来完成这个任务:
Step 1:先准备一组function的集合(有很多个function),假设有个function f1,它看到猫时就输出猫,看到狗时就输出狗;但另一个 function f2很奇怪,它看到猫说是猴子,看到狗说是蛇。

Step 2:然后把训练数据(大量图片)喂给机器进行训练,这些训练数据反映了输入和输出的对应关系,对于当前任务来说,看到猫时就输出猫,看到狗时就输出狗,这样是对的。进而机器就可以判断这个function是好是坏,对于上述的f1,f2来说,f1是好的。

Step 3:由于我们的function 集合里有很多个function,需要找到一个有效率的演算法,有效率的演算法可以从function的集合里挑出最好的function,找到最好的function之后,我们把它应用到图像辨识中,输入一张机器没有见过的猫,希望输出也是猫。

二、有关机器学习的一些技术介绍

在这里插入图片描述

注:蓝色方块—学习场景,是我们无法控制的。比如,当我们没有数据做监督学习时,我们才做强化学习。
红色—任务(task),需要解决的问题,问题不同,方法也不同。
绿色—模型(model),不同的task有不同的model。例如:线性模型、深度学习、SVM等。

1.监督学习(Supervised Learning)

1.1 回归(Regression)

Regression的输出为数值,例如预测明天的PM2.5的值,需要找到一个function,这个function的输出是未来某一时间PM2.5的数值。

1.2 分类(Classification)

Classification输出为类别,Classification问题分成两种,一种为二分类,输出为:是或否(Yes or No)(例如:垃圾邮件分类);另一种为多分类(Multi-class),在Multi-class中是让机器做一个选择题,给机器多个选项,每个选项都是一个类别,让他从中选择正确的类别(例如:文章分类)。

监督学习中我们需要大量的training data,training data告诉我们要找的function的input和output之间的关系,并且output需要人工标注,output也称为label。

1.3 深度学习(Deep Learning)

在这里插入图片描述
刚才所说的都是让机器来解决任务,在解决任务的过程中,第一步要选择function的集合,也就是选择不同的model。Model分为线性模型和非线性模型,Deep Learning就是非线性模型中有名的一个,它的function特别复杂,它所解决的问题也比较复杂,例如:图片识别(需要描述pixel和class之间的关系)。

2.半监督学习(Semi-supervised Learning)

半监督学习是一种减少label用量的方法。
在这里插入图片描述

举例来说,你想做一个猫狗分类器来识别图片上是猫还是狗,但是你只有少量有label的数据,大量的数据都是没有label的,你没有时间去告诉机器这些图片的类别,但是这些没有label的数据对于我们来说也有用处,这就会用到半监督学习的方法。

3.迁移学习(Transfer Learning)

迁移学习是一种减少数据用量的方法。
在这里插入图片描述

假设我们要做猫狗分类的问题,但我们只有少量有label的数据,大量与本次任务无关的数据,它们中有的有label,有的没有,那么这些数据对于我们分辨猫狗来说有没有用处呢,这就是迁移学习要研究的问题。

4.无监督学习(Unsupervised Learning)

无监督学习有一种无师自通的感觉
在这里插入图片描述

举例来说,机器在动物园里看完一大堆动物后,可以学会自己创造一些动物,比如:眼睛长在身上的狗、像乳牛的狗等等。

5.监督学习中的结构化学习(Structured Learning)

结构化学习中机器的输出是有结构性的

在这里插入图片描述

举例来说:在语音识别中,机器输入声音信号,输出的是一个句子。句子很多词汇组合而成的。它是具有结构性的。

6.强化学习(Reinforcement Learning)

在强化学习中,机器不知道正确答案,只有一个分数来衡量它所作所为的好坏情况。
在这里插入图片描述

举例来说,我们用强化学习训练一个聊天机器人,通过它和客人对话后,客人的反应,来让它明白自己学习的情况,假如客人生气的挂断了电话,它会学习到刚才的事情自己做错了,但它并不知道错在何处,也没有人告诉它哪里出了差错,它要进行反思,检讨自己哪一步没有做好。

强化学习比较符合我们人类的学习过程,你可以在书本上找到答案,但是当你进入社会中,没有人会告诉你答案,你只知道自己做的好还是不好,进而反思自己,如果做的不好,下次进行改正。

之前我们讲过监督学习,如果用监督学习的方法来训练一个聊天机器人,我们会告诉机器正确答案是什么,比如:客人说了hello,你要回复hi,客人说了byebye,你要说good bye。

三、AI训练师-一个amazing的职业

有关人工智能将取代人类的说法,曾引起过激烈的讨论,但是人工智能真的会取代人类吗?不过,大家不用担心,相应的也会产生一些新的职业,比如:AI训练师。
AI训练师需要为机器挑选合适的model和loss function。不同的model和loss function适合解决不同的问题。所以要训练出厉害的AI,AI训练师不可或缺。

总结

以上就是今天要讲的内容,本文简单介绍了机器学习的概念、相关技术、以及AI训练师这个酷酷的职业,道阻且长,一起加油吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Never give up

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值