李宏毅《机器学习》笔记:1.机器学习介绍

# Time: 2021.08.23
# 内容:P1~P2

本章串讲连接】:https://xstr8pezm8.feishu.cn/minutes/obcnrjx444396srdt6lzny93

P1: 机器学习介绍

1.1 人工智能、机器学习、深度学习关系

在这里插入图片描述

什么是机器学习?

>>机器学习像个函数,我们输入一些东西,它能输出它的判断。

在这里插入图片描述

  • 输入一段语音,他知道你说的是how are you;
  • 输入图片,它知道是个猫;
  • 输入棋路,它会下 下一步;
  • 输入hi 它会回答 hello;

三者的关系

人工智能是目标,机器学习是实现的一个方法;深度学习是机器学习中, f f f 比较复杂的那部分方法;

1.2 实现途径

>>人工智能就是要让机器具有一个能力,我们给它资料,它来找到**最佳的 f ∗ f^* f,也叫最佳的模型。从而实现上面的功能。

【方法】
在这里插入图片描述

  • 第一个步骤:我们有很多方法 f f f 都可以实现,这个集合叫function set,也叫模型
  • 第二个步骤:我们给它一些训练资料,机器可以根据训练资料判断一个function是好的,还是不好的
  • 第三个步骤:机器自动,通过好的算法,挑出test可能最好的function

在这里插入图片描述

  • f 1 f_1 f1好于 f 2 f_2 f2
  • 可能function set里这两张照片非常多的结果都同f1一样,但别的猫照片是但 f 1 f_1 f1可能识别不出来了。换句话说就是f1不一定是最好的 f ∗ f^* f

1.3 学习方式

# 这部分理解的还不是很透彻,后期会补充和修改

>> 监督(supervised)=标签(label),是否有监督,就是输入数据(input)是否有标签,监督学习有标签的学习无监督学习没标签则的学习半监督学习,就是一半(一点点)数据有标签,一半(极其巨大)数据没标签

① 监督学习(supervised learning)

>>训练数据是有标签的,训练目标是能够给测试数据正确标签的。

  • 回归(Regression)

    > label是数值

    在这里插入图片描述

  • 分类(Classification)

    > label是分类 :二分类和多分类

    二分类:是不是垃圾邮件
    在这里插入图片描述
    多分类: 文章分类系统
    在这里插入图片描述

② 无监督学习(Unsupervised learning)

>> 无监督学习常常被用于数据挖掘,用于在大量无标签数据中发现些什么。它的训练数据是无标签的,训练目标是能对观察值进行分类或者区分等。

非监督性学习是只给特征,没有给标签,就是高考前的一些模拟试卷,是没有标准答案的,也就是没有参照是对还是错,但是我们还是可以根据这些问题之间的联系将语文、数学、英语分开。

经典的算法:k-聚类、主成分分析等;

③ 半监督学习

>> 少量有label,大多数无labled的训练模型,两者相结合的一种学习方法;

④ 迁移学习

>> 假设我们要做猫和狗的分类问题,只有少量的有label的data,大量没有label照片,其中很多别的动物照片,那么这些动物对分类有什么帮助,这种 f f f学习过程叫迁移学习。

在这里插入图片描述

⑤ 强化学习(reinforcement learning)

我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。通过不断的训练 它自己不断的调整。

在这里插入图片描述

机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。不断地下棋,有时候会输会调整f,是的f胜率越来越高。

我们知道Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

1.4 总结

在这里插入图片描述

P2: 我们为什么需要学习机器学习

>> 为机器挑选合适的model和loss function。不同的model和loss function适合解决不同的问题。

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

羊老羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值