【复旦邱锡鹏教授《神经网络与深度学习公开课》笔记】表示学习

机器学习解决模式识别任务一般流程

在这里插入图片描述

  • 特征处理:即特征工程,在机器学习的过程中不关注,但却是完成机器学习任务的重点工程,需要人工提取特征并表示,工作量巨大
  • 浅层学习:不涉及特征学习,特征主要靠人工经验或特征转换抽取

人工智能挑战——语义鸿沟

  • 底层特征:直接能从数据中提取出的特征,一般指轮廓、边缘、颜色、纹理和形状特征。
  • 高层语义:我们所能看的东西,比如对一张人脸提取低层特征我们可以提取到连的轮廓、鼻子、眼睛之类的,那么高层的特征就显示为一张人脸。高层的特征语义信息比较丰富,但是目标位置比较粗略。1
    语义鸿沟问题指人们对文本、图像的理解无法从字符串或者图像的底层特征直接获得

数据表示

为解决语义鸿沟问题,需要从底层特征中构造出一些表示(Represention),这些表示能够反映出事物的高层语义特征。数据表示是机器学习的核心问题。
好的数据表示应:

  • 具有很强的表示能力

  • 使后续学习任务变得简单

  • 具有一般性,是任务或领域独立的
    在计算机中的表示形式有:

  • 局部表示:又称为离散表示,符号表示。 每个内存单元存储一个数据,向量高维稀疏2,比如One-Hot向量(下图所示就是One-Hot向量)
    在这里插入图片描述

  • 分布式表示:向量中每个分量对应一个数据,各个分量相互排斥2。比方说有N个维度,每个维度可以表示两种语义,则采用分布式表示共可以表示 2 k 2^k 2k个语义
    在这里插入图片描述在这里插入图片描述

可以使用神经网络来将高维的局部表示空间映射到一个非常低维的分布式表示空间。在这个低维空间中,每个特征不再是坐标轴上的点,而是分散在整个低维空间中。在机器学习中,这个过程也称为嵌入(Emdding)3
在这里插入图片描述

e.g. 词嵌入
要表示一个词的语义,将这个词投到一个语义空间,在空间中越靠近的语义越相似

在这里插入图片描述

有了好的数据表示,表示学习只需要关注如何从数据中学习好的表示,通过构建具有一定”深度“的模型,让模型自动学习好的特征表示,从而提升预测或识别的准确性。
在这里插入图片描述

表示学习与传统特征提取对比
  • 特征提取:基于任务或先验去除无用特征
  • 表示学习:通过深度模型学习高层语义特征
    特征提取得到的特征并不一定会提高分类器的效果,表示学习是相当于将数据从输入到输出串联到一起,学到的表示对后面的分类有直接的帮助。
    表示学习的难点在于没有明确的目标,因此要与模型的预测结果一起进行学习(端到端学习)

  1. 对图像中语义信息、高层和底层特征的理解_图像语义特征-CSDN博客 ↩︎

  2. 表示学习(Representation Learning)之局部表示(Local Representation)与分布式表示(Distributed Representation)-CSDN博客 ↩︎ ↩︎

  3. 邱希鹏《神经网络与深度学习》笔记 第一部分 机器学习基础 第1章 绪论 - 知乎 (zhihu.com) ↩︎

  • 24
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Don't move

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值