李宏毅机器学习28——more about auto-encoder

本文深入探讨自动编码器,介绍衡量编码器性能的其他方式,如使用判别器和特征解缠。此外,讨论如何使嵌入表示更易解释,包括VQVAE和将序列作为嵌入的应用,以及如何通过GAN生成符合语法的摘要。
摘要由CSDN通过智能技术生成

 摘要:

上节课讲了auto-encoder,这节课更详细的学习auto-encoder。

主要从两个角度来学习。

一是衡量encoder好坏的其他方法。与minimize reconstruction error不同,这里引入了判别式模型,来衡量embedding和输入的密切程度。通过训练encoder中的参数和判别式模型中的参数,来找到最合适的encoder。

二是对embedding的解释。为了让embedding更好的解释,我们可以通过特征解缠的方法,将不同的信息分类,主要学习两种做法,一个是通过GAN,一个是通过改变encoder的结构,将不同信息分开。

为了使embedding更好的解释,我们还可以将embedding转换成离散的向量,如果是音频信息,这就可以做到噪音过滤了。

还可以训练一个seq2seq2seq的Auto-encoder,将sequence当做embedding,在此基础上加上GAN,就可以生成符合语法的摘要了。

目录

 ​

一、衡量encoder好坏的其他方法

1.什么是好的embedding?

2.Discriminator

二、如何让embedding更容易被解释

1.feature disentangle 

2.解释embedding

实际应用:

1.VQVAE

2.sequence as embedding

总结:



Auto-encoder主要包含一个编码器(Encoder)和一个解码器(Decoder)。Encoder接收一张图像,输出一个vector,上节课中称他为code,也可以叫它Embedding、Latent Representation或Latent code,这个vector是关于输入图像的表示;然后将vector输入到Decoder中就可以得到重建后的图像,我们希望输出图像和输入图像越接近越好,这个方法叫做reconstruction error。
这节课更深入的学习auto-encoder,主要围绕两方面
一、为什么一定要minimize reconstruction error,有没有其他方法?
二、如何理解embedding?

 


一、衡量encoder好坏的其他方法

1.什么是好的embedding?

一个好的embedding应该可以很好地代表输入的事物。首先embedding应该和object有密切的关系。
用李宏毅老师的例子,左边的人物始终带着耳机,因此耳机这个vector应该和左边的人物是相联系的。

2.Discriminator

首先我们有一个encoder,
三九(上面的人物)通过encoder,得到的输出为蓝色的embedding
凉宫春日(下边的人物)通过encoder,得到输出为黄色的embedding
我们如何评估一个encoder的好坏呢?
我们可以

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
引用: Auto-encoder是一种深度学习模型,用于将输入数据编码为低维表示,并尽可能地重构原始数据作为输出。在降维方面,PCA会将不同类别的数据混合在一起,而auto-encoder则可以将它们分开。除了降维之外,auto-encoder还有其他用途,比如图片搜索。 引用: 训练一个auto-encoder的过程通常会先固定一些权重参数,然后逐层训练多个自编码器,每个自编码器的输入和输出维度逐渐逼近目标维度。最后,可以使用反向传播来微调网络参数。现在也可以不进行预训练,直接训练auto-encoder。此外,auto-encoder还可以与卷积神经网络(CNN)一起使用。 引用: 特征区分技术是指在auto-encoder中,通过编码器获取的Embedding向量中,可以区分出不同输入数据的特征信息。比如,对于语音输入,可以分别提取出语音内容和说话者的特征。这就是Feature Disentangle的目标。 根据李宏毅老师的讲解,auto-encoder是一种用于降维、重构和特征提取的深度学习模型。它可以将输入数据编码为低维表示,并尽可能地重构原始数据作为输出。除了降维之外,auto-encoder还可以用于图片搜索等任务。训练auto-encoder时,可以使用预训练和微调的方法,也可以直接进行训练。此外,auto-encoder还可以与卷积神经网络(CNN)结合使用。特征区分技术可以用于auto-encoder中,用于提取不同输入数据的特征信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值