cotatron 中构造的特征_笔记

 

1)

预训练TTS系统,即tacotron2时,根据decoder hidden state 和encoder output,即根据目标隐状态-绿色的和每个源状态-蓝色实心的,“相比”,以生成注意力权重(attention weights)矩阵也称为对齐(alignments)

根据注意力权重,可以计算上下文向量作为源状态的加权平均。

 

2)

可以使用不同的score函数:

基于内容的注意力机制能够将不同的输出与相应的输入元素连接,而与其位置无关。在Tacotron2中使用基于内容的注意力机制时,当输出对应于's'的Mel频谱帧,模型会寻找所有所有对应于's'的输入。

基于位置的注意力机制仅关心序列元素的位置和它们之间的距离。基于位置的注意力机制会忽略静音或减少它们,因为该注意力机制没有发现输入的内容。

混合注意力机制能够同时考虑内容和输入元素的位置。

 

3)

Tacotron2注意力机制,使用的Score函数,是基于Location Sensitive Attention,

Text-audio Alignment与encoder output矩阵相乘,得到Attended output

 

链接:https://www.cnblogs.com/mengnan/p/9527797.html

 

4)code

Alignment : [T_dec, T_enc]

encoder output: [T_enc, chn.encoder=512]

矩阵相乘:[T_dec, chn.encoder=512],是具有(decoder hidden"相关"的)敏感位置信息的attended encoder output

transpose: [512, T_dec]

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值