针对领域不变训练的注意力对抗学习

最新推荐文章于 2024-12-31 15:32:41 发布

Mr.Gu

最新推荐文章于 2024-12-31 15:32:41 发布

阅读量525

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/JarvanWang/p/10950427.html

版权

本文介绍针对领域不变训练的注意力对抗学习，基于注意力机制的领域不变对抗性训练可抑制说话人与环境变量实现鲁棒ASR。提出AADIT方法，用注意力机制调整深度特征权重增强领域不变性，实验显示single - head AADIT比多场景LSTM声学模型和ADIT有更好表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ICASSP 2019 SLP-P17.3: ATTENTIVE ADVERSARIAL LEARNING FOR DOMAIN-INVARIANT TRAINING（针对领域不变训练的注意力对抗学习）

简介

基于注意力机制的领域不变对抗性训练，用于抑制说话人变量与环境变量，以实现鲁棒ASR。

基于对抗的领域不变性训练（Adversarial Domain-Invariant Training，ADIT）

收敛：

同时，通过最小化预测三音素后验与三音素标签之间的交叉熵以提高F的三音素鉴别性：

基于注意力机制的、对抗的领域不变性训练（Attentive Adversarial Domain-Inveriant Training，AADIT）

在ADIT中，领域分类损失函数等于深度特征序列中每个特征的分类错误之和。然而，与无话语帧的深度特征相比，有话语帧的深度特征更具有领域鉴别性；与辅音相比，元音的深度特征的领域变化性更大。为解决这一问题，本文提出使用注意力机制动态且自动地调整深度特征的权重，以对更具有领域鉴别性的深度特征进行强调，这样，能增强所有深度特征的领域不变性。

本文使用了更适用于ASR的soft local(time-restricted) self-attention。local attention选择性地将注意力集中于上下文窗（以当前时间为中心）。

点积attention
加性attention

领域分类损失函数变为：

参数估计可表示为：

实验结果与结论

与多场景LSTM声学模型相比，single-head AADIT变好13.6%

与ADIT相比，single-head AADIT变好9.3%

参考文献

ATTENTIVE ADVERSARIAL LEARNING FOR DOMAIN-INVARIANT TRAINING

Zhong Meng, Jinyu Li, Yifan Gong, Microsoft Corporation, United States

转载于:https://www.cnblogs.com/JarvanWang/p/10950427.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。