【论文笔记】Leveraging Unpaired Text Data for Training End-to-End Speech-to-Intent Systems

最新推荐文章于 2024-07-17 10:27:43 发布

TrainerNN

最新推荐文章于 2024-07-17 10:27:43 发布

阅读量281

点赞数

分类专栏：端到端语音识别论文笔记文章标签：语音识别深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zycodecsdn/article/details/109278396

版权

该论文提出了一种利用未配对文本数据训练端到端语音到意图（S2I）系统的方法。通过迁移学习，结合speech-to-intent和text-to-intent模型，利用丰富的text-intent数据补充speech-intent数据的不足。通过TTS系统进行数据增强，并使用预训练的text模型指导speech-intent模型，提高端到端系统的性能。实验表明，即使在少量speech-intent数据下，这种方法也能实现较好的准确率。

摘要由CSDN通过智能技术生成

题目

Leveraging Unpaired Text Data for Training End-to-End Speech-to-Intent Systems

链接

https://arxiv.org/pdf/2010.04284.pdf

标签

Speech-to-intent, spoken language understanding, end-to-end systems, pre-trained text embedding, synthetic speech
augmentation

Contributions

运用迁移学习的知识，联合训练speech-to-intent 模型和text-to-intent模型，利用较多的text-intent数据作为基于speech-intent的端到端S2I(speech-to-intent)模型的补充
为了解决speech-intent数据集的稀缺，通过TTS系统把text-intent数据转换为speech-intent数据，以达到数据增强的目的。

亮点与启发

由于深度神经网络极度依赖于大量的数据来驱动得到较好的效果，而对于端到端的S2I系统， intent-labeled speech data太过稀缺了，为了比肩传统的模型（speech-text-intent）,需要设法弥补数据稀缺的问题。
为解决此问题的答案就是——迁移学习。

基于Text-int

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】Leveraging Unpaired Text Data for Training End-to-End Speech-to-Intent Systems

题目Leveraging Unpaired Text Data for Training End-to-End Speech-to-Intent Systems链接https://arxiv.org/pdf/2010.04284.pdf标签Speech-to-intent, spoken language understanding, end-to-end systems, pre-trained text embedding, synthetic speechaugmentationCont
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。