什么是streaming ASR?

最近刚刚入坑ASR,在调研论文的时候看到一种类型叫做streaing ASR,有很多论文在streaming ASR上做文章。那么什么是streaming ASR 呢?我在一篇论文的摘要中找到了这么一段话:

In this work, we propose a transformer based end-to-end ASR system for streaming ASR, where an output must be generated shortly after each spoken word[1]

从这段话中可以看出,streaming ASR的独特点在于,它是实时的输出转换好的文字,不需要等输入的语音完全结束才可以输出结果。举个例子来说,当输入的音频是:[我超级喜欢喝冰可乐]。非streaming ASR可能需要等这段语言全部输入完成才能开始转换文字,而streaming ASR 可能听到:[我超喜欢]几个字后就已经可以开始转换文字了。

引用

[1] STREAMING AUTOMATIC SPEECH RECOGNITION WITH THE TRANSFORMER MODEL

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值