2021-10-10

Speech recognition——陈果果——深蓝

  1. 目前语言领域(包括语言识别、唤醒)的进展,以及实际落地中遇到的困难?

    • 唤醒:小度、亚马逊 >> 二级系统、一级系统;低功耗芯片
    • 语言识别:
      挑战:模型的裁剪(低功耗设备端端移植)、数据回流(迭代模型)、复杂场景下识别
  2. 智能语音在嵌入式设备端落地时,相比于服务器端,有哪些是需要特别考虑的因素?
    数据回流:隐私问题(数据智能保留2星期)——服务器
    嵌入式:1、用户数据无法回流。(联邦学习是好方向);2、降低功耗是首要问题(模型的裁剪和压缩;工程,做指令集的优化fft、直接用汇编指令实现)

  3. 建议?
    参与实际工作。

  4. 发布的英文版语音识别数据集介绍
    GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio

https://github.com/SpeechColab/GigaSpeech

Future Work

  • More languages
  • More benchmarking
  • Pre-trained models
  • Fine-tuning
  • PySpeechColab
  • Decoders
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值