NLP基础知识

1、声学识别模型


将从麦克风收集来的声音,进行一些信号处理,将语音信号转化到频域,从每10毫秒的语音中提出一个特征向量,提供给后面的声学模型。声学模型负责把音频分类成不同的音素。接下来就是解码器,可以得出概率最高一串词串,最后一步是后处理,就是把单词组合成容易读取的文本。


2、POMDP框架


3、api.ai  集中在NLU领域,语音及动作控制功能不提供


4、alexa 完全由API形式接入,需要使用AWS服务,设备接入需要建立自己的私有云(AWS),amazon同步带动自己的云服务

   https://developer.amazon.com/alexa-voice-service


5、度秘

   提供语音输入、TTS、NLU、对话管理、动作控制、模组、APP SDK、芯片的整套解决方案,生态定位比较全,但若没有标杆产品只定位为能力输出,商业变现及2D 2B吸引力不清晰


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值