前言
语音助手作为一种便捷的交互形式,各家厂商一直很看好。
手机端的语音助手,比如苹果的Siri、小米的小爱同学,一直在保持不断进步。
智能音箱作为除了手机之外的另一个重要的物联网入口,也成为了兵家必争之地,目前国内做的比较好的是小米的智能音箱。京东也推出了自己的智能音箱,京东叮咚智能音箱。而为音箱提供技术支持的语音平台,也开始发展。
讯飞作为国内领先的语音输入法,在这个技术的基础上,通过讯飞开放平台,为其他厂商提供了一整套的解决方案。
之所以将这两个放在一起对比,因为他们两个都在推出AI技术服务。
京东Alpha
首先看看能做什么
loT开放平台
Alpha-IoT 开放平台是面向硬件厂家的一站式智能硬件开发平台
简单概括下就是
- 物联网
- 厂商级别的硬件接入
Skill开放平台
Alpha技能的开发平台,提供全套的自助式开发工具;帮开发者轻松,快速地将服务集成到Alpha平台,
使用户通过自然语言即可获取服务,并通过Alpha赋能智能设备或手机应用,帮开发者获得亿级智能场景用户,
从移动服务向AI服务升级。
总结一下
- 语音策略
- 调用智能硬件
AI赋能平台
AI赋能平台提供标准API/SDK,让硬件开发者快速集成Alpha语音助手,实现产品智能化
让用户通过语音来实现购物、听音乐、查天气等更多技能。
总结
- 开发者的硬件集成Alpha语音助手
讯飞开放平台
讯飞更倾向于提供解决方案和功能性质的API
从企业角度来讲,这样完整的解决方案更方便快捷。
从开发者角度来讲,更倾向于提供给的API的功能。
开发者的接口
官方的来讲下面的部分属于完整的解决方案
- 消费级产品
- 医疗产品
- 语音硬件
除了这些之外,能被调用的API类为
- 语音合成
- 在线语音合成
- 离线语音合成
- 语音识别
- 语音听写
- 语音转写
- 实时语音转写
- 语音唤醒
- 离线命令词识别
- 语音扩展
- 语音评测
- 机器翻译
- 语义理解
- 模式识别
- 人脸识别
- 声纹识别
- 手写文字识别
- 印刷文字识别
AIUI
AIUI相对于上面提到的比较传统的接口提供,还是很不一样的。
同样的,这里也提到了技能这个概念。
这部分也就是AI开放平台的重要概念。
语音AI
看到这里,你也就知道为什么我会将这两个平台放到一起来讲了。
语音AI平台,就是用
- 技能
- 意图
- 预料
- 实体
通过大量的训练,来达到模糊语音输入->精确匹配意图->操作软件或者硬件 的目的。
IBM的智能助手也是这么做的,只不过IBM目前不支持中文。
总结
我们通过大略的阅读文档,了解了语音AI平台的功能。
下面就是从结构角度,详细看语音AI的设计思路。