点击上方蓝字,关注高德技术!
1.
导读
随着移动互联网的发展,行业内衍生了基于移动平台的各类解决方案。其中,设备规模化管理的云控能力是各互联网公司在设备集群控制背景下的诉求。因此涌现了大批提供类似解决方案的平台。如:阿里系的阿里云MQC、阿里无线和菜鸟Nimitz等,阿里之外的有Testin、百度MTC、腾讯WeTest、华为、三星等等。
目前以上平台在云真机的使用上,都存在一个已知的短板 —— 声音。用户看的到画面,能够响应操作,但是涉及到声音播报、语音交互的场景时则无能为力。尤其对于音乐、视听、短视频、直播客户端等这类多媒体属性强的App,在云真机的使用场景上是受限最大的。
现在回到我们自己的产品。高德地图车机/镜版(后面统称Auto)。其中最常见的导航播报、与系统的多媒体混音交互、以及语音助手多轮对话的交互场景中,这些与声音相关的场景占比高达25%以上。所以解决远程场景下的声音双向交互问题,是云真机要成为一个日常化的生产工具之前必须迈过的坎。
2.
挑战
在远程音频的双向通讯解决方案的背景下,满足基本用户体验的方面也存在以下挑战:
能力:满足所有车载设备的声音场景的双向交互能力(因为车载设备在声音部分比手机具有更高的定制性,在覆盖车载场景后,手机基本可以无缝适配);
延迟:传输延迟低于500ms(基于一定的网络条件);
体验:无明显卡顿、杂音问题。
3.
设想
首先通过下面的一张图来了解一下我们的需求是什么:
将声音通过电脑传输到远端的车机设备(车机系统能正常解析处理);
将车机通过喇叭播报出的声音传输到用户端。
而实现这两条链路,关键核心的两个因素是:
如何获取和写入音频数据;
如何实现实时的音频数据在车机和用户设备间的传输链路。