现在用户不仅可以在百度地图体验语音交互,在很多集成了地图服务的智能终端和APP上,也有地图语音交互需求。
例如家居智能音箱,用户可以吃着早餐、换着衣服问:“去公司要多久后?”、“后场村路堵不堵?”不用再拿起手机操作。
对于车载智能机器人,在开车时可以直接询问:“最近的加油站/充电桩在哪?”
对于智能穿戴设备,例如智能儿童手表,手表可操作的界面很小,它是天然的语音交互场景。比如儿童可以对着手表说“请带我回家”,直接发起语音导航带着儿童回家。
对于交通出行类手机应用,如网约车、分时租赁、物流等,通过语音查询地点、查询路线也是很常见的应用需求。
针对以上场景,百度地图开放平台联合百度AI开放平台将百度地图语音交互能力向第三方开发者开放——“地图智能语音交互解决方案”,帮助更多的智能硬件和手机应用便捷地集成地图语音交互能力。整个方案包括语音唤醒与识别、语义的理解与交互、地图服务调用语言生成、语音合成五个步骤。
地图语音交互解决方案如何工作
第一个步骤语音唤醒与识别,成功唤醒之后机器人开始接收我们的指令。百度语音SDK里集成了语音唤醒能力,开发者可以定义唤醒词,例如百度地图的唤醒词是“小度小度”,当然开发者也可以根据自己的产品设计其他唤醒词。
在语音识别方面(将语音准确地转化为文字)。针对基于位置服务的语音交互场景,语音识别提供了两个产品,第一个