本文根据小米智能云秦斌老师在DataFunTalk人工智能技术沙龙“自然语言处理技术应用实践”中分享的《音乐垂域的自然语言理解》编辑整理而成,在未改变原意的基础上稍做删减。
(秦斌老师在活动现场)
今天分享的内容有项目研究背景、实现了那些功能,在做音乐领域时有哪些独有的问题与挑战,还有就是“小爱”项目具体的实现。
上图是整个小爱语音交互平台的后台服务架构,小米大脑定位的是一个平台,能够处理各种数据。在最外部给各种厂商封装了SDK接口,目的使厂商能够很快的接入,降低你接入成本,如果你要操作小米相关智能设备就要MOIT授权验证。后续会有小米语音服务ASR,语音识别都在客户端,由于平台特性,在云端接入ASR厂商,如微软、百度、科大讯飞、猎狐星空等,部署于云端便于控制和优化,可以额外做一些文本选择等功能。语音转化为文本就会进入NLP模块,在NLP中控部分会做一些个人训练计划、公共训练计划、还有一些query概率,然后将其发布到精品垂域,采用分而治愈的思想,每一个垂域将这个领域的语料、知识、常见说法给建立起来,由中控选择最终的垂域。最外部有一个设备开放平台oivs,方便各种硬件设备厂商接入。后续还有一个技能开放平台,第三方技能开发者能够在平台上很简单的实现一个技能,如打开成语接龙或闲聊,将query转给第三方技能。周边就是机器存储、机器学习平台等资源平台。
接下来介绍下,一个垂域要做那些事情。如飞机票垂域,要理解用户的意图,是要购票还是退票,音乐就是你要找歌手、听歌、还