一、项目要求
在微软讲师提供的实例程序之上,增加新的场景
典型场景:
可以通过语音下达指令。
支持自然语言的多轮对话,如“打开卧室的灯。厨房的也打开。”
通过个性化的语音(如学生自己的语音)进行反馈。
微软讲师提供:语音控制开关灯的示例程序
给学生的建议:
通过微软认知服务语音转文本、语言理解来识别声音输入。
可以尝试通过识别特定的词汇来判断是否是后几轮对话,并复用之前识别出的上下文。
通过微软认知服务文本到语音转换来实现个性化语言输出。
二、计划
采用微软认知服务——语音API,将语音转化为文本。再调用语言理解服务获取用户意图,从而下达命令,控制智能家居,并反馈语音信息。
理解语言时,训练了所有家居的组合情景,生成了对应的意图;另外,对于省略的指令对象的语句,根据上文补充出设备名称和状态(关闭or运行),从而匹配上对应意图。这是一种简单而有效的实现方式。
反馈语音信息时采用了语音合成器,在获取意图成功,并下达指令后,简单回复确认信息。
三、小组成员和源代码仓库
源代码仓库——https://github.com/pc-phoenix/LightControl.git