项目背景
2019年11月,我公司中标了石化XX公司的智能语音项目,我被任命为该项目的项目经理,全程负责该项目的建设工作。该项目投资120万元,从2019年11月25号开始,预计建设周期4个月。
该项目包括语音识别、语音合成、声纹识别等功能模块。语音识别中又包括实施流式语音识别、上传文件的语音识别、点击开始结束的语音识别,及石化领域语音识别、通用领域语音识别、英文识别,还有将指令转换成命令套接字、语音唤醒等功能。声纹识别中包括音频录制、声纹注册、声纹识别、声纹确认等功能。语音合成中包括:语音合成成音频文件手动播放及语音边合成边播放等功能。
该项目最终做成的使用场景包括:给领导演示场景中功能演示版本、语音识别与知识管理模块做集成的场景,实时流式语音识别中会议场景,录制的音频文件事后处理场景,实时流式语音识别支撑的实验场景。
在改项目中,项目经理是夹杂在客户及内部开发人员之间的,需要权衡两方做决定。客户方的难点在于沟通。客户最开始的转态是对语音产品充满期待,他不懂技术,理解状态的这个产品可就是非常成熟非常好用的,总是想当然。再加上在项目招投标之前科研阶段调研中,同行业销售夸大产品,吹捧给客户,导致了很多功能点是行业之内难以实现的,有的功能即使是行业领军企业也没能做出来。这导致的一个问题是客户期望过高,想当然。举个梨子,语音识别中,目前情况下,通用领域的语音识别都做的比较好;但是像电网调度场景、石化实验室场景中的垂直领域语音识别还很不