摘要
虚拟数字人是人工智能与元宇宙应用的交叉点,也是当今线上与线下人机交互的新兴渠道之一。虚拟数字人涉及控制引擎、自然语言处理、3D图形渲染、语音识别与合成等技术领域,需要软硬件栈多层次的协同设计。为此,基于一体机部署模式的OMHuman虚拟数字人解决方案提出一套松耦合式控制引擎,采用独立显卡实现图形渲染,并通过自研算法在Intel OpenVINO计算引擎上实现人工智能模型推理,解决了传统方案在语音—动作协同控制等诸多方面的不足,同时兼顾了最终用户体验、开发成本与部署成本。比较测试表明,OMHuman虚拟数字人模型推理性能为传统引擎的2~3倍,图形渲染效率为核芯显卡的2倍,能够以自然的方式满足人机交互需求,目前已在虚拟主持人、智能数据分析师等场景得到成功应用。