本文主要是分享一下自己在探索设计实现一个面向中文唇语识别数据采集系统的经验。主要有两步工作,一是配置系统环境, 二是系统设计与编程实现。
1.对于环境系统配置,主要包括格式工厂、爱剪辑软件的安装,VS2013、OpenCv、JSONCPP、Dlib的配置安装。
2.对于系统的编程实现,包括语音转写接口调用Java编程、JSON文件解析、视频唇语序列按词语进行切割。
本系统实现唇语自动切割分类,分单字、双字和长词语,自动按序编号分为训练集、验证集和测试集。每个词语文件夹下都有视频源等信息说明文件、词语对应的短视频以及唇形序列,例如“分别”这一个词语切割效果图如下:
想要具体实现代码和相关环境配置说明文件,请注明出处。
请转链接: https://pan.baidu.com/s/1s5_PgrtQVbB66gqFQBPcdQ 密码: e34j