1.声纹数据库
与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库、指纹库相结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一。
声纹库建设过程为:基于标准的声纹信息采集流程,对被采集人员的声纹进行采集入库。
声纹库的典型应用模式是:当获得检材后,基于声纹检索技术,从声纹库中获得与检材声纹最相似的前若干候选(列表),这些候选(列表)提交给鉴定专家进行进一步的声纹鉴定以确定目标人或为案件侦查提供重要线索。
2.声纹采集设备的研制及标准的制定
**首先必须确保入库声纹的质量。**因此需要通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,同时需要研制声纹采集的标准设备,并建立可操作的声纹采集标准流程,形成公共安全行业标准,为声纹库建设提供标准支撑,也确保采集入库的各个声纹能够发挥应有的价值。
根据声纹自动识别技术现状及未来趋势分析,声纹采集规范的制定应该特别注重以下几个方面:
- 有效克服信道差异对识别结果的干扰,比如采用多通道同时录音的方式提高声纹采集精度,且多个信道的组合能够有效覆盖目前各种主流信道;
- 充分考虑声纹信息采集内容的完整性;
- 采集过程要有明确的可操作性。
快商通为公安系统量身定制的高保真标准声纹采集设备 - BioVoice 标准声纹采集设备,是公安部认证的首批标准声纹采集设备,配套智能化声纹采集系统,功能集采集、入库存储于一体,采用智能化麦克风集群,一次录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,满足《声纹数据采集终端技术要求》各项指标,为声纹鉴定和比对提供坚实的基础。
3.高性能声纹检索引擎的研发
**高性能声纹检索引擎是声纹库建设及价值发挥的核心。**声纹库建设中,必须基于目前声纹识别领域的最新进展,并且针对基于一个声纹检材片段在百万级声纹库中进行检索以确定目标嫌疑人范围这一特殊任务,组织有实力的技术团队进行针对性攻关。
**明确声纹检索的关键指标,即在有限候选前提下,声纹检索的召回率能够达到多少。**根据未来可能实际应用场景的预测和评估,声纹检索的性能应达到在包含50万个自然人声纹的声纹库中,基于30秒有效语音以上的检材,声纹检索引擎所给出的前100候选中,包含真正目标人的召回率在98%以上。
要达到上述声纹检索性能,必须解决以下技术问题:
- 文本无关的声纹识别;
- 研究细节区分性算法来处理声纹的相似性;
- 提高声纹检索的信道鲁棒性;
- 检索速度及可扩展性问题,针对一个检材在百万级声纹库中的声纹检索任务,耗时需要达到100秒以内。
快商通研发的“猎擎”声纹数据库系统是一款对声纹数据进行储存、管理和应用的数据管理系统。搭配自主研发高性能声纹识别引擎,是行业领先的支持亿级规模库实时检索的声纹识别系统,检索时间小于1S、声纹识别准确率超过99%。可用于辖区声纹数据质量管理、重点人员声纹库建设、身份查询与核验、刑事案件侦破、反电信诈骗、声纹大数据分析等场景,助力公安有效遏制与打击犯罪,降低犯罪率,构建和强化安全的社会公众环境。