声纹识别概述（1）初识

最新推荐文章于 2025-04-20 11:35:25 发布

Robin_Pi

最新推荐文章于 2025-04-20 11:35:25 发布

阅读量1.2w

点赞数 8

分类专栏： # 声纹 # 项目相关

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Robin_Pi/article/details/108093034

版权

声纹识别

初识声纹

1. 声纹概念

声波频谱
声纹(Voice print)是用电声学仪器现实的携带言语信息的声波频谱，是由波长频率以及强度等百余种特征维度组成的生物特征，具有稳定性、可测量性、唯一性等特点。
易变性
每个人的语音声学特征既有相对稳定性，又有易变性，不是一成不变的。这种变异可来自生理、病理、心理、模拟、伪装，也与环境干扰有关。

2. 声纹识别的分类

（1）Verification 和 Identification
与人脸识别类似，声纹识别有人声验证和人声识别两类应用场景（汉语可能不准确，以英文为准）

人声验证（Speaker Verification）：一对一（1：1），用以确认某段语音是否是指定的某个人所说的
人声识别（Speaker Identification）：多对一（N：1），用于判断某段语音是若干人中的哪一个所说的

（2）Text-Dependent 和Text-Independent
在识别（Identification）应该场景下，还有文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种。

与文本相关的(Text-Dependent)
与文本有关的声纹识别系统要求用户按照规定的内容发音，每个人的声纹模型逐个被精确地建立，而识别时也必须按规定的内容发音，因此可以达到较好的识别效果，但系统需要用户配合，如果用户的发音与规定的内容不符合，则无法正确识别该用户
与文本无关的（Text-Independent）
与文本无关的识别系统则不规定说话人的发音内容，模型建立相对困难，但用户使用方便，可应用范围较宽。

（3）open-set 和 close-set

开集(open-set) 辨认：假定待识别说话人可以在集合外
闭集(close-set) 辨认：假定待识别说话人在集合内

显然，闭集辨认需要有一个对集

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。