文本无关的说话人识别综述(一)----简介

本文概述了文本无关的说话人识别,介绍了其基本原理和分类。说话人识别依赖于声道和说话习惯的独特性,分为文本无关和文本相关两类。重点讨论了特征选择的重要性,理想的特征应具有区分度、鲁棒性和稳定性。此外,文章还简要阐述了说话人模型,包括模板模型和随机模型,并提及了生成模型和判别模型的应用。
摘要由CSDN通过智能技术生成

本文是读书笔记。个人比较浅显的理解,其中有一些专业词汇也是个人自己的翻译,如果有不对的希望大家指正。

来自论文《An overview of text-independent speaker recognition: From features to supervectors》的第一章节和第二章节。


一 引言

说话人识别简介:也叫做声纹识别,通过声音识别说话的人是谁。(注意跟语音识别的区别)


说话人识别的可行性:

        1、物理层面(先天因素):每个人的声道形状,咽喉(larynx)尺寸等发声器官都是不一样的。

        2、心理层面(后天因素):每个人的说话习惯是不同的,例如重音、节奏、语气、发音模式、口头禅等。


       说话人识别的分类:文本无关和文本相关。(其中文本无关的说话人识别难度更大)

       文本无关(text-independent):识别与说话的内容无关(即不管说话内容是什么,都可以识别出说话人&

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值