第一课.声纹识别

示波器与语谱图[From wareform(oscillograph) to Spectrogram]

oscillograph 示波器

示波器是一种用途十分广泛的电子测量仪器。它能把肉眼看不见的电信号变换成看得见的图像,便于人们研究各种电现象的变化过程。示波器利用狭窄的、由高速电子组成的电子束,打在涂有荧光物质的屏面上,就可产生细小的光点(这是传统的模拟示波器的工作原理)。在被测信号的作用下,电子束就好像一支笔的笔尖,可以在屏面上描绘出被测信号的瞬时值的变化曲线。利用示波器能观察各种不同信号幅度随时间变化的波形曲线,还可以用它测试各种不同的电量,如电压电流频率相位差调幅度等等。

示波器的简单入门教学视频

spectrogram 语谱图

spectrogram是一个MATLAB函数,使用短时傅里叶变换得到信号的频谱图。当使用时无输出参数,会自动绘制频谱图;有输出参数,则会返回输入信号的短时傅里叶变换

 语谱图涉及到了一个数学概念傅里叶系列。

让·巴普蒂斯·约瑟夫·傅里叶_百度百科

傅里叶变换_百度百科

软件下载地址:

Download | Audacity ®

分析音频,注意在对时频谱图进行可视化的时候,需要将频谱范围限制在0至8000赫兹之间。因为8000赫兹以上的频谱并不包含有价值的语音信息。

SpeakerRecognitionCourseChinese/male_audio.wav at main · wq2012/SpeakerRecognitionCourseChinese · GitHub

SpeakerRecognitionCourseChinese/female_audio.wav at main · wq2012/SpeakerRecognitionCourseChinese · GitHub

GitHub - wq2012/SpeakerRecognitionCourseChinese

频谱比较,不太明显:

增强自相关比较-差异看起来比较明显:

语音识别方法的历史发展

1、人工阅读法

2、模式匹配

3、统计学

4、高斯混合模型(Gaussian Mixture Models) GMM [高斯分布]

5、因子分析时代

6、深度学习[化繁为简-神经网络]

波大体分两类,机械波和电磁波,机械波又分横波与纵波。

机械波:纵波和横波

声强

 专题讲座:语音识别与声纹识别 - 百度文库

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随着人工智能技术的发展,声识别技术也越来越成熟。声识别是指通过分析语音信号的特征来识别说话人身份的技术。与传统的身份验证方式相比,声识别具有非接触、高安全性和易于使用等优点,因此被广泛应用于各个领域。 目前,声识别的研究现状主要包括以下几个方面: 1. 声特征提取技术 声特征提取是声识别的关键步骤之一,目的是从语音信号中提取出与说话人身份有关的特征。常用的声特征包括MFCC、PLP、LPCC等,这些特征可以通过一系列信号处理算法得到,例如傅里叶变换、离散余弦变换等。 2. 声识别算法 声识别算法是基于声特征进行身份认证的关键技术,目前主要包括基于高斯混合模型(GMM)、支持向量机(SVM)、深度神经网络(DNN)等的方法。这些算法在不同的应用场景下表现出不同的优缺点,需要根据实际情况进行选择。 3. 声识别系统的建立 建立一个完整的声识别系统需要考虑多个因素,例如采集设备、特征提取算法、识别算法等。在实际应用中,还需要考虑声音质量、环境噪声等因素对识别效果的影响。 4. 声识别在实际应用中的应用 声识别技术已经被广泛应用于各个领域,例如金融、公安、军事、智能家居等。在金融领域,声识别被用于客户身份验证、防止欺诈等方面;在公安领域,声识别被用于破案、调查等方面;在智能家居领域,声识别被用于语音助手、智能门锁等方面。 总之,声识别技术在实际应用中已经取得了很大的进展,未来随着技术的不断发展,声识别将会在更广泛的领域得到应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值