自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Matlab调用Python

data里才是我在py脚本中运行的结果。matlab中用pyrunfile。文件中还有什么方法可以在。程序中利用这个数组结果?的程序(本应该得到一个。脚本结果中的数组数据。

2024-04-22 10:39:18 139

原创 python基础语法之list\tuple\str\set\dict

可插入(assert)可追加(append)可删除(pop/del/remove)可计数(count/len)可清空(clear);不可修改,可查找,可替换分割规整化(本身没变,得到了新的字符串),可计数,统计长度,key和value可以是任意类型,key不可以是字典,不可重复,不可使用下标索引。:(元素,元素,元素),只有一个元素也要加括号;元组、字符串不可修改、可重复,有序;:[元素1,元素2,元素3,……列表可修改,可重复,有序;集合可修改,不重复,无序;{元素1,元素2,……:一次存储多个数据,

2023-12-17 11:09:57 354 1

原创 python_speech_feature的fbank

【代码】python_speech_feature的fbank。

2023-12-14 21:05:12 371 1

原创 语音信号的线性预测分析--语音信号处理(赵力)笔记

线性预测linear prediction——由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即。根据系统函数H(z)的不同形式,语音模型也有不同形式:当系统函数同时有零极点时为自回归-滑动平均模型(ARMA);系统函数只有零点时为滑动平均模型(全零点模型)(MA),此时。准周期脉冲(浊音)或白噪声(清音)激励一个线性时不变系统(声道)所产生的输出作为语音的模型。使其最小,对ai求偏导令其为零,即求解一个线性预测分析方程组。-----过去p个点值预测现在或未来。

2023-12-14 20:17:44 471 1

原创 语音信号倒谱分析--语音信号处理--赵力笔记2

之前写到同态分析,大概是先将时域上的卷积信号x(n)*y(n)做傅里叶变换映射到频域得到乘积信号,乘积信号取对数得到加性信号:lnX(k)+lnY(k),取傅里叶逆变换得到xhat(n)=关于倒谱和复倒频谱的关系:复倒频谱要进行复对数运算,倒谱只进行实对数运算,[lnX(k)+lnY(k)],即b图中的前半段。也属于时域信号,但其与x(n)明显属于不同的离散时域,故将之称为。x(n)对数幅度谱的傅里叶逆变换为倒谱。,可以由一个实序列的复倒谱求倒谱。

2023-12-12 20:25:17 434

原创 语音信号处理-赵力-笔记之语音信号分析:

②预处理:已数字化的语音信号序列将一次存入一个数据区,在语音信号处理中一般用循环队列的方式存储这些数据。,量化噪声(量化误差)符合具有以下特征的统计模型:平稳白噪声、与输入信号不相关、在量化间隔内均匀分布。特征系统注解:将输入的时域卷积进行傅里叶变换得到频域的乘积信号,取对数得到相加信号,傅里叶反变换输出。,因此在预处理时预加重,提高高频部分,使得整个语音信号频谱变得平坦。① 短时能量:所有语音帧信号的平方和为短时能量,但其对高电平敏感,故有时取短时幅度函数和作为能量。预滤波、采样后,要进行量化编码。

2023-12-12 16:09:13 529

原创 声学与听觉语音学--KJ--第二部分

声带周而复始地在声门下气压的作用下彼此分离,又在声带肌的弹性张力作用下迅速闭合,产复合周期波。由于声道具有共鸣频率,因此中央元音的声学特性可以用一组带通滤波器来模拟。声带是一个声滤波器,可以修饰由声带发出的声音--声源滤波理论。语音产生的声学理论--中央元音的产生。声道的共鸣频率(共振峰)不唯一。有近似声道共鸣频率的谐波会被增强。不在共鸣频率附近的分音受到抑制。

2023-12-10 11:02:12 402 1

原创 声学与听觉语音学--KJ--第一部分.1

400Hz,amp=0.25的四中正弦波复合可组成一个类似矩形波的波形(ps:amp幅度)声波的一个特性是任何复杂的声学波都可以以生成它的正弦波成分为单位进行分析,即任何复杂的波形都可以分解为一组有特定频率、振幅、相位关系的正弦波--Fourier定理。语音的意识--声介质的压强波动达到鼓膜时,听觉系统将鼓膜的运动转换为神经脉冲,我们将这些神经脉冲体验为声音;声音的传播--声音通过声介质传送声波(声波通过足够有弹性的介质传播,足够大的弹性使介质中的分子聚集又分离)--模拟声道和听觉系统的滤波特性。

2023-12-07 22:06:31 415 1

原创 语音信号处理--韩纪庆--笔记6-2

且在t+k时刻所处状态为q_t+k的概率仅与它在t时刻的状态qt有关,与t时刻以前它所处的状态无关(其中q都属于状态123中)则称Xt为马尔可夫链。k步转移概率(记为Pxy(k),在t时刻状态为x的条件下,t+k时刻状态为y的概率)与时间无关时,称为齐次马尔可夫链。并从中选球,有放回,每次记录球的颜色,每次观测值不仅与每个缸中彩球的颜色分布有关,还和每次选择哪个缸的转移概率矩阵有关--缸的隐含序列,球的显性观测序列。A状态转移概率矩阵--描述当前缸的条件下选取下一个缸的概率。

2023-12-06 21:16:24 350 1

原创 语音信号处理--韩纪庆--笔记6-1

按词汇量大小可分为大中小词汇量识别、按发音方式可分为孤立词、连接词、连续语音及关键词 识别,按说话人可分为特定说话人和非特定说话人识别、按识别方法可分为模型匹配法、随机模型法、概率语法分析法:(括号内打个比方~)提供语音信号的特征作为参考(标准答案),用一个可以衡量未知模式和参考模板之间似然度的函数(根据什么批卷,比如字迹、卷面、答题准确度),选择最佳准则做出最后的识别决策(最后的考试分数)。非特定人识别的模板训练算法--聚类法--语音识别模板的聚类针对的是有时序关系的谱特征序列而不是固定的维数。

2023-12-06 20:28:07 387 1

原创 语音信号处理--韩纪庆--笔记2-4

基音周期的提取对汉语语音信号的处理尤为重要--汉语是一种有调语言,基音变化的模式称为声调。①自相关法--浊音信号自相关函数在基音周期的整数倍上出现峰值,清音信号自相关函数没有明显峰值。,高幅值部分包含较多的基音信息,因此可以抑制低幅值部分--削减与声道响应有关的波动--③倒谱法--对语音信号利用倒谱解卷原理可以得出激励序列的倒谱,它有与基音周期相同的周期。无论哪种方法得到的基音周期轨迹不可能与真实情况完全一致--大部分一致,局部段落或区域中会有一个或几个偏离了正常轨迹--野点--去除野点采用各种平滑算法。

2023-11-28 19:28:27 366

原创 语音信号处理--韩纪庆--笔记2-3

解决方法:微分法(不理想,会引起混叠)、最小相位信号法(较好,要求被处理的信号是最小相位信号)、递归法。解卷就是将各卷积分量分开,解卷算法可以分为两大类:参数解卷即线性分析预测、非参数解卷即同态解卷积--对语音信号进行同态分析后得到语音信号的倒谱参数。一个周期冲击的有限长度的序列,倒谱也是一个周期冲激的有限长序列,只是周期不变,有限长变无限长;输入的卷积进行Z变换,将卷积变为乘积,然后对数运算,将乘积变为加法,再对所得的加法逆Z变回时域的加法,即得到了语音信号的倒谱。最小相位信号序列的倒谱是一个因果序列;

2023-11-27 19:45:19 443

原创 语音信号处理--韩纪庆--笔记2-2

-短时瞬态信号、非平稳信号、含宽带噪声信号采用滤波器滤除噪声效果不好,利用小波变换去噪--根据信号与噪声在不同频带上的小波变换具有不同特点,将噪声小波谱占主导地位的频带上的噪声小波谱分量去掉,留下原信号,进行信号重构。信号的多分辩分析--信号的能量在不同频带有不同的分布,因此处理方法也不同(比如能量高的量化可以细致一些,能量低的可以减少一些比特数)。--人耳的频率分辨率是非线性的,可以使用小波变换对信号进行处理:将频带二分,保留高频部分,低频部分继续二分(这是单纯的小波变换处理);非均匀滴划分时频空间。

2023-11-24 21:10:29 369

原创 语音信号处理--韩纪庆--笔记2-1:语音信号的特征分析

传统的傅立叶变换只适用于分析信号组成份量的频率不随时间变化的平稳信号,分析结果也只能解释一个信号是有多少正弦波叠加而成的,以及各个正弦波的相对幅度,却没有这些信号何时产生何时消亡的信息。①线性时频表示--时域的线性、频域的线性--时频联合信号也是线性--e.g.短时傅立叶变换STFT、Gabor变换、小波变换。STFT和Gabor是一种加窗的傅立叶变换,使用固定大小的时频网格,这种网格在时频平面上的变化只限于平移--仅适用于带宽不变的平稳信号;②二次时频表示--由能量谱或功率谱演化而来--双线性变换。

2023-11-23 19:59:01 434

原创 语音信号处理--韩纪庆--笔记1:声学基础及产生模型

当把声道看成一个发音的腔体时,激励的频率达到固有频率时,声道会以最大的振幅振荡,即产生共鸣,这个频率叫共振频率。1.语音信号产生:说话人产生想要语言表达的信息,转换成语言编码(将信息用所包含的音素序列、韵律、响度、基音周期的升降表达出来),神经肌肉命令声带振动,并塑造声道形状。音高--对应频率变化,基频随声调的变化而变化;①时域波形:语音信号--电信号--A/D采样存入计算机;激励模型(语音和噪声)--声道模型--辐射模型(口和唇)调频-调幅模型(AM-FM)--能量算子--能量分离算法。

2023-11-22 20:50:52 491

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除