自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 基于Titanic数据集的二元分类

给定Titanic数据集,属于机器学习任务中一个经典数据集。实验首先对数据集进行数据分析和清理,然后分别采用Logistic Regression(逻辑回归)、Support Vector Machines(SVM,支持向量机)、Decision Tree Classifier(决策树分类器)、Random Forest Classifier(随机森林分类器)等机器学习工具,以准确率为性能评测指标,进行生存预测的二元分类算法性能评估与结果分析。通过训练和测试,随机森林分类和SVM在准确率性能上效果较好。

2022-09-01 22:39:49 915 1

原创 基于RNN-LSTM模型的诗词生成/TensorFlow

输入门决定当前输入有多少保留下来,因为在序列输入中,并不是每个时刻的输入信息都同等重要,当输入完全没有用时,输入门关闭,此刻输入信息被丢弃。输出门决定当前memroy的信息有多少被立即输出,输出门打开时,会被全部输出,关闭时,当前memory中的信息不会被输出。已知一首诗的开始标志字为"[",设其初始状态为0,由此开始载入模型,迭代可以求得整首古诗,古诗的结束标志为"]",出现了此输出结果表示古诗生成完毕,退出循环,打印结果。数据预处理的过程,实际上是文本处理的过程,先对诗歌进行拆分,提取诗歌内容。

2022-09-01 22:29:28 2854 1

原创 基于IMDB评论数据集的情感分析/LSTM/Pytorch

输入门决定当前输入有多少保留下来,因为在序列输入中,并不是每个时刻的输入信息都同等重要,当输入完全没有用时,输入门关闭,此刻输入信息被丢弃。输出门决定当前memroy的信息有多少被立即输出,输出门打开时,会被全部输出,关闭时,当前memory中的信息不会被输出。有评级标签的IMDB数据集包含5万篇IMDB影评,负面评论得分=7,其中2.5万篇影评用于训练数据集,2.5万篇影评用于用于测试数据集,训练集和测试集电影不相交。,其中x是输入,A是权值,b是偏置,y是输出。

2022-09-01 22:20:24 6809 6

原创 Cifar-10图像分类/Pytorch/LeNet/AlexNet

又叫下采样层,目的是压缩数据,降低数据维度,和卷积有明显区别,采样2x2的选择框进行压缩,原来是28x28,采样后是14x14,通过选择框的数据求和再取平均值然后在乘上一个权值和加上一个偏置值,组成新的图片,每个特征平面采样的权值和偏置值相同,因此每个特征平面对应的采样层只两个待训练参数,总共有6张采样平面,总共待训练权值为:2x6=12。(6)第6,7,8层是全连接层,每一层的神经元的个数为4096,最终输出softmax为1000,因为上面介绍过,ImageNet这个比赛的分类个数为1000。

2022-09-01 21:57:38 4285 1

原创 双耳空间音效

由于声音会从耳廓、或肩膀反射到人耳内部,当模拟声音定位时,可以利用HD ITD的运算方式,来计算不同方向或位置声音所产生的大小和音调等,进而制造出立体空间声音定位的效果。子目录show_data包含一个MATLAB的同名程序,在这个子目录下运行show_data可以显示和分析每个受试者的HRIRs和HRTFs,另一个名为hor_show_data的MATLAB程序可以方便地检查水平面的数据。2. special_kemar_hrir目录包括两个非标准的KEMAR数据集,用于在水平面和正面测量的HRIRs。.

2022-09-01 14:07:13 1332

原创 时变响度计算

整合了之前响度模型的优势,结合如今计算能力的提升,对响度计算变得更加便捷。Zwicker 模型(ISO 532-1)以1/3倍频程频谱为依据,引入临界频带和特征响度,首先计算每个临界频带特征响度,再得到总响度值。(2)Moore算法则更加细化对应关系,分别给出声源到鼓膜的传函、鼓膜到耳蜗的传函[6],然后根据到达耳蜗的激励,计算特征响度,并考虑掩蔽效应。(1)Zwicker算法给出1/3倍频程带上的声压级,直接按图找出对应特征响度,并进行画线,即从声源到人耳的感受,直接用图给出对应关系;...

2022-09-01 13:42:24 2993 2

原创 Gammatone滤波器组

公式中,a=1,b=1.019*ERB(f),ERB在此处是GT滤波器的等效带宽,n为滤波器的阶数。利用ERB或者Bark尺度,自行确定滤波器组的中心频率和频带个数。评述:在此基础上,只用头10个ERB尺度,规避了ERB尺度上限超出奈奎斯特频率的错误;基底膜的作用相当于很多频率响应交叠的带通滤波器或一个带通滤波器组。临界频带可看成是滤波器组中的一个带通滤波器的带宽。计算ERB尺度下的所有中心频率点,每个频率点处的滤波器的冲激响应是g,再用fir2拟合,循环得到多个滤波器。阶数小,4阶足以描述听觉滤波器;..

2022-09-01 12:03:59 2638

原创 临界频带和听觉滤波器

设计滤波器组时,经常用ERB尺度作为频带划分标准,中心频率取ERB尺度的1到40整数值等间隔。右图是基于多个测量数据拟合的ERB带宽和线性频率的关系曲线,以及与传统Bark临界频带(点线)的对比,频率单位kHz,适用于中心频率100Hz—10kHz之间的情况。之后临界带宽随着频率增加而增大,与0.2f虚线作对比,开始临界带宽增大慢一些,3kHz以后临界带宽增大变得更快。1、线性频率—听觉心理尺度的转换:将频谱展示的线性频率横轴,转换为Bark尺度值、ERB尺度值、倍频程序号、1/3倍频程序号;......

2022-08-31 20:14:32 2414

原创 内毛细胞计算模型

类似半波整流,成为感知计算模型的一部分。2,低通滤波这种低通滤波效应主要归因于内毛细胞膜电容,它为受体电位的高频成分提供了通过细胞膜的低阻抗路径,将它们分流出细胞。体内IHC的频率响应特性很难评估,有的研究将其估计为体内受体电位的交流分量AC与直流分量DC之比(AC/DC比)。在5kHz以上,只有直流水平的整流滤波器输出仍然保留,并且由听觉系统提供的频率分辨率是有限的高频BM滤波器。整流阶段的主频率效应是给基底膜滤波器输出信号增加了大量的谐波失真,这最终必须增加对BM滤波器输出信号进行精确频率分析的难度。.

2022-08-31 19:49:56 382

原创 外耳/中耳传输函数的模拟

参照ANSI S3.4-2007标准中的数据,利用Matlab或者Python,分别实现外耳和中耳的滤波功能(滤波器阶数自定,一般建议不超过3阶)。基于窗函数的FIR设计方法: 1,设计频响 2,IDFT到时域 3,截取时域信号 4,加窗函数,获得实际的冲激响应 5,计算FIR滤波器系数 6,对冲激响应DFT得到实际频响。中耳建模通常有几种方法: 1,基于功能的模拟电路方法 2,基于切片的有限元建模分析 3,基于生理物理测量的数字滤波器。纵坐标为鼓膜水平减去自由场的水平(dB),横坐标以kHz为单位。...

2022-08-31 18:03:04 833 1

原创 系列范畴法语速评价

下载两段新闻语音,Cool Edit软件截取一段2-4s语音信号(44.1kHz采样频率,立体声),语速为320字/min,合成其他4个刺激信号,语速分别为:260、290、350、400(字/min),共10个信号对,时长约1min。被试在安静环境中听完实验信号,根据主观听感为每一句语速舒适度打分:1分-极不舒适,2分-较不舒适,3分-一般舒适,4分-较舒适,5分-极舒适。系统系列法直接就每一个评价对象在给定的一组范畴或尺度上进行评价,带有一定的绝对性,该方法对被试的判断力和心理稳定性的要求较高。...

2022-08-31 17:54:59 312

原创 语速对偶比较评价

该实验结果可能存在一定偏差,一是被试人数不够,测试数据不太可靠;二是多数被试通过远程方式进行实验,不可控因素增加。通过本次实验掌握了对偶比较评价的基本方法,理解更深刻。

2022-08-31 17:47:52 761

原创 语速差别阈限测量

该实验不能准确得出语速差别阈限值,一是被试人数不够,测试数据不太可靠;二是多数被试通过远程方式进行实验,不可控因素增加。通过本次实验掌握了差别阈限测量的基本方法,理解更深刻。...

2022-08-31 17:40:25 2861 1

原创 语速舒适度绝对阈限测量

通过本次实验掌握了绝对阈限测量的基本方法,理解更深刻。

2022-08-31 11:39:19 1121 1

原创 语音的参数分析——线性预测分析

LPC系数要分别有5阶,15阶和50阶三种情况,在同一个坐标图里用不同颜色分别给出对应的LPC包络谱和FFT频谱,并试着对比分析。传输函数的分母可以视为预测系数向量的STFT变换的相反值,考虑到matlab的lpc得到的就是负值系数,且a[1]=1,于是就有: H=1./fft(A,N);对所选取的信号帧进行fft变换,对得到的频谱取其单边谱,由于单边谱只包含1/2的能量,所以还要再乘以2,然后取模求10log10,得到fft的对数幅度谱。包络谱的求法源于最右边的传输函数和STFT的公式。...

2022-08-27 17:48:20 959

原创 频域分析基础和语谱图

(Bar):代表元音的共振峰位置,表现为图中与水平时间轴平行的较宽的黑杠,不同元音的共振峰位置不同,根据宽带语谱图上各横杠的位置可以区分不同的元音,不同人发音的第一共振峰位置会不同,但其分布结构是相似的。(spike):代表塞音(b,d,g,p,t,k)或塞擦音(z,zh,j,c,ch,q)的除阻段,表现为图中与垂直频率轴平行的较宽的黑条,在时间上持续时间很短,在频率轴上集中区位置随不同的辅音而不同。(2)从图4.6的宽带语图看,zhe有明显的冲直条和乱纹,以及较宽的共振峰横杠;其中,STFT是最常用的。.

2022-08-27 17:32:16 3527

原创 语音的时频分析(二)

基本原理:采用一个滑动窗,中心在Xn处,左右各取L个点,共2L+1个样本,将其按大小顺序排列,取其中间值作为平滑器的输出y。由图可知,与短时自相关函数和短时平均幅度差函数相比,采用改进的自相关函数和平均幅度差函数后,在周期倍数上仍然有峰值,且幅值没有明显下降,窗长的变小,不会影响到基音周期附近最大值的出现。为克服短时自相关函数计算量大的问题,还可采用三电平削波法,削波后序列仅有1,0,-1三种取值,求自相关就无需乘法运算。在周期的整数倍上,自相关函数可以达到最大值,其中R(0)最大。.........

2022-08-27 16:58:45 1517

原创 语音的时频分析(一)

用matlab提取该段语音的短时能量、短时平均幅度和短时平均过零率,利用matlab的画图函数plot,画出这三个参数的时域曲线图,以上三幅图连同波形的时域曲线图放在一起。对于纯正弦信号,平均过零率就是信号频率除以两倍的采样频率,而采样频率是固定的,所以短时过零率可以在一定程度上视为对信号频率的简单度量。如图,黑色为“我到北京去”的语音信号时域波形,绿色为短时平均能量曲线,蓝色为短时平均幅度曲线,红色为短时平均过零率曲线。从短时平均过零率曲线,清音成分高的地方过零率高,浊音成分高的地方过零率低。......

2022-08-27 13:11:58 1823

原创 声调T值法实验报告

所得到的T值就是x点的五度值参考标度。其中的0

2022-08-27 11:58:34 2874 4

原创 元音三角形实验报告

利用praat得到录制的单韵母:a,o,e,i,u,ü的F1、F2数据,每个音发三遍,处理三次发音数据并在舌位图上用不同颜色画出轨迹,可用matlab或excel。然后对这些数据进行分析。

2022-08-26 12:08:30 1378

原创 ORB_SLAM与Gmapping对比

自主导航与SLAM(Simultaneous localization and Mapping)是实现无人驾驶的关键技术。当车辆处在未知场景中时,需要依据传感器获取的信息完成自身定位和环境建图,然后在建好的地图上进行路径实时规划和车辆自主控制。本文分析了视觉SLAM技术、无人驾驶技术以及基于ROS机器人的视觉SLAM和自主导航研究。实验针对ROS机器人平台,通过执行SLAM功能包对机器人进行了实时定位和环境建图,同时结合自主导航、自动跟随等功能包,最终实现了机器人实时位置估计、室内环境建图以及自主导航等实

2021-04-15 15:50:29 1006

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除