- 博客(20)
- 收藏
- 关注
原创 Self-supervised speaker recognition with LGL代码分析
随后,将这个“set”集合转为列表,而后使用“sort()”函数来对列表中的元素进行字母顺序排序,这一步目的是按字母顺序对所有音频文件进行排序以便进一步处理。最后,将这些嵌入向量存储在字典“feats”中,以便后续的计算。总之,这段代码的目的是在神经网络中计算嵌入向量的距离,并通过调整模型参数来使它们更好地符合预期的距离(在此处由AAT_labels表示)。这是跟训练有关的代码。使用上面获取的排好序的音频文件列表“setfiles”,循环遍历每个文件夹,读取当前文件夹中的音频文件,以便进行端到端语音识别。
2023-04-23 21:24:32 210
原创 ECAPA-TDNN代码阅读
接下来,将三个卷积层的输出(即`x1`,`x2`和`x3`)级联在一起,然后传入`self.attention`模块中。self.attention模块则是用于空间维度(feature map)的特征融合,在网络中添加一个全局注意力机制,用于捕获全局特征,将全局特征与局部特征相结合,以获得更多的信息。每个残差块的输出将与输入进行加和,进而得到卷积层的输入。而self.attention主要用于对空间维度的特征进行加权,以捕获全局特征和局部特征的有用信息,以提高网络对复杂场景的感知和识别能力。
2023-04-17 21:39:43 805
原创 卷积神经网络中卷积层、池化层、全连接层的作用以及神经网络宽度设计
卷积神经网络中卷积层、池化层、全连接层的作用卷积神经网络——输入层、卷积层、激活函数、池化层、全连接层神经网络的深度、宽度和分辨率一文读懂神经网络宽度设计卷积神经网络每一层输出的形状、通道数、特征图数量以及过滤器数量的理解与计算。
2023-03-25 20:32:48 121
原创 说话人识别-数据处理-生成trials.lst的方法
trials.lst的内容就是每一个注册集要和测试集进行比配,并打上标签(同一个说话人,就是target,反之则为nontarget。我在使用asv-subtools运行cnsrc-sv-scoreSets_sv.sh的时候,报告以下的错误。shell和python结合起来的小脚本就可以生成对应的trials.lst。没有找到生成文件的代码。所以自己学着生成了以下trials.lst。注意:写python的时候,要注意输出列表格式,否则就会没有数据。这里报错说我缺少了trials.lst文件。
2023-02-28 10:09:56 176
原创 2023/2/27 Linux复习(字符串判断与关系运算符,符号含义,if结构)
linux shell中字符串相等的几种方法linux命令&和&&,|和||,$0、$?、$*、$@、$#、$$Linux——Shell编程里if的参数从-a到-z
2023-02-27 11:10:05 59
原创 1. 查看服务器运行程序2.后台运行,且有工作日志3.查看服务器配置
top -u jyt522 -cLinux nohup命令详解,终端关闭程序依然可以在执行!Linux nohup 命令nvidia-smi
2023-02-20 20:01:37 203
原创 kaldi数据准备,Subtools数据准备,详细分享Asv-Subtools数据准备,小白必看!
有没有刚开始接触kaldi的小伙伴们,也像我一样,感觉理论很多,但是上手就崩。俗话说:“万事开头难”,数据准备就是kaldi实验的开始。因为我上手直接学习,我绕过kaldi,直接学习使用asv-subtools。但是subtools里面没有关于数据准备的代码。网上关于asv-subtools的内容也少之又少。然而kaidl和subtools的数据准备一样。所以我就把目光投向了kaldi的数据处理。我想通过kaldi学习有关数据的处理。kaldi数据准备,asv-subtools数据准备,小白必看!~
2022-12-25 12:59:21 893
原创 python如何将一个文件从另一个文件中删除,实现文件的过滤
kaldi数据处理时,使用python实现文件的过滤。实现从一个文件中删除另一个文件。
2022-12-24 12:57:48 401 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人