自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 收藏
  • 关注

原创 python可视化wav文件的syllable-level对齐结果

需要将wav文件的syllable-level的对齐结果进行可视化,给定wav文件、人工标注的边界信息、对齐模型预测的边界信息,输出上下两幅图进行对比。

2025-02-28 18:17:32 562

原创 python绘制多个wav文件的基频曲线图

需要在一个图中绘制多个wav文件的基频图,具体一点,绘制三种不正常的基频曲线,和一种正常的基频曲线进行对比,并且将正常的基频曲线的范围画出。

2024-09-27 13:05:55 5854

原创 利用F.interpolate()函数进行插值操作

利用插值方法,对输入的张量数组进行上\下操作,换句话说就是科学合理地改变数组的尺寸大小,尽量保持数据完整。(Tensor)float3,4或5时间、空间或体积批量(batch_size)x通道(channel)x[可选深度]x[可选高度]x宽度(int或序列)(float或序列)(str)

2024-09-24 19:08:36 5923

原创 利用Accelerate()进行pytorch的多GPU加速

Accelerate 是为喜欢编写PyTorch模型的训练循环但不愿意编写和维护使用多GPU/TPU/fp16所需的样板代码的PyTorch用户创建的。它可以仅加速与多 GPU/TPU/fp16 相关的样板代码,并保持其余代码不变。

2024-09-24 15:15:36 5600

原创 numpy之随机抽样函数np.random.choice()

是NumPy中的一个随机抽样函数,它可以从给定的一维数组中按照指定概率随机抽取指定数量的元素。

2024-09-20 12:07:01 514

原创 Linux服务器上安装git lfs命令

有时候,需要批量下载数据集时要用到。

2024-09-16 21:02:14 1193

原创 python在类中手动定义标准化输出函数

从而方便实时查看代码运行情况,这时,可以在类中手动定义如下标准化的输出函数,然后在需要输出的地方进行调用即可。,如:1->1.0;1000->1.0K;用于静态显示要输出的内容,并进行左对齐;在深度学习等训练框架中,有时候需要。用于动态显示实时更新的内容。

2024-07-26 17:37:04 440

原创 Linux中利用rsync命令选择性复制文件

是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,并保持链接和权限,且采用优化的同步算法,传输前执行压缩,因此非常适用于异地备份、镜像服务器等应用。rsync不仅可以远程同步数据(类似于scp命令),还可以本地同步数据(类似于cp命令)。不同于cp或scp的一点是,使用scp命令备份数据时,不会直接覆盖以前的数据(如果数据已经存在),而是先判断已经存在的数据和新数据的差异,只有数据不同时才会把不相同的部分覆盖。

2024-07-26 11:27:49 1488

原创 python中利用pickle模块保存格式化数据

pickle模块是python专用的持久化模块,可以持久化保存包括自定义数据在内的各种数据,适合python本身复杂数据的保存。具体来说,pickle模块可以把python对象直接保存到文件里,而不需要先把它们转成字符串再保存。pickle模块会创建一个python语言专用的二进制格式,不需要使用者考虑任何文件细节,它会帮你完成读写对象操作。主要有以下几种用法对文件进行读写操作。

2024-07-22 18:49:54 730

原创 如何设置浏览器网页全屏

以Edge浏览器和Google Chrome浏览器为例,2. 点击缩放处最右边的缩放按钮。1. 点击右上角三个点。

2024-07-19 21:33:15 3528

原创 pytorch中numel()函数用于获取张量中元素数目

其中 numel() 可以理解为是。

2024-07-18 20:08:31 718

原创 python利用joblib进行并行数据处理

可以利用 joblib 中的 Parallel 和 delayed 进行多CPU并行处理。在数据量比较大的情况下,数据预处理有时候会非常耗费时间。

2023-10-05 22:18:06 8922

原创 音频特征范围

pitch:energy:

2023-02-23 16:07:54 10204

原创 python 画图(多个横轴一个纵轴)

【代码】python 画图(多个横轴一个纵轴)

2023-02-23 15:36:06 372

原创 tmux命令常见用法

tmux new -s SESSION-NAME (注意:SESSION-NAME表示会话名称,可为字母或数字,例如: # tmux new -s nmt),不能在tmux会话里再新建会话,会报错。# tmux kill-session -t SESSION-NAME (注意:SESSION-NAME表示会话名称,在会话内部外部执行都可,例如: # tmux kill-session -t nmt)3.可以在单个屏幕的灵活布局下开出很多终端,然后就能协同的使用他们。

2022-10-24 22:04:24 12540

原创 将一句汉字文本转化为对应的拼音

语音合成时,数据预处理,需要将一句汉字文本转化为对应的拼音,其中,汉字文本包含标点符号,而拼音含有声调不含标点符号。输出:she4 zhi4 wen2 jian4 ming2 zen3 me5 yang5。输入:“设置文件名,怎么样?

2022-09-22 15:08:11 2659

原创 利用 sox 命令拼接两个wav文件

其中,sox 被称为声音转换、音频处理中的瑞士军刀,它是一个命令行式的音频处理工具,特别适合去进行快速、简单的编辑和进行批处理,如果你需要一个交互、图形界面的音频编辑器,使用audacity。比如,将 sample1.wav 和 sample2.wav 拼接成 sample12.wav。实际场景中,需要将两个wav文件进行拼接操作。

2022-09-15 11:42:03 2168

原创 解决 conda activate 不能使用的问题

可以先使用 source activate 命令进行激活,就会进入到(base)环境中,然后就可以使用 conda activate 命令了。conda 新建了环境后,使用 conda activate 进行激活会显示如下错误。

2022-09-01 17:31:56 12550

原创 python 按照修改时间进行文件读取

用于获取指定路径的最后修改时间。此方法返回一个浮点值,该值表示自纪元以来的秒数。如果文件不存在或无法访问,则此方法会引发OSError。用于把一个时间戳(按秒计算的浮点数)转化为 time.asctime() 的形式。如果参数未给或者为None的时候,默认使用 time.time() 为参数。...

2022-08-04 17:40:47 1332

原创 制作github上的demo网页注意事项

2. yml文件对冒号非常敏感,如果title中有冒号,则会编译无法通过,可以用引号把整个title引起来;4. html不支持latex公式,如果想输入特殊字符,比如希腊字母,可以通过 “&str;3. 如果出现标题被覆盖的情况,可以尝试在 Code中添加一个 _layouts/default.html。1. 新建GitHub账号,可以专门一个账号每次用来作为盲审的demo展示账号;6. 如果发现 表格是乱码,可以尝试在表格前面加一个空行;6. 添加文件夹,上传需要展示的文件;...

2022-08-03 00:11:02 719

原创 python 中集合set()常用操作

python中的集合和数学上的集合基本是没有区别的,元素无序且不重复,不可以使用索引访问。 方式2:使用 set(),也可以创建空集合 方式3:将列表转换为集合 方式4:使用生成列生成列表 方式2:通过 update() 方法为集合添加多个元素,对应于列表的extend()2.2 删除元素 方式1:通过 discard() 方法删除指定元素(集合中没有也不会报错) 方式2:通过 remove() 方法删除指定元素(集合

2022-07-06 19:01:03 3655

原创 python 对数值各个数位上的单数操作

如果对数值各个数位上的单数进行操作呢?比如,求解任意给定的某个数字的各个数位上的单数的平方和,(如给定数字123,求解 )思路就是通过循环使用 取余(%)和 取整(//)操作从该数字的个位开始往高位不断取值。代码如下:...

2022-07-06 16:56:55 605

原创 python 中内置函数ord()返回字符串的ASCII数值

注意如下几点: ord() 函数是 chr() 函数(对于 8 位的 ASCII 字符串)的配对函数,它以一个字符串(Unicode 字符)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值。 应用实例:ord()函数的一个应用场景就是,利用哈希表解决字母异位词问题。利用ord()函数求解每个字母的ASCII数值,再利用每个字母和字母a之间的差值,将26个小写英文字母映射到下标分别为0-25的数组上,数组中存放的是每个字母的数目。例如:......

2022-07-05 23:04:51 9532

原创 python 批量处理csv文件

现遇到一个问题如下:需要删除每一个csv文件的前12行数据,然后保存。需要对多个目录下的csv文件进行批量处理。

2022-07-05 18:10:30 3801

原创 python 中defaultdict()对字典进行初始化

defaultdict()的作用在于,即使字典中的key不存在,在查找时也会对它的value赋予一个默认值。应用举例: 题目描述: 2. 使用defaultdict(): 参考:https://www.jianshu.com/p/bbd258f99fd3

2022-07-04 22:09:33 1821

原创 python (一维、二维)列表的初始化

初始一个长度为5的列表, 初始一个2*5的列表 方式2: 初始一个2*5的列表: 方式2: 注意: 下述方式是错误的,这相当于将[0]*5这个一维列表复制了2次,每当改变其中一个一维列表中的元素,剩余列表中的元素也会跟着改变。...

2022-06-26 14:09:45 773 1

原创 PPT 录制视频

有时候,需要使用PPT录制视频,比如在线学术会议需要上传录制好的video。具体如何操作呢?选择 幻灯片放映 --> 录制幻灯片演示 --> 从头开始录制这样录制结束后,每一页会多了一个音频,这就是录入的 旁白。选择 文件 --> 导出 --> 创建视频 可以选择视频的质量、是否使用旁白等设置,也可以对对计时和旁白进行预览,这样就可以得到一个对应的MP4文件了。注意:如果感觉一次性录制整个视频容易出错的话,可以在录制一遍后对部分页面进行重新录制;.

2022-04-20 17:04:27 1057

原创 pytorch中 nn.utils.rnn.pack_padded_sequence和nn.utils.rnn.pad_packed_sequence

1. 官方文档:torch.nn — PyTorch 1.11.0 documentation2. 应用背景:在使用pytorch处理数据时,一般是采用batch的形式同时处理多个样本序列,而每个batch中的样本序列是不等长的,导致rnn无法处理。所以,通常的做法是先将每个batch按照最长的序列进行padding处理等长的形式。但padding操作会带来一个问题,那就是对于多数进行padding过的序列,会导致rnn对它的表示多了很多无用的字符,我们希望的是在最后一个有用的字符后就.

2022-04-12 23:27:33 7076 3

原创 pytorch 中注意cuda版本和gpu算力匹配

在安装torch时,一定要注意显卡的cuda版本问题。比如,在 RTX2080上 同样的环境中 程序可以正常运行,而换到A100中,就会报错如下:NVIDIA A100-PCIE-40GB with CUDA capability sm_80 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60

2022-04-11 23:41:47 26616 1

原创 pytorch 中 torch.nn.Parameter()

一、官方教程:网址:torch.nn.parameter — PyTorch 1.11.0 documentation二、代码解读:torch.nn.Parameter(torch.Tensor) 是一个类,继承了torch.Tensor这个类,有两个参数:data(Tensor): 给定一个tensor; requires_grad: 指定是否需要梯度,默认为True;通俗的解释:首先可以把这个函数理解为类型转换函数,将一个不可训练的类型Tensor转换成可以训练的类型pa

2022-04-07 17:18:13 2315

原创 pytorch 中 区分 torch.tensor() 和 torch.Tensor()

torch.tensor()torch.tensor()仅仅是python函数:https://pytorch.org/docs/stable/torch.html#torch.tensor,将数据的数据类型转化为tensor: data:(其中data可以是:list, tuple, NumPy ndarray, scalar和其他类型。) dtype: 可以使用参数dtype来指定张量的数据类型, requires_grad: 使用参数requires_grad来指定张量是否需要计算梯.

2022-04-07 16:41:49 2020

原创 pytorch 中 多头注意力机制 MultiHeadAttention的代码实现及应用

本文将对Scaled Dot-Product Attention,Multi-head attention,Self-attention,Transformer等概念做一个简要介绍和区分。最后对通用的 Multi-head attention 进行代码实现和应用。一、概念:1. Scaled Dot-Product Attention在实际应用中,经常会用到 Attention 机制,其中最常用的是Scaled Dot-Product Attention,它是通过计算query和key之间的点.

2022-04-07 15:12:34 38039 7

原创 pytorch 中 利用自定义函数 get_mask_from_lengths(lengths, max_len)获取每个batch的mask

在pytorch中,经常会需要通过batch进行批量处理数据,由于每个batch中各个样本之间存在差异,经常会需要进行先padding后mask的操作。尤其是在自然语言处理任务中,每个batch中的每个句子是不等长的。一般都是先通过填充0的方式将每个batch中每一句padding成和最长的句子等长的形式;再模型中或者计算loss的时候,再将padding成0的部分mask掉,从而避免padding带来的影响。所以,每个batch在读取数据时,需要保存下该batch中每个句子的长度(以及最长的句子长

2022-04-06 23:47:42 1314

原创 pytorch 中 x.masked_fill(mask, value)用value填充x中对应mask位置处为True的元素

函数讲解:pytorch 中 x.masked_fill(mask, value)用value填充张量x中对应mask位置处为True的元素。其中,mask的形状要和需要填充的张量x的形状一致。示例:import torchimport numpy as npx = torch.randn(5, 6)mask = torch.tensor([[False, False, True, True, True, True], [False,.

2022-04-06 23:01:49 1089 1

原创 推荐一个有效清理电脑桌面广告、流氓软件的方法

很多流氓软件带了各种杂七杂八的广告,隔一会就弹出;或者某些软件卸载了又会自己安装回来,使用电脑管家等软件进行清理也不管用。遇到这种烦人的情况该怎么解决呢?推荐一个好用的软件,亲测有效。SoftCnKiller下载地址:流氓软件清理https://free.lanzoux.com/b0cpu1guf参考:https://blog.csdn.net/hfhbutn/article/details/104799162...

2022-04-05 22:53:52 1592

原创 pytorch 中判断和指定模型和数据在GPU或CPU上

有时候,需要查看模型和数据是在GPU上,还是在CPU上;或者需要将模型和数据放在指定的GPU或者CPU上,那该怎么做呢?1. 判断模型是在GPU上还是CPU上model = nn.LSTM(input_size=10, hidden_size=4, num_layers=1, batch_first=True)print(next(model.parameters()).device) 2.判断数据是在GPU上还是CPU上data = torch.ones([2, 3])print(d

2022-04-03 19:15:27 20805

原创 python中的padding操作代码实现

pad_1D:例如:每个batch中的音素的padding,每个音素先用一个一维int编号表示,每句话的音素序列是不等长的,需要将每个batch中的所有句子的音素序列按照最长的padding成等长的形式。代码及输入输出格式:import numpy as npdef pad_1D(inputs, PAD=0): def pad_data(x, length, PAD): x_padded = np.pad( x, (0, length - x

2022-04-02 23:51:53 3360

原创 pytorch中如何使用预训练好的BERT当作embedding

1. 安装相应的包pip install pytorch_pretrained_bert==0.6.2 -i https://pypi.tuna.tsinghua.edu.cn/simple2. 下载相应的预训练模型 bert-base-chinese。3. 代码示例:import torchfrom pytorch_pretrained_bert import BertTokenizer, BertModeltokenizer = BertTokenizer.from_.

2022-04-02 19:03:50 12175 2

原创 解决overleaf无法登录的问题

有时候,登录overleaf时,会如下如下问题,导致无法登录:该如何解决呢?这一般是网络的问题,可以尝试换个网络后再试一下,比如手机开个热点等。如此,就可以解决上述问题。

2022-03-31 20:03:25 7010

原创 python 中查看某个函数的功能

python中,只需要掌握两个帮助函数,就可以查看所有的遇到的函数的用法和功能,具体如下:dir():列出指定类或模块包含的全部内容(包括函数、方法、类、变量等)。 help():查看某个函数或方法的帮助文档。可以在交互式的解释器中进入python直接输入上述命令,也可以在非交互式的解释器中将该命令的内容进行打印输出。例如:...

2022-03-30 23:47:14 3147

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除