m0_46483236-CSDN博客

是一个开源的快速备份工具，可以在不同主机之间镜像同步整个目录树，支持增量备份，并保持链接和权限，且采用优化的同步算法，传输前执行压缩，因此非常适用于异地备份、镜像服务器等应用。rsync不仅可以远程同步数据（类似于scp命令），还可以本地同步数据（类似于cp命令）。不同于cp或scp的一点是，使用scp命令备份数据时，不会直接覆盖以前的数据（如果数据已经存在），而是先判断已经存在的数据和新数据的差异，只有数据不同时才会把不相同的部分覆盖。

2024-07-26 11:27:49 1882

原创 python中利用pickle模块保存格式化数据

pickle模块是python专用的持久化模块，可以持久化保存包括自定义数据在内的各种数据，适合python本身复杂数据的保存。具体来说，pickle模块可以把python对象直接保存到文件里，而不需要先把它们转成字符串再保存。pickle模块会创建一个python语言专用的二进制格式，不需要使用者考虑任何文件细节，它会帮你完成读写对象操作。主要有以下几种用法对文件进行读写操作。

2024-07-22 18:49:54 985

原创如何设置浏览器网页全屏

以Edge浏览器和Google Chrome浏览器为例，2. 点击缩放处最右边的缩放按钮。1. 点击右上角三个点。

2024-07-19 21:33:15 8514

原创 pytorch中numel()函数用于获取张量中元素数目

其中 numel() 可以理解为是。

2024-07-18 20:08:31 1074

原创 python利用joblib进行并行数据处理

可以利用 joblib 中的 Parallel 和 delayed 进行多CPU并行处理。在数据量比较大的情况下，数据预处理有时候会非常耗费时间。

2023-10-05 22:18:06 9094

原创音频特征范围

pitch：energy：

2023-02-23 16:07:54 10276

原创 python 画图（多个横轴一个纵轴）

【代码】python 画图（多个横轴一个纵轴）

2023-02-23 15:36:06 649

原创 tmux命令常见用法

tmux new -s SESSION-NAME （注意：SESSION-NAME表示会话名称，可为字母或数字，例如： # tmux new -s nmt)，不能在tmux会话里再新建会话，会报错。# tmux kill-session -t SESSION-NAME (注意：SESSION-NAME表示会话名称,在会话内部外部执行都可，例如： # tmux kill-session -t nmt)3.可以在单个屏幕的灵活布局下开出很多终端，然后就能协同的使用他们。

2022-10-24 22:04:24 12936

原创将一句汉字文本转化为对应的拼音

语音合成时，数据预处理，需要将一句汉字文本转化为对应的拼音，其中，汉字文本包含标点符号，而拼音含有声调不含标点符号。输出：she4 zhi4 wen2 jian4 ming2 zen3 me5 yang5。输入：“设置文件名，怎么样？

2022-09-22 15:08:11 2846

原创利用 sox 命令拼接两个wav文件

其中，sox 被称为声音转换、音频处理中的瑞士军刀，它是一个命令行式的音频处理工具，特别适合去进行快速、简单的编辑和进行批处理，如果你需要一个交互、图形界面的音频编辑器，使用audacity。比如，将 sample1.wav 和 sample2.wav 拼接成 sample12.wav。实际场景中，需要将两个wav文件进行拼接操作。

2022-09-15 11:42:03 2492

原创解决 conda activate 不能使用的问题

可以先使用 source activate 命令进行激活，就会进入到（base）环境中，然后就可以使用 conda activate 命令了。conda 新建了环境后，使用 conda activate 进行激活会显示如下错误。

2022-09-01 17:31:56 13280

原创 python 按照修改时间进行文件读取

用于获取指定路径的最后修改时间。此方法返回一个浮点值，该值表示自纪元以来的秒数。如果文件不存在或无法访问，则此方法会引发OSError。用于把一个时间戳（按秒计算的浮点数）转化为 time.asctime() 的形式。如果参数未给或者为None的时候，默认使用 time.time() 为参数。...

2022-08-04 17:40:47 1754

原创制作github上的demo网页注意事项

2. yml文件对冒号非常敏感，如果title中有冒号，则会编译无法通过，可以用引号把整个title引起来；4. html不支持latex公式，如果想输入特殊字符，比如希腊字母，可以通过 “&str；3. 如果出现标题被覆盖的情况，可以尝试在 Code中添加一个 _layouts/default.html。1. 新建GitHub账号，可以专门一个账号每次用来作为盲审的demo展示账号；6. 如果发现表格是乱码，可以尝试在表格前面加一个空行；6. 添加文件夹，上传需要展示的文件；...

2022-08-03 00:11:02 996

原创 python 中集合set()常用操作

python中的集合和数学上的集合基本是没有区别的，元素无序且不重复，不可以使用索引访问。方式2：使用 set()，也可以创建空集合方式3：将列表转换为集合方式4：使用生成列生成列表方式2：通过 update() 方法为集合添加多个元素，对应于列表的extend()2.2 删除元素方式1：通过 discard() 方法删除指定元素（集合中没有也不会报错）方式2：通过 remove() 方法删除指定元素（集合

2022-07-06 19:01:03 4545

原创 python 对数值各个数位上的单数操作

如果对数值各个数位上的单数进行操作呢？比如，求解任意给定的某个数字的各个数位上的单数的平方和，（如给定数字123，求解）思路就是通过循环使用取余（%）和取整（//）操作从该数字的个位开始往高位不断取值。代码如下：...

2022-07-06 16:56:55 661

原创 python 中内置函数ord()返回字符串的ASCII数值

注意如下几点： ord() 函数是 chr() 函数（对于 8 位的 ASCII 字符串）的配对函数，它以一个字符串（Unicode 字符）作为参数，返回对应的 ASCII 数值，或者 Unicode 数值。应用实例：ord()函数的一个应用场景就是，利用哈希表解决字母异位词问题。利用ord()函数求解每个字母的ASCII数值，再利用每个字母和字母a之间的差值，将26个小写英文字母映射到下标分别为0-25的数组上，数组中存放的是每个字母的数目。例如：......

2022-07-05 23:04:51 10578

原创 python 批量处理csv文件

现遇到一个问题如下：需要删除每一个csv文件的前12行数据，然后保存。需要对多个目录下的csv文件进行批量处理。

2022-07-05 18:10:30 4055

原创 python 中defaultdict()对字典进行初始化

defaultdict()的作用在于，即使字典中的key不存在，在查找时也会对它的value赋予一个默认值。应用举例：题目描述： 2. 使用defaultdict()：参考：https://www.jianshu.com/p/bbd258f99fd3

2022-07-04 22:09:33 2119

原创 python （一维、二维）列表的初始化

初始一个长度为5的列表, 初始一个2*5的列表方式2：初始一个2*5的列表：方式2：注意：下述方式是错误的，这相当于将[0]*5这个一维列表复制了2次，每当改变其中一个一维列表中的元素，剩余列表中的元素也会跟着改变。...

2022-06-26 14:09:45 861 1

原创 PPT 录制视频

有时候，需要使用PPT录制视频，比如在线学术会议需要上传录制好的video。具体如何操作呢？选择幻灯片放映 --> 录制幻灯片演示 --> 从头开始录制这样录制结束后，每一页会多了一个音频，这就是录入的旁白。选择文件 --> 导出 --> 创建视频可以选择视频的质量、是否使用旁白等设置，也可以对对计时和旁白进行预览，这样就可以得到一个对应的MP4文件了。注意：如果感觉一次性录制整个视频容易出错的话，可以在录制一遍后对部分页面进行重新录制；.

2022-04-20 17:04:27 1387

原创 pytorch中 nn.utils.rnn.pack_padded_sequence和nn.utils.rnn.pad_packed_sequence

1. 官方文档：torch.nn — PyTorch 1.11.0 documentation2. 应用背景：在使用pytorch处理数据时，一般是采用batch的形式同时处理多个样本序列，而每个batch中的样本序列是不等长的，导致rnn无法处理。所以，通常的做法是先将每个batch按照最长的序列进行padding处理等长的形式。但padding操作会带来一个问题，那就是对于多数进行padding过的序列，会导致rnn对它的表示多了很多无用的字符，我们希望的是在最后一个有用的字符后就.

2022-04-12 23:27:33 7383 3

原创 pytorch 中注意cuda版本和gpu算力匹配

在安装torch时，一定要注意显卡的cuda版本问题。比如，在 RTX2080上同样的环境中程序可以正常运行，而换到A100中，就会报错如下：NVIDIA A100-PCIE-40GB with CUDA capability sm_80 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60

2022-04-11 23:41:47 28261 1

原创 pytorch 中 torch.nn.Parameter()

一、官方教程：网址：torch.nn.parameter — PyTorch 1.11.0 documentation二、代码解读：torch.nn.Parameter(torch.Tensor) 是一个类，继承了torch.Tensor这个类，有两个参数：data(Tensor): 给定一个tensor； requires_grad: 指定是否需要梯度，默认为True；通俗的解释：首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型pa

2022-04-07 17:18:13 2515

原创 pytorch 中区分 torch.tensor() 和 torch.Tensor()

torch.tensor()torch.tensor()仅仅是python函数：https://pytorch.org/docs/stable/torch.html#torch.tensor，将数据的数据类型转化为tensor: data:（其中data可以是：list, tuple, NumPy ndarray, scalar和其他类型。） dtype: 可以使用参数dtype来指定张量的数据类型， requires_grad: 使用参数requires_grad来指定张量是否需要计算梯.

2022-04-07 16:41:49 2106

原创 pytorch 中多头注意力机制 MultiHeadAttention的代码实现及应用

本文将对Scaled Dot-Product Attention，Multi-head attention，Self-attention，Transformer等概念做一个简要介绍和区分。最后对通用的 Multi-head attention 进行代码实现和应用。一、概念：1. Scaled Dot-Product Attention在实际应用中，经常会用到 Attention 机制，其中最常用的是Scaled Dot-Product Attention，它是通过计算query和key之间的点.

2022-04-07 15:12:34 38654 7

原创 pytorch 中利用自定义函数 get_mask_from_lengths(lengths, max_len)获取每个batch的mask

在pytorch中，经常会需要通过batch进行批量处理数据，由于每个batch中各个样本之间存在差异，经常会需要进行先padding后mask的操作。尤其是在自然语言处理任务中，每个batch中的每个句子是不等长的。一般都是先通过填充0的方式将每个batch中每一句padding成和最长的句子等长的形式；再模型中或者计算loss的时候，再将padding成0的部分mask掉，从而避免padding带来的影响。所以，每个batch在读取数据时，需要保存下该batch中每个句子的长度（以及最长的句子长

2022-04-06 23:47:42 1455

空空如也

空空如也