努力喽-CSDN博客

原创 docker的使用记录

1、镜像的加载。区分docker load和docker import的区别，另外容器是在镜像的基础上建立的，一个镜像可以建立很多容器。2、权限问题。dial unix /var/run/docker.sock: connect: permission denied。找了很多种方法，加入用户组的方法效果不大，最后直接用这个方法中的第三条改权限了，问题解决。比较奇怪，在服务器上就是加用户组解决的，但是在自己的电脑上就不行，只能chmod改权限有用。3、GPU调用问题。用docker run -it --g

2022-03-30 20:07:09 304

原创 2021-11-02

struct.error: ‘i’ format requires -2147483648 <= number <= 2147483647参照github作者的改动，将相应文件改动就可以链接

2021-11-02 17:31:25 187

原创 pytorch的spectral_norm的使用

利用pytorch自带的频谱归一化函数，给设定好的网络进行频谱归一化。主要用于生成对抗网络的鉴别器，效果还是很明显的。import torchimport torch.nn as nn class TestModule(nn.Module): def __init__(self): super(TestModule,self).__init__() self.layer1 = nn.Conv2d(16,32,3,1) self.layer2 =

2021-04-11 11:22:27 10676

转载保证网络可复现性时的seed设置

pytorch和tensorflow设置随机数

2020-12-14 10:01:57 440

原创 pytorch-lightning注意事项

1、如果在代码中写了self.log(your_metric_dict, on_steps=True, on_epoch=True)那么monitor要写成monitor='val_loss_epoch'要不然会根据最后一步的验证尺度保存模型，不会根据整个周期的验证尺度保存模型，切记！！！！！！！！！！！！！！2、这种形式可以加载多个信息values = {'val_loss': loss, 'val_cer': cer_avg}self.log_dict(values, logger=T

2020-12-12 10:38:03 2105

原创 CTC在语音识别上的应用，loss为nan的处理

ctc在pytorch1.2以上的版本中有集成好的是实现。torch.nn.functional.ctc_loss原理不再介绍，有很多开源的实现。主要说一下自己遇到的问题。在语音上应用时，会遇到loss为nan的情况，如果代码在交叉熵损失或者其他损失的情况下可以正常跑，说明数据没问题。主要原因出在对齐上。在一个batch中一条发音可能比较短，对应的目标文本也比较短，ctc就无法对齐，就会出现loss为Inf,后面就体现为nan。网上找了很多解决方法，都是针对数据的，但是其实torch.nn.fu

2020-12-02 14:59:40 1646 3

原创 mathtype打出花体小写字母

样式其他 Euclid

2020-11-09 14:58:35 5558 3

原创 argparse模块的使用

血的教训，因为这个小错误，调了将近三个小时！！！！！！！！！！！！！！！！！！！！！！！！！！！！！！！在不同的文件中调用argparse模块时一定要一致。我的情况，我的argparse模块保存在constant.py中。写了两个模型，asr是已经有的，把asr复制了一份，要改成mt，结果在模型中有两个文件调用路径还是原来的asr的constant的，就会出错，未识别的参数。个人情况不同，写的比较乱，仅供个人记录使用。...

2020-11-03 01:02:01 88

原创 Pytorch的ctc解码实现

在github上看到一个很好的ctc解码实现，暂时还没用。附上链接：pytorch的ctc解码实现作者在readme里对代码的参数的介绍的很清楚，就不搬运翻译了，可以直接看。在pytorch上CTC的安装:pytorch上CTC安装...

2020-11-02 10:49:16 2195

原创服务器使用

vnc连接服务器时黑屏，是因为anaconda冲突了。解决办法不过这个注释的有点问题，可以用下面的方法注释shell多行注释之前注释错了，实验室的博士师兄指出来了，要不然整不明白。

2020-10-31 11:12:03 134

原创数据处理

kaldi处理数据时出现这个问题text file ‘***’ contains disallowed UTF-8 whitespace character(s)原因有两个一个是多了/r，一个是多了/xa0.把出错的那一行打印出来，然后用下面的代码查看字符temp = open('error.txt', 'r')r.readline()就可以看到除了\n以外，多出的字符，删掉即可。在服务器上处理数据出错，这里记录一下。用sed去除重复空格和制表符，只保留一个，网上很多方法是错的，根本没办法

2020-10-30 09:15:34 194

原创 pytorch中多GPU的batch_size问题

KeyError: Caught KeyError in replica 0 device, 或者ValueError: Caught ValueError in replica 0 on device 0.都是因为batch_size没有设好。在端到端的语音中，一个语句就是一个输入，total即总的输入就是text中的行数，用wc -l text，就可以看到了。多个gpu训练时，每个gpu上的负载时batch_size / n_gpu训练迭代的次数为total / batch_size但是肯定会有

2020-10-17 21:40:40 13418 3

原创 StopIteration: Caught StopIteration in replica 0 on device 0

在对调用pytorch_pretrained_bert时，如果用多个GPU出现StopIteration: Caught StopIteration in replica 0 on device 0.具体如下。File "/home/yuangen_yu/CLUE/baselines/models_pytorch/classifier_pytorch/run_classifier.py", line 569, inmain()File "/home/yuangen_yu/CLUE/baselines/

2020-10-17 01:06:26 4924 8

转载 pytorch的BERT下载

pytorch的BERT下载复制里面的链接，直接用迅雷下载，比较快

2020-10-14 16:01:52 1006

转载谷歌浏览器安装插件

谷歌浏览器安装插件

2020-10-14 11:37:26 167

转载 Linux安装驱动

Linux安装驱动的简单方法

2020-10-14 11:35:39 784

转载 Pytorch的RuntimeError: one of the variables needed for gradient computation has been modified by an

Pytorch的RuntimeError: one of the variables needed for gradient computation has been modified by an这个链接解释的很清楚，出错是因为求导的过程中用到的值被修改了，所以报错，如果没用到是不报错的。好比下面的代码。temp1对temp求导结果是2*temp。如果最后修改temp的值，temp[0]=0,就会报错。import torchx = torch.tensor([3.0, 2.0], requires_

2020-10-12 16:16:15 1164

原创 2020-10-07

端到端中的问题记录：2020.10.7sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=‘utf8’)目的是为了改变Print的编码输出，解码print输出中文是乱码的问题。此行代码的详细介绍

2020-10-07 16:28:38 221

原创 2020-09-18

python的subprocess模块在python文件中想调用spm_encode命令对一个句子进行分词，就需要使用subprocess模块在python中执行shell命令。但是网上其他的给出的都是传递文件的，或者把字符串传递给cmd的。弄了一晚上，在百度问答上一个老哥给出了正解，很简单，也是用占位符。我的使用如下：subprocess.run(“echo %s | spm_encode --model=‘bpe_model.model’” %sentence, shell=True)如果是对文件

2020-09-18 21:47:11 237

qq_37950002的博客