pytorch
记录pytorch使用细节
三重极简
之后不更论文的百度翻译了,虽然本意是为了自己查找方便,但太水了,后边有时间会迁移然后删掉的。之后要发也主要是精读的论文及代码。
展开
-
Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog 代码阅读
文章目录前置阅读参数设定数据处理DatasetTrainEncoder前置阅读GLMP:任务型对话中全局到局部的记忆指针网络 论文阅读及代码解析Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog参数设定{'dataset': 'kvr', 'epoch': 1000, 'fixed': False, 'random_seed': 1, 'embeddings_dim': 128, 'hidden': 128原创 2020-11-10 16:16:15 · 800 阅读 · 1 评论 -
Compacting, Picking and Growing for Unforgetting Continual Learning 论文及代码流程解读
文章目录论文翻译Abstract1 Introduction方法设计的动机Method Overview2 Related Work3 The CPG approach for Continual Lifelong Learning实验1复现1.baseline:VGG162.CPG_cifar100_scratch_mul_1.5.shTask1finetune modegradually pruningChoose the checkpointTask2 (k>1)finetune mod原创 2020-12-25 12:29:11 · 1390 阅读 · 1 评论 -
RuntimeError: cuda runtime error (59) : device-side assert triggered at C:/w...的一种可能
很多博客上给的解释是计算LOSS时超出了标签类别分类,如报错 RuntimeError: cuda runtime error (59) : device-side assert triggered at /py/conda-bld/pytorch_…经反复检查更改代码,发现Tensor经过某些计算步骤后会出现 nannannan ,锁定相关步骤后发现是因为在定义 nn.Parameternn.Parameternn.Parameter 后没有对其进行初始化,使得初始参数为0,导致后续一系列计算错误。原创 2020-05-18 14:20:03 · 3319 阅读 · 0 评论 -
pytorch tensorboard模型结构显示
转自:https://www.cnblogs.com/jfdwd/p/11445135.html重点关注最后两句,其中使用了python的上下文管理,with 语句,可以避免因w.close未写造成的问题。推荐使用此方式。使用 w.add_graph(model, (dummy_input,)),其中第一个参数为需要保存的模型,第二个参数为输入值,元祖类型。打开tensorboard控制台,可得到如下结果。...转载 2020-05-10 12:34:31 · 1546 阅读 · 0 评论