《KnowPrompt》论文代码复现6-模型训练步骤及注意事项

1、

readme中说执行get_label_word.py文件时要用bert模型

但是在训练模型时又用的roberta模型

所以这里应该是有问题的。修改命令,执行get_label_word.py文件时使用roberta-large模型

代码正常运行的标志

2、

这个命令没有什么问题,直接在终端执行就可以

因为默认的种子是[1,2,3,4,5],所以这个文件执行成功的标志是dataset/semeval/k-shot/这个路径下会有8-1到8-5这5个目录

然后把dataset/semeval这个路径下的rel2id.json、val.txt、test.txt这三个文件复制到k-shot下的8-1文件中(图中的命令好像是linux下的命令,windows下不能用)

代码运行成功标志

3、

这一步就是训练模型了。这个命令是linux下的命令,windows不能用,然后对命令进行修改,如下:

我的显卡是4060,8gb显存。这个模型好像有20多层,我只有在把num_work关了,把batch_size设为3的情况下才能跑模型,要不然显存就爆了

然后把修改后的命令复制到终端执行,就能正常训练了

  • 16
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值