《KnowPrompt》论文代码复现6-模型训练步骤及注意事项

最新推荐文章于 2024-07-11 17:26:33 发布

里希在内核

最新推荐文章于 2024-07-11 17:26:33 发布

阅读量546

点赞数 16

文章标签：学习人工智能论文阅读 nlp python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jbuvkguko/article/details/135630196

版权

1、

readme中说执行get_label_word.py文件时要用bert模型

但是在训练模型时又用的roberta模型

所以这里应该是有问题的。修改命令，执行get_label_word.py文件时使用roberta-large模型

代码正常运行的标志

2、

这个命令没有什么问题，直接在终端执行就可以

因为默认的种子是[1,2,3,4,5]，所以这个文件执行成功的标志是dataset/semeval/k-shot/这个路径下会有8-1到8-5这5个目录

然后把dataset/semeval这个路径下的rel2id.json、val.txt、test.txt这三个文件复制到k-shot下的8-1文件中（图中的命令好像是linux下的命令，windows下不能用）

代码运行成功标志

3、

这一步就是训练模型了。这个命令是linux下的命令，windows不能用，然后对命令进行修改，如下：

我的显卡是4060，8gb显存。这个模型好像有20多层，我只有在把num_work关了，把batch_size设为3的情况下才能跑模型，要不然显存就爆了

然后把修改后的命令复制到终端执行，就能正常训练了

里希在内核

关注

16
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
《KnowPrompt》论文代码复现6-模型训练步骤及注意事项

然后把dataset/semeval这个路径下的rel2id.json、val.txt、test.txt这三个文件复制到k-shot下的8-1文件中（图中的命令好像是linux下的命令，windows下不能用）因为默认的种子是[1,2,3,4,5]，所以这个文件执行成功的标志是dataset/semeval/k-shot/这个路径下会有8-1到8-5这5个目录。这个模型好像有20多层，我只有在把num_work关了，把batch_size设为3的情况下才能跑模型，要不然显存就爆了。所以这里应该是有问题的。
复制链接

扫一扫

里希在内核 CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

133万+: 周排名

16万+: 总排名

6147: 访问

: 等级

203: 积分

100: 粉丝

130: 获赞

10: 评论

121: 收藏

私信

关注

热门文章

最新评论

《KnowPrompt》论文代码复现3-get_label_word.py代码讲解（超级详细!）
CSDN-Ada助手: 恭喜您撰写了这么详细的博客，对《KnowPrompt》论文代码复现3-get_label_word.py进行了深入的讲解，让读者受益匪浅。希望您能继续保持创作的热情和耐心，也期待您能在下一篇博客中分享一些实际应用场景下的代码实现和经验总结。期待您的更多精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《KnowPrompt》论文代码复现4-generate_k_shot.py代码讲解（超级详细!）
CSDN-Ada助手: 非常感谢您分享这篇《KnowPrompt》论文代码复现的讲解，内容非常详细、深入，让我受益匪浅。恭喜您写下第5篇博客，希望您能继续坚持创作，分享更多的知识和经验。如果可能的话，我期待能看到您对于代码实现的优化或者其他相关主题的探讨。谢谢您的分享！
《KnowPrompt》论文代码复现5-main.py代码讲解（超级详细!）
CSDN-Ada助手: 恭喜您完成了第6篇博客！标题看起来非常有趣，而且非常详细！很高兴看到您一直在努力创作。对于下一步的创作建议，我想提醒您保持这种谦虚的态度，因为这将让读者更容易理解和接受您的内容。同时，考虑与读者互动，了解他们感兴趣的话题，并尝试在您的博客中涵盖这些话题，这样可以进一步吸引和留住读者。继续加油！
《KnowPrompt》论文代码复现6-模型训练步骤及注意事项
CSDN-Ada助手: 恭喜您写了第7篇博客，内容看起来非常专业和有深度。希望您能继续保持创作的热情和动力，让我们看到更多优质的内容。同时，建议您可以考虑分享一些个人对于论文代码复现过程中的一些心得体会，或者是遇到的一些困难和解决方法，这样可以让读者更加深入地了解您的学习和研究过程。期待您的下一篇作品！
《KnowPrompt》论文代码复现2-环境配置
里希在内核: 您好，我复现成功了，我是昨晚才复现成功的。我没有遇到您的问题，我是所有epoch跑下来都没问题。我今天会发一篇文章叫“模型训练步骤及注意事项”，是我自己踩得坑，不知道能不能帮到您

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。