自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_64858471的博客

原创 DataWhale大模型笔记

在这一段之前，我们已经从train.csv文件中，将数据集读取进来了，但是我们注意到这里只使用了第一列和第三列作为输入，将第五列作为输出。于是我们打开CSV文件，发现数据集的构成其实是由第0列（uuid），第1列（title），第二列（author)，第三列（abstract），第四列（keywords）组成。这个时候我发现第一次不修改参数结果模型中存了一个1000步的模型，于是又使用这个Lora模型去跑，发现最后跑出来上到0.8出头。（在150，300步时能到到0.97，0.99的结果）

2023-08-25 20:19:23 252 1

原创 DataWhale笔记

在依照TopLine的代码跑通流程以后，最终在测试集上取得了相当接近满分的结果。这一段出现在模型训练这一部分，主要是判断是否有已经训练好的模型，这里我重新调参完之后要重新训练模型。在后续保存模型之后，如果要重新装载模型，只需要直接加载best_model.ckpt就可以了。如果最终想要使用Bert模型成功的完成这项文本二分类的任务，则还需要在原来代码的基础上调整超参数。在Bert拿到1分后，我尝试微调chatglm-6B的模型，但是目前调参结果得分只有0.8左右，效果甚至不如Bert，所以目前还在调参。

2023-08-22 16:12:12 53 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

LZR204 CSDN认证博客专家 CSDN认证企业博客

码龄3年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

2: 原创

179万+: 周排名

146万+: 总排名

304: 访问

: 等级

22: 积分

0: 粉丝

2: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

DataWhale大模型笔记
CSDN-Ada助手: 非常棒的博文！你的DataWhale大模型笔记真的让人受益匪浅。继续坚持创作，我相信你会取得更多的进步。除了你在标题和摘要中提到的内容，我还想分享一些与该博文相关的扩展知识和技能。在处理大型数据集时，了解数据清洗和特征工程是非常重要的。你可以尝试使用数据清洗技术来处理缺失值和异常值，并使用特征工程方法来提取更有用的特征。此外，你还可以学习如何使用不同的机器学习算法和模型来进行预测和分类任务，例如决策树、随机森林和神经网络等。希望这些建议对你有所帮助！再次感谢你的分享，期待看到更多有关DataWhale大模型的精彩博文。谦虚谨慎的态度一直是学习的关键，相信你会取得更大的成就！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
DataWhale笔记
CSDN-Ada助手: 恭喜您开始博客创作！标题“DataWhale笔记”很吸引人，让人期待能从您的博客中获得有关DataWhale的知识和经验。希望您能继续保持这种积极的创作动力，并在未来的博客中分享更多有关DataWhale的深入见解和实践经验。同时，可以考虑增加一些个人的思考和观点，或者分享一些具体的案例和技巧，这将让读者更加受益。期待您的下一篇博客！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除