3月4日工作记录

Hagtaril

于 2024-03-04 13:49:31 发布

阅读量914

点赞数 7

分类专栏：工作记录文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hagtaril/article/details/136447012

版权

周末总结

周末花6.5k的4060ti主机到家了，配好了和女朋友一起玩了两天帕鲁，真好玩！
玩完开始上班！

今天，上午先看三篇paper，然后下午继续1日计划的工作

文章阅读

文章一：SciGLM: Training Scientific Language Models with Self-Reflective Instruction Annotation and Tuning

https://github.com/THUDM/SciGLM

通过自动纠错生成SciInstruct数据集，在SciInstruct数据集上训练ChatGLM得到优于baseline（ChatGLM）的模型。
在这里插入图片描述

“从互联网上获得的用于科学问题的指令数据的规模远小于其他任务。科学内容通常需要更高级别的专业知识才能创建，且大多数高质量信息经常受到知识产权的保护。我们能合法访问的大多数数据只包含问题-答案（QA）对，而没有详细的思考链条推理步骤。然而，仅仅训练大型语言模型（LLMs）使用QA对会导致非常糟糕的结果，甚至损害它们的通用语言能力。为了获得高质量的推理步骤作为指令（I

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。