书生·浦语大模型笔记

最新推荐文章于 2024-09-07 19:10:22 发布

6DAIchemist

最新推荐文章于 2024-09-07 19:10:22 发布

阅读量345

点赞数 5

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TLBoris/article/details/139233424

版权

总体概览

InternLM2模型通过创新的预训练和优化技术，在六个维度和30个基准测试中表现出色。该模型能够高效捕捉长期依赖关系，最初在4k tokens上训练，然后进阶到32k tokens，并在200k的“针堆”测试中展现出卓越的性能。通过监督式微调（SFT）和一种新的基于条件在线强化学习（COOL RLHF）的策略，InternLM2进一步与人类偏好对齐，解决了冲突的人类偏好和奖励黑客问题。

技术报告主要内容

引言：介绍了大型语言模型（LLMs）的发展历程以及InternLM2的创新之处。
基础设施：介绍了用于模型训练的InternEvo框架，它支持大规模GPU训练，并采用多种并行技术和优化策略。
预训练：详细描述了预训练数据的准备，包括文本、代码和长文本数据，以及预训练设置和阶段。
对齐：介绍了如何通过监督式微调（SFT）和基于条件的在线强化学习（COOL RLHF）来确保模型遵循人类指令并与人类价值观对齐。
评估与分析：提供了模型在各种下游任务上的性能评估，包括综合考试、语言和知识、推理和数学、编程、长文本建模和工具使用等。
结论：总结了InternLM2的主要贡献和优势。

链路

在这里插入图片描述

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语大模型笔记

InternLM2模型通过创新的预训练和优化技术，在六个维度和30个基准测试中表现出色。该模型能够高效捕捉长期依赖关系，最初在4k tokens上训练，然后进阶到32k tokens，并在200k的“针堆”测试中展现出卓越的性能。通过监督式微调（SFT）和一种新的基于条件在线强化学习（COOL RLHF）的策略，InternLM2进一步与人类偏好对齐，解决了冲突的人类偏好和奖励黑客问题。
复制链接

扫一扫

6DAIchemist CSDN认证博客专家 CSDN认证企业博客

码龄5年

8: 原创

61万+: 周排名

12万+: 总排名

1828: 访问

: 等级

109: 积分

24: 粉丝

28: 获赞

2: 评论

18: 收藏

私信

关注

热门文章

最新评论

wsl解决opencv的cv::imread无法显示的问题
普通网友: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
wsl解决opencv的cv::imread无法显示的问题
CSDN-Ada助手: 推荐 OpenCV 技能树：https://edu.csdn.net/skill/opencv?utm_source=AI_act_opencv
【西电杭研院工程优化】重点整理
CSDN-Ada助手: 恭喜您开始博客创作！标题中的“重点整理”让我对您的博客充满了期待。作为一个读者，我非常期待看到您对西电杭研院工程优化的深度整理和独到见解。接下来，我建议您可以尝试从实际案例或者经验分享入手，让读者更容易理解和应用您的知识。希望您继续保持谦虚态度，并期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。