书生·浦语大模型全链路开源体系
书生浦语的开源历程:
从2023年7月6日的InternLM-7B正式开源并且免费商用到今年7月4日InternLM2.5-7B开源
性能天梯,逐渐靠近gpt,尤其是InternLM-7B性能提升明显
核心思路:数据飞轮
数据主要由三部分构成:基于规则的数据、基于模型的数据扩充、基于反馈的数据生成
InternLM2.5-7B相较于上一代大幅提升,并且领先同量级的开源模型
基于规划和搜索解决复杂问题的能力
书生浦语开源谱系
备注:20B感觉才出现了模型涌现的能力,102B是没有开源的。
书生浦语全链条开源:数据、预训练、微调、部署、评测与应用
接下来将展开具体来说:
数据
预训练
微调
评测
部署
智能体
demo演示
感言
听完,感觉确实不错,整体而言工具链条完整,对于小白到熟练工都有自己对应的工具使用,谢谢上海AI lab构建了一套这种工具,对于小白想上手大模型来说,确实很nice!