1. 书生大模型全链路开源开放体系–笔记
1.1 书生大模型的发展历程
目前开源的浦语2.5的概况:
- 优秀的推理能力
- 支持100万的token上下文
- 有自主规划和搜素,能够完成复杂任务!这一点感觉很牛!
对于一些复杂问题,该大模型能够模拟人的解决思路,将问题逐步拆解成一个个子问题,并引入了检索的功能,利用搜索引擎筛选资料,最终整合成问题答复!
这个思路有很大的借鉴意义!
核心技术思路:
1.基于规则的构造 代码 公式,函数,数学题解
2.基于模型的数据扩充 代码加注释
3.基于人类反馈的数据生成 强化学习思路,RLHF路子。
1.2 书生大模型全链条开源体系
书生大模型全链路开源开放体系是一个旨在推动自然语言处理技术发展的重要举措。该体系涵盖了从数据、模型预训练、模型微调、模型部署、模型评测、模型应用等多个环节,以促进模型性能的提升和应用场景的多样化。
数据处理工具:
预训练框架:
模型微调:
评测体系:
模型部署:
智能体:
这个智能体的demo展示特别牛!右边能够实时展示模型的思考过程,并且引入了搜索引擎,目前对这个非常感兴趣!
企业级知识库的构建: