- 博客(10)
- 收藏
- 关注
原创 书生·浦语大模型实战营-第三课笔记
数据收集是向量数据库的源头,可以理解为后续我们要长期采集和更新的知识库或者数据源,在本课中采用了几个项目中的txt和md文档作为数据源。1、langchain工作流程。3、接入langchain。2、数据收集及向量化处理。
2024-02-20 01:30:44 144
原创 书生·浦语大模型实战营-第四课实战
参考了官方的视频和教程,在本地windows部署,微调功能的使用相对比较容易上手,不深入研究的话,大体的步骤比较简单,官方文档写的非常清楚,请参考,在此不赘述。本次实战数据集采用的是书生万卷1.0中的法律部分的数据集,配置采用的是internlm2_chat_7b_qlora_lawyer_e3,基础模型使用的是internlm2_chat_7b。
2024-02-18 01:16:33 158 1
原创 书生·浦语大模型实战营-第一课笔记
首先了解了大模型的发展历程,从GPT1到GPT4的发展历程,大模型经历自OPENAI发布GPT3.5后进入了快速发展阶段,成为了技术界高度关注的热门技术。课程解决了我的一个疑问,怎么使用大模型,给了我一个非常明确的实践路线。从数据、预训练、微调、部署、评测和应用,书生浦语提供了丰富的工具支撑,解决了开展这些工作的基础工具。后续工作中,我重点关注数据准备和微调,重点学习这两部分,期待在工作中真正实现大模型的落地应用。大模型的出现改变了以往通用人工智能的困局,使得通用人工智能在通用领域的应用变得有可能。
2024-02-14 19:57:29 438 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人