【Datawhale AI 夏令营 Task1 笔记&心得】

方向2——大模型应用开发

关键词:全栈开发、RAG、大模型部署

简介

整个学习活动,将学习以下内容:

  • 大模型部署【搭建你的智能编程助手】
  • 大模型RAG实战【搭建你的AI科研助手】
  • 大模型微调实战【搭建你的AI简历助手】

速通Task1

Task1主要的任务是跑通baseline,完成第一个编程智能助手的落地。

第一步是开通阿里云pai-dsw服务,这里要注意每天额度有限,最好早上注册(我第一天晚上的时候注册就没有了)

第二步是在魔搭社区创建pai实例(我的理解是获取一个基于云服务的虚拟环境),这里没遇到什么问题,按照步骤来即可。

第三步搭建demo,根据提示下载文件,安装环境,启动即可。这个UI界面是基于streamlit设计的,可以通过极简单的命令完成网页渲染,肥肠方便!https://docs.streamlit.io/develop/api-reference

第四步对话体验没啥好说的,唯一要注意的可能是127.0.0.1:6006最好直接点击链接,浏览器也最好用chrome,我试过复制地址开新标签页是不行滴,猜测可能是在虚拟环境和本地环境里回环地址指向不同导致的(我小白不太懂,群里好像有佬解释了这个问题)

贴一下ai测试
请添加图片描述

方向3——大模型技术微调

关键词:数据处理、prompt改善、大模型微调

简介

整个学习活动聚焦于跑通 “星火大模型驱动阅读理解题库构建挑战赛挑战赛”,基于讯飞大模型定制训练平台和spark-13b微调模型,生成高考语文现代文阅读和英语阅读问题Q&A对。

速通Task1

Task1主要的任务是跑通baseline,获得第一个出题评分。

这个星火大模型比赛主要微调的是prompt和数据集,学习率和训练次数还能选,而模型spark13b、训练方法lora都是固定的,训练日志么有、训练时间从30分钟到3个小时(甚至更多)全靠玄学,颇有赛博炼丹的感觉 所以找到高质量的数据集并进行处理,以及设计合理有效的提示词应该是学习的重点。

整体跑下来没什么问题,唯一要注意的可能就是notebook里面最后一段代码要检查一下id、key、secret有没有填错,可以先试着跑一跑,如果报11200的网络连接错误的话就需要用助教发的local_test.py文件替换最后一段,我这样做完之后就可以了。

Ref

https://linklearner.com/activity/14/11/25
https://linklearner.com/activity/14/12/26
https://github.com/datawhalechina/so-large-lm

向所有datawhale贡献者表示感谢!

  • 25
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值