【Datawhale AI 夏令营 Task1 笔记&心得】

qq_41783320

已于 2024-08-10 22:27:44 修改

阅读量709

点赞数 25

文章标签： python ai

于 2024-08-10 22:26:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41783320/article/details/141096428

版权

文章目录

方向2——大模型应用开发

关键词：全栈开发、RAG、大模型部署

简介

整个学习活动，将学习以下内容：

大模型部署【搭建你的智能编程助手】
大模型RAG实战【搭建你的AI科研助手】
大模型微调实战【搭建你的AI简历助手】

速通Task1

Task1主要的任务是跑通baseline，完成第一个编程智能助手的落地。

第一步是开通阿里云pai-dsw服务，这里要注意每天额度有限，最好早上注册（我第一天晚上的时候注册就没有了）

第二步是在魔搭社区创建pai实例（我的理解是获取一个基于云服务的虚拟环境），这里没遇到什么问题，按照步骤来即可。

第三步搭建demo，根据提示下载文件，安装环境，启动即可。这个UI界面是基于streamlit设计的，可以通过极简单的命令完成网页渲染，肥肠方便！https://docs.streamlit.io/develop/api-reference

第四步对话体验没啥好说的，唯一要注意的可能是127.0.0.1:6006最好直接点击链接，浏览器也最好用chrome，我试过复制地址开新标签页是不行滴，猜测可能是在虚拟环境和本地环境里回环地址指向不同导致的（我小白不太懂，群里好像有佬解释了这个问题）

贴一下ai测试
请添加图片描述

方向3——大模型技术微调

关键词：数据处理、prompt改善、大模型微调

简介

整个学习活动聚焦于跑通 “星火大模型驱动阅读理解题库构建挑战赛挑战赛”，基于讯飞大模型定制训练平台和spark-13b微调模型，生成高考语文现代文阅读和英语阅读问题Q&A对。

速通Task1

Task1主要的任务是跑通baseline，获得第一个出题评分。

这个星火大模型比赛主要微调的是prompt和数据集，学习率和训练次数还能选，而模型spark13b、训练方法lora都是固定的，训练日志么有、训练时间从30分钟到3个小时（甚至更多）全靠玄学，~~颇有赛博炼丹的感觉~~ 所以找到高质量的数据集并进行处理，以及设计合理有效的提示词应该是学习的重点。

整体跑下来没什么问题，唯一要注意的可能就是notebook里面最后一段代码要检查一下id、key、secret有没有填错，可以先试着跑一跑，如果报11200的网络连接错误的话就需要用助教发的local_test.py文件替换最后一段，我这样做完之后就可以了。

Ref

https://linklearner.com/activity/14/11/25
https://linklearner.com/activity/14/12/26
https://github.com/datawhalechina/so-large-lm

向所有datawhale贡献者表示感谢！

关注

25
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
【Datawhale AI 夏令营 Task1 笔记&心得】

大模型部署【搭建你的智能编程助手】大模型RAG实战【搭建你的AI科研助手】大模型微调实战【搭建你的AI简历助手】整个学习活动聚焦于跑通 “星火大模型驱动阅读理解题库构建挑战赛挑战赛”，基于讯飞大模型定制训练平台和spark-13b微调模型，生成高考语文现代文阅读和英语阅读问题Q&A对。
复制链接

扫一扫

qq_41783320 CSDN认证博客专家 CSDN认证企业博客

码龄6年

1: 原创

129万+: 周排名

18万+: 总排名

709: 访问

: 等级

35: 积分

12: 粉丝

25: 获赞

1: 评论

11: 收藏

私信

关注

热门文章

【Datawhale AI 夏令营 Task1 笔记&心得】 707

最新评论

【Datawhale AI 夏令营 Task1 笔记&心得】
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619245653。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。