从零入门 AI 逻辑推理Datawhale 2024 年 AI 夏令营 task3

炜591

已于 2024-08-02 20:44:20 修改

阅读量233

点赞数 5

文章标签：人工智能

于 2024-08-02 20:44:07 首次发布

本文链接：https://blog.csdn.net/weixin_73109720/article/details/140879834

版权

思路：

本次任务是在baseline使用loar微调后，在vllm加速的情况下，进行的逻辑推理。

具体过程：

如图：

task3运行路线:魔搭运行gpu选第二个镜像-跑lora（只跑一遍别重复运行cell，提示重启notebook的在文字前面的cell跑完之后点notebook工具栏那个刷新按钮）-跑vllm（在后台挂着）-跑文件夹里面的baseline2

详细过程：

‌‬‍⁠‍‌⁠‌⁠‍⁠‍‍‌‌‬‬‌‌‍⁠‌Task3 baseline02 微调方案 - 飞书云文档 (feishu.cn)

注意事项：

1.要注意使用gpu以及相应的镜像

2.在跑lora微调代码时，要把文件改为an文件，并且每小段代码只能运行一次，另外，在要求重启notebook时要重启内核。

3.记得导入相关文件，main的主train文件。

4.vllm代码是加速代码，挂在后台即可。

最终成绩：

收获所得：

虽然对代码并未完全掌握，但是学到了一定的解决代码报错的能力，学习到了微调的方法。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

炜591

关注关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
从零入门 AI 逻辑推理Datawhale 2024 年 AI 夏令营 task3

本次任务是在baseline使用loar微调后，在vllm加速的情况下，进行的逻辑推理。
复制链接

扫一扫

从零入门 AI 逻辑推理Datawhale 2024 年 AI 夏令营 task2

weixin_73109720的博客

07-30

236

了解了用大模型进行预测的大概思路与方法，对代码各部分也有一定的了解。但是自己撰写代码的能力还缺乏，对调用其他模型与方法还不了解。

Datawhale 2024年 AI 夏令营 从零入门 AI+逻辑推理 Task1 学习笔记

2201_75411375的博客

07-25

237

体验了AI+逻辑推理的实际流程，跑通了baseline，得到了我的第一个分数。同时我对“第二届世界科学智能大赛逻辑推理赛道：复杂推理能力评估”这一比赛有了大致了解，该比赛旨在测试参与者的逻辑推理和问题解决能力。参与者将面对一系列复杂的逻辑谜题，涵盖多个领域的推理挑战。而且该比赛主要涉及逻辑推理概念、结构化问题解决、自然语言模型这三方面。

参与评论您还未登录，请先登录后发表或查看评论

从零入门 AI+逻辑推理 2024Datawhale AI夏令营第三期学习笔记3

2301_78603297的博客

08-01

326

本次task3，总的来说和task1很像，都是运行代码，也就是实操训练，在这次的学习中，我发现自己还有很多的不足，比如有时操作不当，粗心大意，这需要改正，望和各位一起在接下来的学习中继续提升自己。微调对本次赛道在很大程度上是有所帮助的，它对原本的大模型来说，上下文的理解提升了，性能也优化了，数据需求大幅减少，使得适应性大大增强了。本次任务是学习baseline2的微调操作，完成微调任务，使用vllm加速推理和微调的模型进行多路投票，得到更好的结果。原理是通过三次结果推理，将选择答案最多的结果作为最终结果。

2024年 Datawhale AI夏令营（第三期）从零入门 AI+逻辑推理 Task2

qq_46107936的博客

07-30

466

Kaggle是一个全球知名的数据科学和机器学习竞赛平台，提供丰富的数据集和计算资源（包括GPU和TPU），支持用户进行模型训练和测试。增强安全性与功能性：通过合理的提示设计，提高模型输出的安全性和专业性，同时结合外部工具和专业领域知识，进一步拓展模型的应用范围。工程技术：研发与提示工程相关的工程技术，如自动化提示生成工具、模型性能评估系统等，以提高工作效率和模型性能。定义：提示工程是优化大语言模型性能的关键技术，通过精心设计提示词，引导模型产生更准确、更有价值的输出。

Datawhale AI夏令营从零入门 AI 逻辑推理 Task04

li_zi_gao的博客

08-03

663

此外，智能体还可以执行使用工具的操作，包括在互联网上搜索天气，使用计算器进行数学计算等。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。下一步进行思考，决定下一步的行动，也就是从Action1，Action2，Action3中选择执行的Action。大语言模型（LLM）：LLM作为智能体的“大脑”部分，使其能够处理信息，从交互中学习，做出决策并执行行动。这对学习至关重要，因为它允许智能体参考先前的结果并据此调整未来的行动。

DataWhale AI夏令营第三期-从零入门 AI 逻辑推理 Task3

qq_42816781的博客

08-02

115

【代码】DataWhale AI夏令营第三期-从零入门 AI 逻辑推理 Task3。

Datawhale 2024年 AI 夏令营 从零入门 AI+逻辑推理 Task1 学习笔记#AI夏令营 #Datawhale #夏令营

weixin_64663977的博客

07-29

119

体验了AI+逻辑推理的实际流程，跑通了baseline，得到了我的第一个分数。同时我对“第二届世界科学智能大赛逻辑推理赛道：复杂推理能力评估”这一比赛有了大致了解，该比赛旨在测试参与者的逻辑推理和问题解决能力。第一次接触这种大模型推理，学到了很多的python数据处理技巧和要点。比如线程池、异常抓取等。

#AI夏令营 #Datawhale #夏令营从零入门 AI 逻辑推理-Task 1

xiabing的专栏

07-26

294

提交文件，拿下第一个分数！(点击即可跳转官网进行提交)

@Datawhale 夏令营第三期从零入门AI逻辑推理 task3 笔记打卡

2301_80829002的博客

08-03

241

task3的整体运行过程还是比较顺利的，遇到的一些问题也在交流群中找到了答案；通过使用task3的微调优化方案，最终输出结果相比之前也有了较高的提升；但仍有所欠缺的是我对于一整个调参优化的过程还是没有完全理解。对于其它的优化方案的思考与探索也还需更进一步。

Datawhale AI夏令营 AIGC方向 task01方向小白笔记

08-11

Datawhale AI夏令营 AIGC方向 task01方向小白笔记

NLP学习（Datawhale AI夏令营） TASK01#Datawhale示例代码

07-15

NLP学习（Datawhale AI夏令营） TASK01#Datawhale示例代码

Datawhale AI 夏令营机器学习 task1.pdf

07-20

### Datawhale AI 夏令营机器学习 Task1：时间序列预测详解 #### 一、时间序列数据的特点时间序列数据在很多实际场景中都非常重要，例如天气预报、股票市场分析、销售预测等。理解时间序列数据的特点对于设计有效...

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

08-26

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记

08-09

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记

如何开发主播美颜工具？直播美颜SDK的实现方案

q1031691172的博客

09-04

912

由于直播场景对实时性要求极高，因此性能优化是美颜SDK开发的关键。开发者可以通过减少计算复杂度、优化算法效率、利用硬件加速等手段来提升性能。同时，还需在不同设备和操作系统上进行兼容性测试，确保SDK的广泛适用性。

YOLOV5入门教程-yolov5s.yaml文件

vimpirespider的博客

09-04

1413

这段backbone共有9个层次，每个层次逐步提取图像特征并下采样。最后输出的特征图尺寸为40x40，通道数为1024。这个特征图包含了从输入图像中提取到的高层次特征，准备在后续的网络层中用于目标检测。

智能化升级：AI在客服知识库中的应用

LookLook同学的博客

09-03

1700

探讨AI在客服知识库中的应用，提升效率与用户体验。

Transformer