2301_80324436-CSDN博客

原创 Datawhale AI夏令营第3期：从零入门 AI 逻辑推理（Task2）学习笔记

本篇依然从小白的角度去简单概述一下task2的内容解决逻辑推理问题在过去有机器学习与深度学习两种思路去实现，而大模型则是另一种思路，它是一种人工智能模型，旨在理解和生成人类语言。：首次由GPT-3引入，允许模型在提供自然语言指令或多个任务示例的情况下，通过理解上下文并生成相应输出来执行任务。：通过指令微调，LLM可以根据任务指令执行未见过的任务，展示出强大的泛化能力。：通过""策略，LLM能够解决多步推理任务，例如数学问题。

2024-07-30 23:35:12 298

原创 Datawhale AI夏令营第3期：从零入门 AI 逻辑推理（Task1）学习笔记

暑假刚开始学习，作为小白，这个笔记主要从小白的角度来简单总结一下task1的内容，task1其实并没有涉及什么技术性的内容，对着教程大概也就是五分钟的操作时间，半小时的跑代码的时间。本次比赛采用的是阿里开源大模型Qwen系列，API密钥代表预训练模型的调用权，相当于一个钥匙，每个选手都有独立的API密钥。魔搭社区的PAI-DSW提供两个环境：CPU环境和GPU环境。环境是训练和运行模型过程中必不可少的部分。2.魔搭社区Notebook的CPU环境；task1提供了完整的代码和测试集用于生成结果。

2024-07-27 00:01:35 153

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人