Datawhale AI夏令营——复杂推理能力评估Task1 跑通Baseline

本文记录了参加Datawhale AI夏令营的第一个任务经历,比赛为第二届世界科学智能大赛逻辑推理赛道:复杂推理能力评估。这个任务总体比较简单,主要在跑通Baseline,了解ai任务的基本流程。

一、获取代码和文件

1.1 报名比赛

链接:http://competition.sais.com.cn/competitionDetail/532231/

1.2 下载资源

在这里插入图片描述

二、申领模型API

比赛采用的是DashScope(阿里云灵积平台)上的阿里开源大模型Qwen系列中,限时免费的qwen1.5-1.8b-chat 模型。
注:DashScope是阿里云的一款模型服务产品,简化了AI模型的应用与部署,对主流的AI大模型进行了标准化封装,提供API接口,方便开发者可以调用这些模型,并进行推理、训练、微调。

2.1 注册/登录DashScope平台

平台链接:https://dashscope.aliyun.com

2.2 申请个人API-KEY

进入DashScope控制台的API-KEY管理页面,如图
请添加图片描述
点击创建新的API-KEY即可,新用户需要先开通灵积平台,按照步骤操作即可,没有需要额外注意的地方。
注:申请好的API-KEY需要妥善保存,避免暴露。

2.3 调用大模型API

使用DashScope的Python官方库:

import dashscope

可以使用dashscope.Generation.call方法调用API,该方法发起一个HTTP请求,需要正确设置请求消息以及需要调用的模型名称。具体到这个例子中为:

    response = dashscope.Generation.call(
        'qwen1.5-1.8b-chat',  # model name
        messages=[{'role': 'user', 'content': query}],
        result_format='message',
    )

关于如何使用灵积平台快速搭建一个大模型应用,可以参考官方文档:https://help.aliyun.com/zh/dashscope/create-a-chat-foundation-model

三、使用魔塔NoteBook运行代码

3.1 进入魔塔NoteBook

链接:https://www.modelscope.cn/my/mynotebook/preset

3.2 启动一个CPU或GPU实例

这个task的任务比较简单,使用免费的CPU就能够快速出结果,所以直接启动CPU实例。
在这里插入图片描述

3.2 使用NoteBook启动代码

启动后点击查看NoteBook。
在这里插入图片描述
进来之后只需要把提供的baseline代码文件上传运行即可。
在这里插入图片描述
在这里插入图片描述

四、收集并测试结果

静等15~20min应该就能够获得结果,会在当前文件夹生成一个upload.json文件,记录的是模型对每一个问题的回答。
在这里插入图片描述
此时将文件上传至比赛提交页即可。

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值