Datawhale ai夏令营task1:初次运行baseline1

最新推荐文章于 2024-08-14 10:21:48 发布

sun_set_LA

最新推荐文章于 2024-08-14 10:21:48 发布

阅读量401

点赞数 5

文章标签：人工智能

本文链接：https://blog.csdn.net/sway_sway_sway/article/details/140758385

版权

“baseline01.ipynb”文件代码训练过程分为四个部分：

一、准备工作

二、调用API

三、反复训练（迭代）

四、读取json文件，上传最终结果

一、准备工作

1）配置环境

安装所需的Python包，“!pip install scipy openai tiktoken retry dashscope loguru"

导入numpy、json等相关包

2）注册链接 API接口 “dashscope.api_key="sk-"”

二、调用API

定义call_qwen_api函数，用于调用配置的API

response = dashscope.Generation.call(...)：使用 dashscope.Generation.call 方法调用API，并传递模型名称和查询参数。
if response.status_code == HTTPStatus.OK:：检查API响应的状态码是否为200（成功）。
return response.json()['message']：如果成功，返回生成的文本内容。
else: ... raise Exception(...)：如果失败，打印错误信息并抛出异常。

三、迭代训练

四、读取json文件，上传最终结果

最后总结，

结合朋友的实验效果发现使用不同的模型（qwen2-72b-instruct与qwen2-7b-instruct）得分差异较大，训练的准确度与模型有很大关系。

除此之外，想要提高结果准确率，还可以从以下方面入手

1）训练数据集的质量和数量，对数据集进行预处理，降噪删去不准确的干扰样本，提高数据集准确度；收集更多的数据样本。

例如，在处理json数据时，我们可以设置函数实现数据增强

（进行同义词替换，增加数据的多样性，从而提高模型的泛化能力，增强鲁棒性）

2）调整超参数，调整学习率、批大小、迭代次数等超参数，寻找最合适的组合。

关注