“Datawhale AI夏令营”-Task1

最新推荐文章于 2024-08-08 14:28:23 发布

Emily__zzz

最新推荐文章于 2024-08-08 14:28:23 发布

阅读量878

点赞数 23

文章标签：人工智能

本文链接：https://blog.csdn.net/Emily__zzz/article/details/140738917

版权

赛道选择-2.AI+逻辑推理

关于30min体验baseline的感受：

文档很详细，对小白友好！

对本小白来说，今天很开心接触到了很多有关大模型的网站链接。体验了api调用、Notebook跑代码等。代码跑起来是非常的顺利，感觉非常有意思。

附-文档链接：Datawhale

一些笔记及过程：

赛事链接：http://competition.sais.com.cn/competitionDetail/532231/format

按照正常报名操作即可。

链接：https://dashscope.console.aliyun.com/apiKey

PS:这里采用阿里开源大模型Qwen系列,通过api的形式调用,使用的模型是目前限时免费的
qwen1.5-1.8b-chat模型。(个人感觉使用很流畅)

链接：https://www.modelscope.cn/my/mynotebook/prese

一些相关简介（科普）：

ModelScope平台介绍：
- ModelScope是一个开源模型平台，由阿里达摩院推出，提供了丰富的模型和数据集，支持模型的存储、发现和共享。
- ModelScope Library提供了简单灵活的函数方法，方便用户高效使用平台的开源模型。
Notebook的使用：
- 用户可以通过ModelScope平台的Notebook在线环境进行模型的推理训练和评估。
- ModelScope提供了Python Library，方便用户进行模型推理、微调和评估。

小白友好在此体现，将Datawhale给我们的代码文件添加进魔塔，即可体验一站式跑通baseline！

这段代码定义了一个名为 call_qwen_api 的函数，该函数用于调用一个名为 dashscope.Generation 的 API 来生成文本。以下是该代码的功能、用途和特点的详细介绍：

功能调用 API 生成文本：该函数通过传递一个模型名称 (MODEL_NAME) 和一个查询 (query) 来调用 dashscope.Generation.call 方法，生成相应的文本。处理 API 响应：函数会检查 API 的响应状态码，如果状态码为 HTTPStatus.OK，则提取并返回生成的文本内容。如果状态码不是 HTTPStatus.OK，则打印错误信息并抛出异常。
用途文本生成：该函数主要用于通过调用外部 API 来生成文本，适用于需要动态生成内容的场景，如聊天机器人、内容创作辅助等。错误处理：通过检查 API 响应状态码并处理错误情况，确保在调用失败时能够及时发现并处理问题。
特点重试机制：函数使用了 @retry(delay=3, tries=3) 装饰器，这意味着在调用 API 失败时，函数会自动重试最多 3 次，每次重试间隔 3 秒。消息格式：在调用 API 时，设置了 result_format=‘message’，表示期望的响应格式是消息格式。错误处理：在 API 调用失败时，函数会打印详细的错误信息，包括请求 ID、状态码、错误代码和错误消息，并抛出异常，以便上层调用者能够捕获并处理这些错误。

代码等非常详细。

（同时由于课程表安排，我将按照课程表学习内容将笔记分成以下三方面。）

（1）赛题分析方面：

分析方法：什么场景？解决什么问题？（认真思考）

AI+逻辑推理是一个大语言模型处理推理任务的问题。比赛聚焦于通过解决复杂的逻辑推理题，测试大型语言模型的逻辑推理能力。比赛的研究成果将有助于评估和改进模型的逻辑推理能力。这对于开发更智能、更有效的人工智能系统具有重要意义。

（2）大模型技术基础方案：

推理引擎是执行逻辑推理的核心组件，它通过不同的方式分析知识并得出结论：

现实世界的数据往往不完整或模糊，为此，我们采用特殊策略应对：

高效的推理需要优化算法，以下是一些常见的技术：

（3）传统机器学习解题思路介绍：

特征工程: 首先，需要将问题和选项转换为机器可以理解和操作的特征向量。这可能包括将文本问题和答案选项编码为数值向量，比如通过词袋模型（Bag-of-Words）、TF-IDF 或者词嵌入（Word Embeddings）如 Word2Vec 或 GloVe。
模型选择: 接下来，选择一个适合分类任务的模型。对于选择题，常见的模型有：
1. 决策树
2. 支持向量机
3. 随机森林
4. 逻辑回归
5. 神经网络
训练模型: 使用已知正确答案的题目作为训练数据，将问题和选项的特征向量输入模型，并标记正确的答案。模型会学习到从特征到正确答案之间的映射关系。
预测与评估: 当模型训练完成后，可以使用测试集来评估模型的准确性和泛化能力。测试集应该包含模型未曾见过的问题和选项。
解决新问题: 对于新的选择题，模型会接收问题和选项的特征向量作为输入，并输出每个选项的概率或分数，最高分的选项即为模型认为的正确答案。

为了提高模型在逻辑推理任务上的性能，可以尝试以下策略：

逻辑规则嵌入：在模型中添加逻辑规则，例如，如果模型是神经网络，可以考虑使用神经符号集成（Neuro-Symbolic Integration）技术，其中逻辑规则被编码为网络的一部分。
增强学习：使用增强学习来奖励模型在逻辑上合理的选择，这样模型不仅学习到数据中的模式，还能学会基于逻辑原则做出选择。
元学习：让模型学习如何学习，通过在多个相关任务上训练，使模型能够更快地适应新类型的选择题。