“Datawhale AI夏令营”-Task1

赛道选择-2.AI+逻辑推理

关于30min体验baseline的感受

文档很详细,对小白友好!

对本小白来说,今天很开心接触到了很多有关大模型的网站链接。体验了api调用、Notebook跑代码等。代码跑起来是非常顺利感觉非常有意思。

附-文档链接:Datawhale

一些笔记及过程:

1、报名赛事

赛事链接:http://competition.sais.com.cn/competitionDetail/532231/format

按照正常报名操作即可。

2、申请大模型API

链接:https://dashscope.console.aliyun.com/apiKey

PS:这里采用阿里开源大模型Qwen系列,通过api的形式调用,使用的模型是目前限时免费的
qwen1.5-1.8b-chat模型。(个人感觉使用很流畅)

3、启动魔塔

链接:https://www.modelscope.cn/my/mynotebook/prese

一些相关简介(科普):

  1. ModelScope平台介绍

    • ModelScope是一个开源模型平台,由阿里达摩院推出,提供了丰富的模型和数据集,支持模型的存储、发现和共享。
    • ModelScope Library提供了简单灵活的函数方法,方便用户高效使用平台的开源模型。
  2. Notebook的使用

    • 用户可以通过ModelScope平台的Notebook在线环境进行模型的推理训练和评估。
    • ModelScope提供了Python Library,方便用户进行模型推理、微调和评估。

4、baseline体验(重点)

小白友好在此体现,将Datawhale给我们的代码文件添加进魔塔,即可体验一站式跑通baseline!

这段代码定义了一个名为 call_qwen_api 的函数,该函数用于调用一个名为 dashscope.Generation 的 API 来生成文本。以下是该代码的功能、用途和特点的详细介绍:

  • 功能 调用 API 生成文本:该函数通过传递一个模型名称 (MODEL_NAME) 和一个查询 (query) 来调用 dashscope.Generation.call 方法,生成相应的文本。 处理 API 响应:函数会检查 API 的响应状态码,如果状态码为 HTTPStatus.OK,则提取并返回生成的文本内容。如果状态码不是 HTTPStatus.OK,则打印错误信息并抛出异常。
  • 用途 文本生成:该函数主要用于通过调用外部 API 来生成文本,适用于需要动态生成内容的场景,如聊天机器人、内容创作辅助等。 错误处理:通过检查 API 响应状态码并处理错误情况,确保在调用失败时能够及时发现并处理问题。
  • 特点 重试机制:函数使用了 @retry(delay=3, tries=3) 装饰器,这意味着在调用 API 失败时,函数会自动重试最多 3 次,每次重试间隔 3 秒。 消息格式:在调用 API 时,设置了 result_format=‘message’,表示期望的响应格式是消息格式。 错误处理:在 API 调用失败时,函数会打印详细的错误信息,包括请求 ID、状态码、错误代码和错误消息,并抛出异常,以便上层调用者能够捕获并处理这些错误。

代码等非常详细。

(同时 由于课程表安排,我将按照课程表学习内容将笔记分成以下三方面。)

1)赛题分析方面

分析方法什么场景解决什么问题(认真思考)

AI+逻辑推理一个语言模型处理推理任务问题比赛聚焦于通过解决复杂的逻辑推理题,测试大型语言模型的逻辑推理能力。比赛的研究成果将有助于评估和改进模型的逻辑推理能力。这对于开发更智能、更有效的人工智能系统具有重要意义。

(2)大模型技术基础方案:

推理引擎:推动逻辑向前发展

推理引擎是执行逻辑推理的核心组件,它通过不同的方式分析知识并得出结论:

  • 前向链式推理:从已知事实出发,一步步应用规则,直至得出结论。

  • 后向链式推理:从目标逆向寻找支持其成立的依据,类似侦探破案。

  • 溯因推理:在直接证据不足时,通过最合理解释填补空白。

  • 非单调推理:随着新信息的加入,允许之前的结论被修正或推翻。

应对不确定性和不完整信息

现实世界的数据往往不完整或模糊,为此,我们采用特殊策略应对:

  • 概率逻辑:结合概率理论,为不确定性提供数学基础。

  • 模糊逻辑:允许不同程度的真值,超越了非黑即白的二元思维。

  • 缺省逻辑:在信息缺失时,基于合理假设做出最佳推测。

算法与优化:提升推理效率

高效的推理需要优化算法,以下是一些常见的技术:

  • 单元传播:在处理布尔逻辑问题时,一旦确定某个变量的状态,立即更新所有相关条件。

  • 冲突驱动的子句学习(CDCL):从冲突中提炼新规则,避免重复错误。

  • 约束传播:通过缩小变量的取值范围,快速排除不可能选项,加速搜索过程

(3传统机器学习解题思路介绍:

  1. 特征工程: 首先,需要将问题和选项转换为机器可以理解和操作的特征向量。这可能包括将文本问题和答案选项编码为数值向量,比如通过词袋模型(Bag-of-Words)、TF-IDF 或者词嵌入(Word Embeddings)如 Word2Vec 或 GloVe。

  2. 模型选择: 接下来,选择一个适合分类任务的模型。对于选择题,常见的模型有:

    1. 决策树

    2. 支持向量机

    3. 随机森林

    4. 逻辑回归

    5. 神经网络

  3. 训练模型: 使用已知正确答案的题目作为训练数据,将问题和选项的特征向量输入模型,并标记正确的答案。模型会学习到从特征到正确答案之间的映射关系。

  4. 预测与评估: 当模型训练完成后,可以使用测试集来评估模型的准确性和泛化能力。测试集应该包含模型未曾见过的问题和选项。

  5. 解决新问题: 对于新的选择题,模型会接收问题和选项的特征向量作为输入,并输出每个选项的概率或分数,最高分的选项即为模型认为的正确答案。

为了提高模型在逻辑推理任务上的性能,可以尝试以下策略:

  • 逻辑规则嵌入:在模型中添加逻辑规则,例如,如果模型是神经网络,可以考虑使用神经符号集成(Neuro-Symbolic Integration)技术,其中逻辑规则被编码为网络的一部分。

  • 增强学习:使用增强学习来奖励模型在逻辑上合理的选择,这样模型不仅学习到数据中的模式,还能学会基于逻辑原则做出选择。

  • 元学习:让模型学习如何学习,通过在多个相关任务上训练,使模型能够更快地适应新类型的选择题。

  • 23
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值