DataWhale AI夏令营第三期-从零入门 AI 逻辑推理 Task2

qq_42816781

于 2024-08-01 04:16:32 发布

阅读量287

点赞数 5

分类专栏： DataWhale AI夏令营第三期文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42816781/article/details/140835110

版权

DataWhale AI夏令营第三期专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Task 2 Basline精读https://linklearner.com/activity/12/3/10

这节的task主要解释Baseline的代码，从而展示如何运用大模型思考、Prompting的示例。

整体代码介绍

两个主要组成部分：答案生成模块和纠错与结果文件生成模块。下面是该段落的重点总结：

1. 整体代码结构：

- 整体代码分为两大模块：答案生成模块和纠错与结果文件生成模块。

2. 答案生成模块：

- 包括大模型的处理函数、从大模型返回结果中抽取所需信息、多线程处理以及答案生成的启动过程。

- 大模型部分是整个代码的核心。

- 动手能力强的开发者可以从此处入手改进代码。

- 为了提高性能，使用了多线程处理请求。

3. 纠错与结果文件生成模块：

- 目的是处理由于网络问题或模型能力限制导致的结果缺失或不完整的情况。

- 可能出现的问题包括大模型未明确给出选项（如ABCD）的答案，或者返回空值。

- 有时即使重试机制用尽，仍然无法获取到有效结果，这种情况下会跳过相应问题。

环境配置

导入需要的环境，包括日志处理、多线程、api请求等相关库引入。

答案生成部分

- `call_qwen_api` 函数的作用是接收模型名称和提示（prompt），并完成对大型模型 API 的调用。

- `api_retry` 函数用于解决调用大型模型 API 时可能出现的错误或中断问题。为了确保每个问题都能被模型处理，我们设置了一个重试机制。该机制的最大尝试次数为5次，并且在每次重试之间会有60秒的等待时间。如果重试过程中出现错误，相关信息会被记录到日志文件中。

- `get_prompt` 是一个模板函数，它通过字符串处理来构建完整的提示（prompt）。

抽取函数

通过使用抽取函数，我们可以将大型语言模型生成的结果转换为相应的答案选项。这一过程遵循与`prompt`相匹配的原则。`prompt`模板要求结果的最后一行格式必须为“答案是：A”这样的形式，因此我们利用正则表达式 (`re.compile`) 来精确匹配答案选项。如果匹配失败，则默认选择“A”作为答案。

`get_prompt` 是一个用于构建完整`prompt`的模版函数，它通过字符串处理来组合所需的完整提示信息。

多线程处理

启动函数

纠错与结果文件生成

去重与排序：对于相同问题背景下的所有问题，将其统一存入一个字典中，并按照ID序号进行排序。

纠错：实施纠错措施以修正因网络或模型能力问题导致的错误答案。

补错：针对缺失的答案进行补充。

处理空缺答案：对于缺失答案的条目，我们可以默认将`answer`字段填充为“A”。如果不满意这种处理方式，可以选择再次通过多线程函数进行处理。

存储文件：最终处理完成的数据会被保存到文件中以供后续使用。

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
DataWhale AI夏令营第三期-从零入门 AI 逻辑推理 Task2

两个主要组成部分：答案生成模块和纠错与结果文件生成模块。下面是该段落的重点总结：1. 整体代码结构：- 整体代码分为两大模块：答案生成模块和纠错与结果文件生成模块。2. 答案生成模块：- 包括大模型的处理函数、从大模型返回结果中抽取所需信息、多线程处理以及答案生成的启动过程。- 大模型部分是整个代码的核心。- 动手能力强的开发者可以从此处入手改进代码。- 为了提高性能，使用了多线程处理请求。3. 纠错与结果文件生成模块：- 目的是处理由于网络问题或模型能力限制导致的结果缺失或不完整的情况。
复制链接

扫一扫

专栏目录

qq_42816781 CSDN认证博客专家 CSDN认证企业博客

码龄6年

24: 原创

15万+: 周排名

7万+: 总排名

5646: 访问

: 等级

330: 积分

57: 粉丝

90: 获赞

2: 评论

54: 收藏

私信

关注

热门文章

分类专栏

最新评论

五一卷羊陀三22 - 4、五一 Llama 3 超级课堂 | 第四节 Llama 3 高效部署实践（LMDeploy版）
CSDN-Ada助手: 恭喜您的第三篇博客发布啦！标题“五一卷羊陀三22 - 4、五一 Llama 3 超级课堂 | 第四节 Llama 3 高效部署实践（LMDeploy版）”听起来就让人期待不已。希望您能继续坚持创作，分享更多有价值的内容。或许在下一篇博客中，可以探讨一些实践中的案例分析或者心得体会，让读者能够更加深入地了解您的经验和见解。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
五一卷羊陀三22 - 2、五一 Llama 3 超级课堂 | 第二节 Llama 3 微调个人小助手认知（XTuner版）
CSDN-Ada助手: 恭喜你的第二篇博客发布啦！看到你使用XTuner完成小助手认知微调的经历，感觉你对技术的热情和专注真的很让人钦佩。希望你能继续保持写作的热情，分享更多有趣的技术经验和心得。另外，关于XTuner的使用，你可能会对车辆故障诊断、数据采集与分析等方面有更深入的了解，可以进一步探索一下，增加自己的技术储备。期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
五一卷羊陀三22 - 1、五一 Llama 3 超级课堂 | 第一节本地 Web Demo 部署
CSDN-Ada助手: 恭喜您开始了博客创作的第一步！完成了Llama 3 Web Demo 部署的工作，非常棒！接下来，建议可以分享一些关于Llama 3 Web Demo 的具体功能和优势，或者是您在部署过程中遇到的挑战和解决方案，这样可以让读者更加深入地了解您的技术实力和经验。希望您在未来的博客创作中继续保持努力，不断进步！期待您更多精彩的分享！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。