从零入门逻辑推理

最新推荐文章于 2024-10-15 11:38:32 发布

qq_38138014

最新推荐文章于 2024-10-15 11:38:32 发布

阅读量494

点赞数 14

分类专栏： #datawhale夏令营 #datawhale #逻辑推理文章标签： python

本文链接：https://blog.csdn.net/qq_38138014/article/details/140756865

版权

#datawhale夏令营 #datawhale #逻辑推理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

AI逻辑推理是一个涉及人工智能、计算机科学、数学和逻辑学的过程。可以用在专家系统、自动推理、安全监控等领域。

在天池注册账号后登录。

启动摩搭notebook。找个实例静等3分钟。

开始一站式baseline，下载代码与测试集。

开始启动

然后下载jions数据，提交。

补充理论

大模型

大语言模型（Large Language Models，简称LLMs）是一种人工智能模型，它通过大量的文本数据训练，能够理解和生成自然语言文本。这些模型通常具有以下特点：

1. 规模巨大

参数数量：大语言模型的参数数量通常达到数十亿甚至千亿级别，这使得模型能够捕捉到语言的复杂性和细微差别。
数据量：训练这些模型需要海量的文本数据，这些数据可能包括书籍、文章、网页内容等多种来源。

2. 预训练与微调

预训练：模型首先在大量未标注的文本上进行预训练，以学习语言的一般特性。
微调：随后，模型可以在特定的任务或领域上进行微调，以优化其性能。

3. 多功能性

多任务处理：大语言模型能够处理多种语言任务，如文本分类、情感分析、机器翻译、问答系统、文本生成等。
上下文理解：这些模型能够理解和维持较长的上下文信息，从而更好地理解和生成相关文本。

4. 生成能力

文本生成：大语言模型能够生成连贯、有逻辑的文本，包括文章、故事、对话等。
创造性：模型能够在一定程度上表现出创造性，生成新颖的内容。

5. 语言理解

语义理解：模型能够理解词汇、短语和句子的深层含义。
推理能力：一些高级模型甚至具备一定的逻辑推理和问题解决能力。

6. 应用范围

搜索引擎：用于理解和回答用户的查询。
聊天机器人：提供自然语言交互的界面。
内容创作：辅助生成文章、报告和其他文本内容。

大模型推理实现最常用方法——提示工程(Prompt Engineering)

提示工程（Prompt Engineering）是一种在大语言模型（LLMs）中实现推理和其他复杂任务的关键技术。它涉及设计有效的输入提示（prompts），以引导模型生成期望的输出。以下是提示工程的一些核心概念和方法：

1. 提示（Prompt）的定义

提示是提供给语言模型的输入文本，它包含了任务指令、上下文信息和期望模型遵循的格式或结构。

2. 提示工程的目标

提高准确性：通过精心设计的提示，提高模型在特定任务上的性能。
引导输出：使模型的输出更加符合用户的需求。
减少错误：减少模型在理解和生成文本时的错误。

3. 提示工程的方法

指令微调：在提示中包含明确的指令，告诉模型如何执行任务。
示例引导：提供一些示例，让模型学习如何完成任务。
格式化：为模型的输出设置特定的格式，如JSON、表格或特定的文本结构。
上下文提供：提供相关的背景信息，帮助模型更好地理解任务。
关键词强调：在提示中使用关键词或短语，强调某些信息的重要性。

4. 提示工程的步骤

理解任务：明确任务的目标和要求。
设计提示：根据任务需求设计初步的提示。
测试和迭代：测试提示的效果，并根据模型的输出进行调整。
优化：通过多次试验，找到最佳的提示设计。

5. 提示工程的挑战

模型理解：确保模型能够正确理解提示中的指令。
偏见和误导：避免在提示中引入偏见或导致模型产生误导性输出。
上下文长度：处理模型对上下文长度的限制。

6. 提示工程的实例

问答系统：设计提示以引导模型提供准确的答案。
文本生成：创建提示以指导模型生成特定风格或内容的文本。
情感分析：通过提示让模型分析给定文本的情感倾向。

整体代码介绍

整体代码主要包括答案生成和纠错与结果文件生成两个大模块。

答案生成部分包括大模型的处理函数、大模型返回结果抽取、多线程处理及答案生成的启动。

这里代码核心是大模型部分，动手能力强的小伙伴可以从这里入手开始自己的上分之路~为了保证整体代码性能使用多线程处理请求。

纠错与结果生成部分存在的目的是由于目前使用了api调用在线开源大模型，因为网络、模型能力等原因会导致有一些结果会出现缺失。（比如大模型回答时，没有明确给出ABCD的结果，而返回的空值。也有时因为网络retry模块机会使用结束后，依然没有提取到结果会跳过某个问题。）

补充完理论了，下次介绍微调。

最后，感谢datawhale。

qq_38138014

关注

14
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录