荧惑yh-CSDN博客

原创 Tiny-universe学习笔记1：Qwen-blog

本文是参与Datawhale Tiny-universe组队学习的第一篇学习笔记，参考链接：https://github.com/datawhalechina/tiny-universe。

2024-09-20 00:49:03 976

原创 Datawhale AI夏令营 AI+逻辑推理 Task2总结

整体代码主要包括答案生成和纠错与结果文件生成两大模块。答案生成部分包括大模型的处理函数、大模型返回结果抽取、多线程处理及答案生成的启动，代码核心是大模型部分。纠错与结果生成部分存在的目的是由于目前使用了API调用在线开源大模型，因为网络、模型能力等原因会导致有一些结果会出现缺失。（比如大模型回答时，没有明确给出ABCD的结果，而返回的空值。也有时因为网络retry模块机会使用结束后，依然没有提取到结果会跳过某个问题。

2024-07-30 21:00:21 569

原创 Datawhale AI夏令营 AI+逻辑推理 Task1总结

赛事链接：http://competition.sais.com.cn/competitionDetail/532231/format赛事内容：该比赛聚焦于通过解决复杂的逻辑推理题，测试大型语言模型的逻辑推理能力，这些逻辑题涵盖了多种关系和推理规则，能够全面评估模型的逻辑推理能力，在赛题设置上，采用了多样化的逻辑题，覆盖了不同难度的逻辑推理任务，强调了逻辑推理在AI领域的重要性。

2024-07-28 21:12:18 507

原创 fastapi实例

跳转到http://127.0.0.1:8080/docs，就可以看到自动生成的交互式api文档。

2024-06-06 21:36:16 284

原创 fastapi学习前置知识点

http协议是Hyper Text Transfer Protocol（超文本传输协议）的缩写，是用于万维网服务器与本地浏览器之间传输超文本的传送协议。http是一个应用层的面向对象的协议，由于其简洁、快速的方式，适用于分布式超媒体信息系统。浏览器作为http客户端通过URL向http服务端即web服务器发送所有请求，web服务器根据收到的请求，向客户端发送响应信息。

2024-06-06 21:34:13 947

原创软件设计师基础知识难点总结

对其余的原因，选择可能性最大的，利用已有的数据完善该假设，使假设更具体。在该方法中，如果已经知道程序中的变量在若干位置的正确取值，可以在这些位置上给这些变量以正确值，观察程序运行输出结果，如果没有发现问题，则说明从赋予变量一个正确值到输出结果之间的程序没有错误，问题可能在除此之外的程序中。当I/0系统准备好以后，则发出中断请求信号通知CPU，CPU接到中断请求信号后，保存正在执行的程序的现场，转入I/0中断服务程序的执行，完成于I/0系统的数据交换，然后再返回被打断的程序继续执行。

2024-05-26 14:24:41 1187

原创基于AutoDL部署和微调Chatglm3-6b实战

选用AutoDL平台进行部署，租用GPU型号建议选用一张4090，显存一定要选用24G的，CUDA版本尽量选最新的。完成服务器的租用和环境搭建后，选择快捷工具中的“JupyterLab”进入服务器查看。autodl-tmp文件夹为数据盘，后续将模型及模型权重下载到这个文件夹中。

2024-05-17 18:18:06 2110 5

原创 LLM记录1

是否存在另外一种选择，例如大语言模型，就发挥它的“词语接龙”的语言能力，用于对指令的理解意图和生成自然语言式的结果，而其中关键的内在专业逻辑或事实，则由外部知识库来提供，不要由大语言模型来“推理”，这样就将纯专业知识交给外挂知识库来管理，大语言模型则重点提升语言相关的能力，不断增强特定的话术和表达方式。大语言模型的基础是机器学习，属于归纳法，要从海量的数据中发现规律，结果的可靠性、可解释性是它正在努力解决的问题，那么对于已经解决了这些问题的结构化的数据，如果重新混入大模型当中，则被认为是一种倒退，是损失。

2024-04-04 22:29:06 328

原创 LangChain核心模块——Agents

Agents的核心思想是使用语言模型来选择要采取的一系列操作。在Chains中，一系列操作被硬编码（在代码中）。在Agents中，语言模型被用作推理引擎来确定要采取哪些操作以及按什么顺序。

2024-04-04 22:22:40 2431 1

原创 LangChain使用实例——Query analysis

“Search”为许多用例提供支持——包括检索增强生成的“检索”部分。最简单的方法是将用户问题直接传递给检索器。为了提高性能，还可以使用“query analysis”以某种方式“优化”查询。传统上，这是通过基于规则的技术来完成的，但随着LLM的兴起，使用LLM来实现这一点变得越来越流行而且更加可行。具体来讲，这涉及将原始问题（或消息列表）传递到LLM并返回一个或多个优化查询，这些查询通常包含一个字符串和可选的其他结构化信息。

2024-03-31 14:47:54 1301

原创 LangChain使用实例——RAG

LLMs支持的最强大的应用程序之一是复杂的问答 (Q&A) 聊天机器人，这些应用程序可以回答有关特定源信息的问题，使用一种称为（RAG）的技术。

2024-03-27 10:13:44 2139

原创 LangChain核心模块 Retrieval——Indexing

最重要的是，Indexing API 甚至可以处理相对于原始源文档经历了多个转换步骤（例如，通过文本分块）的文档。

2024-03-25 10:04:38 1130

原创 LangChain核心模块 Retrieval——Retrievers

数据进入数据库，仍然需要检索，LangChain支持多种检索算法。LangChain支持易于上手的基本方法——即简单语义搜索。然而，我们还在此基础上添加了一系列算法以提高性能。检索器是一个接口，它根据非结构化查询返回文档，它比矢量存储更通用。检索器不需要能够存储文档，只需返回（或检索）它们即可。矢量存储可以用作检索器的骨干，但也有其他类型的检索器。检索器接受字符串查询作为输入，并返回文档列表作为输出。

2024-03-25 10:03:54 4391 1

原创 LangChain核心模块 Retrieval——文本嵌入模型、Vector stores

Embeddings创建一段文本的矢量表示，这样我们就可以在向量空间中思考文本，并执行语义搜索之类的操作，在向量空间中查找最相似的文本片段。存储和搜索非结构化数据的最常见方法之一是将其嵌入，并存储生成的嵌入向量，然后在查询时嵌入非结构化查询并检索与嵌入查询“最相似”的嵌入向量。支持缓存的嵌入器是嵌入器的包装器，它将嵌入缓存在键值存储中。将它们作为两种单独方法的原因是，某些嵌入提供程序对文档（要搜索的）与查询（搜索查询本身）有不同的嵌入方法。嵌入单个查询，嵌入一段文本是为了与其他嵌入的文本进行比较。

2024-03-24 17:02:34 1363

原创 LangChain核心模块 Retrieval——文本分割

是一个“结构感知”分块器，它在元素级别拆分文本，并为每个与任何给定块“相关”的标题添加元数据。这样做的效果是尝试将所有段落（然后是句子，然后是单词）尽可能长时间地放在一起，因为这些通常看起来是语义相关性最强的文本片段。“语义相关”的含义可能取决于文本的类型。在较高层次上，它会分成句子，然后分成 3 个句子为一组，然后合并嵌入空间中相似的句子。检索的关键部分时仅获取文档的相关部分，主要任务之一是将大文档分割为更小的块。最简单的例子是，将长文档分割成更小的块，以适合模型的上下文窗口。

2024-03-24 12:36:05 1873

原创 LangChain核心模块 Retrieval——文档加载器

许多LLM申请需要用户的特定数据，这些数据不属于模型训练集的一部分，实现这一目标的主要方法是RAG(检索增强生成)，在这个过程中，将检索外部数据，然后在执行生成步骤时将其传递给LLM。 LangChain 提供了 RAG 应用程序的所有构建模块 - 从简单到复杂。文档的这一部分涵盖了与检索步骤相关的所有内容 - 例如数据的获取。

2024-03-24 12:34:14 1568

原创 LangChain核心模块 Model I/O——Output Parsers

输出解析器负责获取 LLM 的输出并将其转换为更合适的格式。输出解析器是帮助构建语言模型响应的类。

2024-03-23 12:50:55 389

原创 LangChain核心模块 Model I/O——LLMs

Large Language Models (LLMs) 是LangChain的核心组件，LangChain不为自己的LLMs提供服务，而是提供一个标准接口来与许多不同的LLMs进行交互。具体来说，该接口是以字符串作为输入并返回字符串的接口。

2024-03-23 12:49:21 627

原创 LangChain核心模块 Model I/O——Chat Models

流支持默认返回单个值的迭代器（或异步流情况下的 AsyncIterator），即底层 ChatModel 提供程序返回的最终结果。这显然不会为您提供逐个令牌的流式传输，这需要 ChatModel 提供商的本机支持，但确保需要令牌迭代器的代码可以适用于我们的任何 ChatModel 集成。对于原型设计非常有用，但不允许实现您可能想要从聊天模型中获得的所有功能，但它实现起来很快，如果您需要更多功能，您可以过渡到。许多模型实现了帮助器方法，这些方法将负责格式化不同的类似函数的对象并将其绑定到模型。

2024-03-23 12:47:05 1766

原创 LangChain核心模块 Model I/O——Prompts

模板可以包括说明、少量示例以及适合给定任务的特定上下文和问题，LangChain提供了创建和使用提示模板的工具，LangChain致力于创建与模型无关的模板，以便能够轻松地跨不同语言模型重用现有模板。语言模型的提示是用户提供的一组指令或输入，用于指导模型的响应，帮助模型理解上下文并生成相关且连贯的基于语言的输出，例如回答问题、完成句子或参与某项活动。在此管道中，每个新元素都是最终提示中的一条新消息。“部分”提示模板是有意义的 - 例如传入所需值的子集，以创建一个新的提示模板，该模板仅需要剩余的值子集。

2024-03-23 12:45:26 1783

原创 LangChain核心模块 Model I/O——相关概念

LangChain 集成的模型主要有两种类型：LLMs 和Chat Models。它们由它们的输入和输出类型定义。它们由它们的输入和输出类型定义。LLMsLangChain中的LLMs指的是纯文本补全模型，它们包装的 API 将字符串提示作为输入并输出字符串完成。Chat Models通常由LLMs支持，但专门针对对话进行了调整。最重要的是，它们的API使用与纯文本完成模型不同的接口。不再使用单个字符串，而是将聊天消息列表作为输入，并返回 AIMessage作为输出。

2024-03-23 12:43:46 812

原创 LangChain核心模块 Model I/O

任何语言模型应用程序的核心元素都是。LangChain 为您提供了与任何语言模型交互的构建块。

2024-03-23 12:42:01 391

原创 LangChain表达式LCEL(六）

最常见和最有价值的组合是：->LLMChatModel->几乎任何其它链都会使用这个构建块。

2024-03-20 19:33:34 1267

原创 LangChain表达式LCEL(五）

RunnableParallel 对于非常有用。这里提示的输入应该是一个带有“context”和“question”键的地图。用户输入只是问题。因此，我们需要使用检索器获取上下文，并通过“question”键下的用户输入。请注意，当将 RunnableParallel 与另一个 Runnable 组合时，我们甚至不需要将字典包装在 RunnableParallel 类中 - 类型转换已为我们处理。

2024-03-19 22:24:52 1329

原创 LangChain表达式LCEL(四）

流式处理对于基于 LLM 的应用程序对最终用户的响应至关重要，重要的 LangChain 原语，如 LLMs、解析器、提示、检索器和代理实现了 LangChain Runnable 接口。

2024-03-19 22:24:17 1143

原创 LangChain表达式LCEL(三）

为了尽可能简化创建自定义链的过程，我们实现了一个“Runnable”协议，这是一个标准接口，可以轻松定义自定义链并以标准方式调用它们。streaminvokebatchastreamainvokeabatch和所有可运行对象都公开输入和输出的：创建一个简单的PromptTemplate + ChatModel链。

2024-03-18 22:06:22 1611

原创 LangChain表达式LCEL(二）

LCEL通过提供以下功能，使得从基本组件构建复杂链变得容易。Runnableinvokebatchstreamainvoke：简单的提示+模型链。

2024-03-18 22:04:35 423

原创 LangChain表达式LCEL(一）

LangChain表达式语言(LCEL)是一种声明式的方式，可以将链条组合在一起。LCEL从一开始就被设计为。

2024-03-17 21:44:19 1159

原创 LangChain模块介绍

构建私域知识库时所用到的Data，更多是强调怎么把外部的数据获取进过来，并存储到一个地方，然后基于这个地方再进行相关的搜索或数据提取，因此在这个步骤有不同的参与方，再把各个参与方进行不同的串联或组合。用来给对话形式的model存储对话的历史记录，还可以将历史记录重新的灌入到对话中。串联Model I/O、Data Connections、Memory。顾名思义，LangChain提供了回调能力，做日志记录、调用链路的追踪。不仅会把计划列出来，还会去执行这些计划。Agent的灵魂，可以实时搜索并做总结。

2024-03-17 15:54:11 1374

原创 LangChain快速入门

LangChain应用程序的核心构建模块是LLMChain。

2024-03-17 15:34:34 507

原创 Neo4j Admin管理员

在Neo4j数据库中，CQL CREATE命令始终创建新的节点或关系，这意味着即使您使用相同的值，它也会插入一个新行。我们应该使用一些数据库约束来创建节点或关系的一个或多个属性的规则。Neo4j SQL支持节点或关系属性上的索引，以提高应用程序的性能。可以为具有相同标签名称的所有节点的属性创建索引，也可以在MATCH或WHERE或IN运算符上使用这些索引列来改进CQL Command的执行。如果数据库中要建立约束的属性值的节点/关系存在重复，则不能建立UNIQUE约束。上述语法表示它在节点或关系的。

2024-03-13 20:43:41 447

原创 Neo4j CQL函数

和SQL一样，Neo4j CQL提供了一些在RETURN子句中使用的聚合函数，类似于SQL中的GROUP BY子句。Neo4j CQL提供了一组关系函数，以在获取开始节点，结束节点等细节时知道关系的细节。可以使用MATCH命令中的RETURN +聚合函数来处理一组节点并返回一些聚合值。：可以是来自Neo4j数据库的节点或关系的属性名称。所有CQL函数应使用“()”括号。STARTNODE和ENDNODE。接受一个字符串作为输入和两个索引。AGGREGATION聚合。

2024-03-13 20:42:49 410

原创 Neo4j CQL（下）

MERGE命令在图中搜索给定模式，如果存在，则返回结果，如果不存在于图中，则它创建新的节点/关系并返回结果。：如果这两个查询不返回相同的列名和数据类型，那么它就会抛出错误。：结果列类型和来自两组结果的名称必须匹配，也就是说，列名称应该相同，列的数据类型应该相同。：结果列类型，并且两个结果集的名字必须匹配，即列名称相同，列数据类型相同。结合并返回两个结果集的所有行成一个单一的结果集，还返回两个节点重复行。LIMIT子句过滤或限制查询返回的行数，修剪CQL查询结果集。的结果，应该使用SKIP子句。

2024-03-13 20:41:48 427

原创 Neo4j CQL（上）

像Oracle数据库具有查询语言SQL，Neo4j具有CQL作为查询语言。CQL代表Cypher查询语言。Neo4j CQLNeo4j图形数据库的查询语言一种声明性模式匹配语言遵循SQL语法。

2024-03-12 22:27:03 625 1

原创 Neo4j中创建关系的常用操作

Neo4j图数据库遵循属性图模型来存储和管理其数据。根据属性图模型，关系应该是定向的。

2024-03-12 21:31:20 2227

原创 Neo4j基础

Neo4j图数据库遵循来存储和管理其数据。属性图模型表示节点、关系和属性中的数据。其中，节点和关系都包含属性，关系连接节点，属性是键值对，节点用圆圈表示，关系用方向键表示，关系具有单向和双向两个方向，每个关系包含“开始节点”或“从节点”和“到节点”或“结束节点”，关系应该是定向的。在Neo4j中，关系应该是有方向性的。Neo4j图数据库将所有数据存储在节点和关系中，不需要任何额外的RDBMS数据库或无SQL数据库来存储Neo4j数据库数据，并以图形的形式存储其数据的本机格式。

2024-03-12 19:39:24 1072

原创机器学习理论_吃瓜系列1：基本概念

机器学习理论_吃瓜系列1：基本概念1.机器学习2.基本术语3.假设空间4.模型评估与选择（1）过拟合（2）评估方法（3）性能度量参考资料1.机器学习机器学习致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。其研究的主要内容是关于在计算机上从数据产生“模型”的算法，即“学习算法”，然后利用学习算法基于经验数据产生模型，面对新的情况，模型会提供相应的判断。例如在用机器学习挑好瓜时，我们只需要找到一定的样品，记录每个西瓜的特征（色泽、根蒂等），并记录下这个西瓜是否为好瓜，将这些数据提供给学习算法

2022-01-11 20:51:33 1171

weixin_43787408的博客