人工智能小豪-CSDN博客

这是一个 LLMChain，用于根据剧目的标题撰写简介python复制代码# 这是一个 LLMChain，用于根据剧目的标题撰写简介。template = """你是一位剧作家。根据戏剧的标题，你的任务是为该标题写一个简介。标题：{title}剧作家：以下是对上述戏剧的简介："""python复制代码# 这是一个LLMChain，用于根据剧情简介撰写一篇戏剧评论。template = """你是《纽约时报》的戏剧评论家。根据剧情简介，你的工作是为该剧撰写一篇评论。

2024-05-14 20:20:52 791

原创 OpenAI重磅发布 GPT-4o！向免费客户开放，GPT-4o官方使用指南分享

GPT-4o 中的“o”代表“omni”——指的是 GPT-4o 的。。GPT-4o 是 OpenAI 昨天晚上发布的新旗舰模型，可以实时推理音频、视觉和文本。这里特意为你准备的“GPT-4o官方使用指南”，帮助任何想使用GPT-4o希望你会喜欢哦😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓但是，注意我要说但是了！我一早起床就打开了ChatGPT，一看左上角模型居然还是 3.5！这是咋回事啊，不是说好了免费用 GPT4，莫不是网站还没更新😅？

2024-05-14 20:19:43 395

原创大模型应用的最佳实践Chains, Chain代码剖析、llmchain示例

大模型应用的最佳实践Chains, Chain代码剖析、llmchain示例

2024-05-14 20:17:57 690

原创 RAG (检索增强生成)技术详解：揭秘基于垂直领域专有数据的Chatbots是如何实现的

RAG (检索增强生成)技术详解：揭秘基于垂直领域专有数据的Chatbots是如何实现的

2024-05-13 10:48:07 591

原创大模型的幻觉 (Hallucination) 因何而来？如何解决幻觉问题？

为什么 LLM 会出现幻觉？如何缓解这种情况？使用的数据集对此现象的影响几何？本文将为您一一解答。

2024-05-13 10:46:58 879

原创 LLM评估：通过7大指标监测并评估大语言模型的表现

自然语言处理（Natural Language Processing）领域在大语言模型（LLM）的使用下迅速发展。因为其出色的文本生成和理解能力，LLM 已在全球范围内得到广泛应用。

2024-05-13 10:45:44 876

原创 AI 有情感吗？语气或基调对 AI 生成文本的影响有多大

AI 有情感吗？这是一个老生常谈的问题。我可以给出的回答是，AI 有没有情感，取决于你要不要让它有情感，而这就涉及到本文的主题：语气或者说基调（Tone）。

2024-05-11 17:35:21 265

原创只用 5 步，每个人都能写出精准的 Prompt

虽然 AI 有可能胡说八道，而且，可以说是很多场景下，都会输出一些毫无关联的内容，但是通过精心设计Prompt，可以大大提高输出内容的准确性。

2024-05-11 17:34:11 241

原创 AI 入门：从 ChatGPT 开始

在信息泛滥的时代，AI 技术已经渗透到生活的各个方面，学习 AI 成为个人发展的必然趋势。而 ChatGPT 作为 AI 领域的佼佼者，无疑是开启学习之旅的最佳起点。它不仅提供了一个便捷的交流平台，更能显著提升信息处理效率。

2024-05-11 17:32:38 273

原创大模型入门（八）—— Llama2论文简读

大语言模型 (LLM) 作为功能强大的人工智能助手展现出了巨大的前景，它们擅长完成需要跨领域专业知识的复杂推理任务，包括编程和创意写作等专业领域。它们通过简单直观的聊天界面与人类互动，让大预言模型快速地被推广。

2024-05-10 09:00:00 945

原创大模型入门（七）—— RLHF中的PPO算法理解

本文主要是结合PPO在大模型中RLHF微调中的应用来理解PPO算法。

2024-05-10 08:30:00 593

原创大模型入门（六）—— RLHF微调大模型

奖励模型是输入一个文本序列，模型给出符合人类偏好的奖励数值，这个奖励数值对于后面的强化学习训练非常重要。构建奖励模型的训练数据一般是同一个数据用不同的语言模型生成结果，然后人工打分。如果是训练自己领域的RLHF模型，也可以尝试用chatgpt打分，效果也不错。

2024-05-10 07:15:00 898

原创大模型入门（五）—— 基于peft微调ChatGLM模型

ChatGLM 是基于架构，针对中文问答和对话进行了优化。经过中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术，ChatGLM因为是中文大模型，在中文任务的表现要优于LLaMa，我在一些实体抽取的任务中微调ChatGLM-6B，都取得了很不错的效果。在微调ChatGLM之前，先简单地了解下它的基础模型GLM，GLM也是基于transformer架构的，在训练任务上构造了自回归的空格填充任务，具体的训练流程如下图所示：a) 随机抽取句子中的一些片段。

2024-05-09 15:00:50 718

原创大模型入门（四）—— 基于peft 微调 LLaMa模型

llama-7b模型大小大约27G，本文在单张/两张 16G V100上基于hugging face的peft库实现了llama-7b的微调。

2024-05-09 09:45:00 1429

原创大模型入门（三）—— 大模型的训练方法

随着现在的模型越来越大，训练数据越来越多时，单卡训练要么太慢，要么无法存下整个模型，导致无法训练。当你拥有多张GPU（单机多卡，多机多卡）时，你就可以通过一些并行训练的方式来解决你的问题。

2024-05-09 07:45:00 896

原创大模型入门（二）—— PEFT

PEFT（Parameter-Efficient Fine-Tuning）是hugging face开源的一个参数高效微调大模型的工具，里面集成了4中微调大模型的方法，可以通过微调少量参数就达到接近微调全量参数的效果，使得在GPU资源不足的情况下也可以微调大模型。

2024-05-08 14:32:34 603

原创大模型入门（一）—— LLaMa/Alpaca/Vicuna

LLaMa模型是Meta开源的大模型，模型参数从7B到65B不等，LLaMa-7B在大多数基准测试上超过了GPT3-173B，而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说，LLaMa可能效果上还有差距，但相比Closed AI，至少LLaMa论文和模型都开源出来了，目前hugging face已集成了LLaMa的代码实现和开源模型。学术界和工业界都可以在此基础上进行学习和研究。

2024-05-08 14:31:26 659

原创 Windows PC上从零开始部署ChatGML-6B-int4量化模型

ChatGLM-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布的一个开源的对话机器人。6B表示这是ChatGLM模型的60亿参数的小规模版本，约60亿参数。

2024-05-07 15:07:57 1174 1

原创一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

近日，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2，主打训练成本更低、推理更加高效。

2024-05-07 15:06:35 381

原创 RAG 修炼手册｜如何评估 RAG 应用？

如果你是一名用户，拥有两个不同的 RAG 应用，如何评判哪个更好？对于开发者而言，如何定量迭代提升你的 RAG 应用的性能？

2024-05-06 20:59:49 1004

原创 LangChain Agent最全教程学习

LangChain Agent的终极指南，本教程是您使用 Python 创建第一个agent的重要指南，请立即开始你的 LLM 开发之旅。

2024-05-06 20:46:06 1349

原创 LLM大模型之LCEL表达式语言

LangChain 表达式语言（LCEL）是一种声明式的方法，可以轻松地将多个链条组合在一起。LCEL 从第一天开始设计就支持将原型投入生产，无需进行代码更改，从最简单的“提示 + LLM”链条到最复杂的链条（我们见过人们在生产中成功运行包含数百个步骤的 LCEL 链条）。一流的流式支持当您使用 LCEL 构建链条时，您将获得最佳的首个令牌时间（即输出的第一块内容出现之前的经过时间）。

2024-05-05 15:07:56 605

原创 LLM大模型之快速入门Agent

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。天道酬勤，你越努力，就会成为越优秀的自己。

2024-05-05 15:06:54 680

原创【AI大模型应用开发】【补充知识】文本向量化与向量相似度（含Python代码）

【AI大模型应用开发】【补充知识】文本向量化与向量相似度（含Python代码）

2024-05-04 09:00:00 890

原创【AI大模型应用开发】3. RAG初探 - 动手实现一个最简单的RAG应用

【AI大模型应用开发】3. RAG初探 - 动手实现一个最简单的RAG应用

2024-05-03 09:00:00 569

空空如也

空空如也