自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(243)
  • 收藏
  • 关注

原创 从零训练Bert架构大模型

本文章不是模型微调,是从零构架大模型,是基于Bert架构的。 本文主要分两块,一个是tokenizer的构建。二是模型的构建和训练

2024-05-22 18:28:26 118

原创 大模型应用开发之个人AI助理

随着大模型的进一步发展,全民AI的脚步越来越近,如何应用是个问题,笔者认为个人AI 助理是个不错的应用场景,后续每个人都有自己的AI 助理,让所有人的生活更舒适,工作更有效率。

2024-05-22 18:27:36 252

原创 传统产品经理&AI产品经理

随着科技的发展,技术的革新,AI技术当今已经渗入到各个行业里边,身处其中的产品经理也面临的新的挑战和机遇,下面是笔者整理分享的关于传统的产品经理如何顺应时代发展,成功转换成AI产品经理的相关内容,大家一起往下看。

2024-05-20 11:32:54 621

原创 大模型何去何从?

大模型的未来发展方向是怎么样的?这篇文章里,作者分享了几条主线,并围绕这些主线做了一些思考和分析,不妨来看一下。

2024-05-20 11:30:53 578

原创 产品经理必须懂得AI:AI Agent代理的是人和AI之间的关系

人工智能与人类之间的关系发生了一定演变,在这个过程中,AI Agent这一概念也慢慢出现了,相关的AI代理技术也引发了不少人的关注。

2024-05-20 11:28:21 399

原创 大语言模型在数字化营销中的应用与实践

大模型的出现帮助许多领域实现了能力上的突破,比如在数字化营销领域,我们可以借助大模型的能力来优化业务,这篇文章里,作者简要介绍了相应信息,一起来看。

2024-05-18 14:03:19 977

原创 产品经理解析:怎样去教会大模型使用工具?

大家或许会高估了模型的能力,低估了工程落地可用的难度。本文将聚焦在解决”无法调用外部工具“的问题上,将学习总结到的方案,以产品视角用综述方式总结分享,希望对你有所帮助。

2024-05-18 14:01:51 963

原创 一套方法论让你彻底掌握:大模型用户画像与指引

本文将通过使用多维帮助体系结合角色分层灵活、快速的设计出符合不同操作水平的用户指引的功能设计。从用户使用难点到,设计策略,到执行落地具体介绍,旨在降低用户学习成本、提高用户满意度,并引导用户掌控产品的核心能力为出发点。

2024-05-18 13:50:18 562

原创 【LLM】Gemma:最新轻量级开源大语言模型实践

【LLM】Gemma:最新轻量级开源大语言模型实践

2024-05-17 16:29:02 576

原创 AI时代智能体简介及场景分析

大型语言模型 (LLM) 已经席卷了 AI 世界。如果这些强大的语言处理器不仅会说话,还会思考和推理呢?欢迎来到LLM Agents(又叫智能体),这是一波新的人工智能助手,准备改变我们与计算机的交互方式。

2024-05-17 16:27:36 684

原创 【RAG】六步学习检索增强(RAG),打造你的私域助理

每个人似乎都在担心人工智能会如何夺走我们的工作。但令人惊讶的是,很少有人真正了解在实际环境中使用人工智能模型的基本方面。

2024-05-17 16:06:19 832

原创 生成式 AI 术语指南:带有配图说明,没有数学公式

生成式 AI 术语指南:带有配图说明,没有数学公式

2024-05-16 15:53:38 209

原创 微调语言模型前,需要考虑这三个关键方面

目前,市场正处于LLMs(大语言模型)和生成式人工智能的风口上。IBM的一项数据显示,将近三分之二的企业高管感受到了来自投资者的压力——要求他们加快使用生成式人工智能。自然而然,这种压力也传导到了数据科学和机器学习团队,他们肩负着抓住机遇、成功应用生成式AI的重任。

2024-05-16 15:46:20 702

原创 RAG (检索增强生成)技术详解:揭秘基于垂直领域专有数据的Chatbots是如何实现的

RAG (检索增强生成)技术详解:揭秘基于垂直领域专有数据的Chatbots是如何实现的

2024-05-16 15:44:51 358

原创 大模型应用的最佳实践Chains, RouterChain、Transform Chain使用示例

大模型应用的最佳实践Chains, RouterChain、Transform Chain使用示例

2024-05-15 08:30:00 898

原创 大模型应用的最佳实践Chains, SequentialChain使用示例

这是一个 LLMChain,用于根据剧目的标题撰写简介python复制代码# 这是一个 LLMChain,用于根据剧目的标题撰写简介。template = """你是一位剧作家。根据戏剧的标题,你的任务是为该标题写一个简介。标题:{title}剧作家:以下是对上述戏剧的简介:"""python复制代码# 这是一个LLMChain,用于根据剧情简介撰写一篇戏剧评论。template = """你是《纽约时报》的戏剧评论家。根据剧情简介,你的工作是为该剧撰写一篇评论。

2024-05-14 20:20:52 791

原创 OpenAI重磅发布 GPT-4o!向免费客户开放,GPT-4o官方使用指南分享

GPT-4o 中的“o”代表“omni”——指的是 GPT-4o 的。。GPT-4o 是 OpenAI 昨天晚上发布的新旗舰模型,可以实时推理音频、视觉和文本。这里特意为你准备的“GPT-4o官方使用指南”,帮助任何想使用GPT-4o希望你会喜欢哦😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓但是,注意我要说但是了!我一早起床就打开了ChatGPT,一看左上角模型居然还是 3.5!这是咋回事啊,不是说好了免费用 GPT4,莫不是网站还没更新😅?

2024-05-14 20:19:43 395

原创 大模型应用的最佳实践Chains, Chain代码剖析、llmchain示例

大模型应用的最佳实践Chains, Chain代码剖析、llmchain示例

2024-05-14 20:17:57 690

原创 RAG (检索增强生成)技术详解:揭秘基于垂直领域专有数据的Chatbots是如何实现的

RAG (检索增强生成)技术详解:揭秘基于垂直领域专有数据的Chatbots是如何实现的

2024-05-13 10:48:07 591

原创 大模型的幻觉 (Hallucination) 因何而来?如何解决幻觉问题?

为什么 LLM 会出现幻觉?如何缓解这种情况?使用的数据集对此现象的影响几何?本文将为您一一解答。

2024-05-13 10:46:58 879

原创 LLM评估:通过7大指标监测并评估大语言模型的表现

自然语言处理(Natural Language Processing)领域在大语言模型(LLM)的使用下迅速发展。因为其出色的文本生成和理解能力,LLM 已在全球范围内得到广泛应用。

2024-05-13 10:45:44 876

原创 AI 有情感吗?语气或基调对 AI 生成文本的影响有多大

AI 有情感吗?这是一个老生常谈的问题。我可以给出的回答是,AI 有没有情感,取决于你要不要让它有情感,而这就涉及到本文的主题:语气或者说基调(Tone) 。

2024-05-11 17:35:21 265

原创 只用 5 步,每个人都能写出精准的 Prompt

虽然 AI 有可能胡说八道,而且,可以说是很多场景下,都会输出一些毫无关联的内容,但是通过精心设计Prompt,可以大大提高输出内容的准确性。

2024-05-11 17:34:11 241

原创 AI 入门:从 ChatGPT 开始

在信息泛滥的时代,AI 技术已经渗透到生活的各个方面,学习 AI 成为个人发展的必然趋势。而 ChatGPT 作为 AI 领域的佼佼者,无疑是开启学习之旅的最佳起点。它不仅提供了一个便捷的交流平台,更能显著提升信息处理效率。

2024-05-11 17:32:38 273

原创 大模型入门(八)—— Llama2论文简读

大语言模型 (LLM) 作为功能强大的人工智能助手展现出了巨大的前景,它们擅长完成需要跨领域专业知识的复杂推理任务,包括编程和创意写作等专业领域。 它们通过简单直观的聊天界面与人类互动,让大预言模型快速地被推广。

2024-05-10 09:00:00 945

原创 大模型入门(七)—— RLHF中的PPO算法理解

本文主要是结合PPO在大模型中RLHF微调中的应用来理解PPO算法。

2024-05-10 08:30:00 593

原创 大模型入门(六)—— RLHF微调大模型

奖励模型是输入一个文本序列,模型给出符合人类偏好的奖励数值,这个奖励数值对于后面的强化学习训练非常重要。构建奖励模型的训练数据一般是同一个数据用不同的语言模型生成结果,然后人工打分。如果是训练自己领域的RLHF模型,也可以尝试用chatgpt打分,效果也不错。

2024-05-10 07:15:00 898

原创 大模型入门(五)—— 基于peft微调ChatGLM模型

ChatGLM 是基于架构,针对中文问答和对话进行了优化。经过中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,ChatGLM因为是中文大模型,在中文任务的表现要优于LLaMa,我在一些实体抽取的任务中微调ChatGLM-6B,都取得了很不错的效果。在微调ChatGLM之前,先简单地了解下它的基础模型GLM,GLM也是基于transformer架构的,在训练任务上构造了自回归的空格填充任务,具体的训练流程如下图所示:a) 随机抽取句子中的一些片段。

2024-05-09 15:00:50 718

原创 大模型入门(四)—— 基于peft 微调 LLaMa模型

llama-7b模型大小大约27G,本文在单张/两张 16G V100上基于hugging face的peft库实现了llama-7b的微调。

2024-05-09 09:45:00 1429

原创 大模型入门(三)—— 大模型的训练方法

随着现在的模型越来越大,训练数据越来越多时,单卡训练要么太慢,要么无法存下整个模型,导致无法训练。当你拥有多张GPU(单机多卡,多机多卡)时,你就可以通过一些并行训练的方式来解决你的问题。

2024-05-09 07:45:00 896

原创 大模型入门(二)—— PEFT

PEFT(Parameter-Efficient Fine-Tuning)是hugging face开源的一个参数高效微调大模型的工具,里面集成了4中微调大模型的方法,可以通过微调少量参数就达到接近微调全量参数的效果,使得在GPU资源不足的情况下也可以微调大模型。

2024-05-08 14:32:34 603

原创 大模型入门(一)—— LLaMa/Alpaca/Vicuna

LLaMa模型是Meta开源的大模型,模型参数从7B到65B不等,LLaMa-7B在大多数基准测试上超过了GPT3-173B,而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说,LLaMa可能效果上还有差距,但相比Closed AI,至少LLaMa论文和模型都开源出来了,目前hugging face已集成了LLaMa的代码实现和开源模型。学术界和工业界都可以在此基础上进行学习和研究。

2024-05-08 14:31:26 659

原创 Windows PC上从零开始部署ChatGML-6B-int4量化模型

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。6B表示这是ChatGLM模型的60亿参数的小规模版本,约60亿参数。

2024-05-07 15:07:57 1174 1

原创 一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。

2024-05-07 15:06:35 381

原创 RAG 修炼手册|如何评估 RAG 应用?

如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?

2024-05-06 20:59:49 1004

原创 LangChain Agent最全教程学习

LangChain Agent的终极指南,本教程是您使用 Python 创建第一个agent的重要指南,请立即开始你的 LLM 开发之旅。

2024-05-06 20:46:06 1349

原创 LLM大模型之LCEL表达式语言

LangChain 表达式语言(LCEL)是一种声明式的方法,可以轻松地将多个链条组合在一起。LCEL 从第一天开始设计就支持将原型投入生产,无需进行代码更改,从最简单的“提示 + LLM”链条到最复杂的链条(我们见过人们在生产中成功运行包含数百个步骤的 LCEL 链条)。一流的流式支持当您使用 LCEL 构建链条时,您将获得最佳的首个令牌时间(即输出的第一块内容出现之前的经过时间)。

2024-05-05 15:07:56 605

原创 LLM大模型之快速入门Agent

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。天道酬勤,你越努力,就会成为越优秀的自己。

2024-05-05 15:06:54 680

原创 【AI大模型应用开发】【补充知识】文本向量化与向量相似度(含Python代码)

【AI大模型应用开发】【补充知识】文本向量化与向量相似度(含Python代码)

2024-05-04 09:00:00 890

原创 【AI大模型应用开发】3. RAG初探 - 动手实现一个最简单的RAG应用

【AI大模型应用开发】3. RAG初探 - 动手实现一个最简单的RAG应用

2024-05-03 09:00:00 569

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除