自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(158)
  • 收藏
  • 关注

原创 如何提升大模型RAG系统的效果?RAG推理增强

本文试图从几篇paper中提炼几个提升大模型RAG系统推理能力的方法:强大的基座模型01Base模型足够强大Retrieval-Augmented Generation,对于知识密集型任务来说,如果前半部分的Retrieval已经完成了使命,剩下的就是如何提升大模型结合知识更好回答问题的能力了。那么这部分的推理,其实,很大的比重都来自于大模型本身的推理能力了,所以其实这里可能还是个选型的工作。对于闭源API来说,GPT4-Turbo、Kimi Shot可能是个不错的选择;

2024-07-23 11:34:00 891

原创 大模型+编程,未来程序员躺平还是失业?

随着科技的飞速发展,大模型与编程技术的结合正在逐步改变着我们的世界。在这样的背景下,很多程序员开始担忧:未来的我们,是会“躺平”享受技术的红利,还是会因为技术变革而面临失业的风险?今天,就让我们一起探讨这个话题,看看在当下的社会发展行情中,程序员们应该如何应对。未来程序员究竟是躺平还是失业?自然语言大模型+编程可以更好地理解用户的需求,然后输出对应代码。

2024-07-23 11:27:06 301

原创 四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。有了这项技术,大模型(LargeLM)就能摇身一变,成为LongLM。近日,来自得克萨斯农工大学等机构的华人学者们发布了全新的大模型窗口扩展方法SelfExtended(简称SE)。在Mistral上,研究者在24k长度的文本中随机插入5位数字让模型搜索,结果经SE处理后,呈现出了全绿(通过)的测试结果。

2024-07-22 13:37:36 374

原创 你真的会使用大模型吗?—大模型六大提问技巧

​ 大模型的应用如今已越来越广泛,虽然和大模型对话非常符合我们的直觉,但是为了能够获得满意的回答,仍然有一些小技巧需要知晓。提问看起来是一件小事情,但在OpenAI官方文档中是以工程来命名的,即Prompt Engineering(提示词工程)。OpenAI官方文档中给出了6大提示词撰写技巧,龙宝做了一些归纳和整理,来一起学习一下吧。​ 大模型无法读懂我们的心思。因此如果对结果有较多的要求,那么在撰写提示词时也应该尽可能详细的把每条要求写出来。如果对结果有任何意见,可以直接提出修改要求。​。

2024-07-22 12:02:29 1328

原创 程序员转行大模型,真的是新时代的选择吗?

在2024年,程序员仍然是IT行业中备受追捧的职业。但随着技术的不断发展,就业市场对于程序员的技能要求也在不断变化。传统的编程技能虽然重要,但面对日新月异的人工智能技术,许多程序员开始思考如何转型,以适应市场的变化。许多程序员选择转行当下火热的大模型,这真的是新时代的正确选择么?答案是值得肯定的。

2024-07-21 10:00:00 610

原创 无需代码,使用LangFlow轻松创建LangChain大模型应用

大型语言模型正在重塑我们的应用开发。LangChain和LangFlow这样的工具简化了将这些模型融入实际应用的过程,其价值随着AI技术的进步而日益增加。无论是想构建一个复杂的人工智能应用,还是只想要探索大型语言模型的潜力,LangFlow都是一个非常值得考虑的资源。它不仅能够助力开发旅程,还能让你更深入地理解和利用这些前沿技术。​。

2024-07-20 09:00:00 1416

原创 免费!快速!干货!手把手教你如何在个人电脑上搭建你自己的大模型服务!

Ollama官网:https://ollama.com/Ollama的GitHub地址:https://github.com/ollama/ollamaOllama是一个“支持在本地快速部署大模型服务”的解决方案,目前已经支持了很多开源的大模型,如下图所示,其中包括了Meta开源的最知名的大模型Llama,其他比如Mistral等也是享誉业内:

2024-07-19 14:19:28 898

原创 AI产品经理 | 入行AI的必备知识

AI大模型从前年11月开始到现如今,非常火热,无论大厂还是创业新星都在为AI的落地搭建产品架构,并迅速跟进落地铺量,随着业务扩建,市面上也涌现出大量的大模型产品岗位。对于目前在看机会的如果想要入AI坑的话,产品经理要开始做哪些方面的准备工作呢?选择AI大模型的岗位本身也是在做职业的规划过程,对线上已有的公司提供的能力进行摸底调研有助于找准自己的兴趣点,并基于后续规划选择最为契合的岗位方向。按照产品服务的类型,市面上AI提供的品类主要有。

2024-07-19 14:14:55 777

原创 吴恩达揭秘:编程Agent如何革新软件开发行业

人工智能 (AI) 正以惊人的速度重塑着各行各业,软件开发领域也不例外。近年来,AI 驱动的编程助手如雨后春笋般涌现,极大地改变了开发者的工作方式,使他们能够以前所未有的效率和精度编写代码。在这些 AI 驱动的助手领域中,编程 Agent 正日益受到关注,并有望彻底改变我们构建软件的方式。作为 AI 领域的杰出人物,教授对编程 Agent 的兴起表示了极大的兴趣。他认为,编程 Agent 有潜力通过自动执行繁琐的任务、提高代码质量和加速开发周期来彻底改变软件开发行业。

2024-07-18 13:55:01 550

原创 第一本给程序员看的AI Agent图书上市了!<大模型应用开发 动手做 AI Agent>!!!

自从 ChatGPT 诞生以来,大模型技术在业界可谓炙手可热,人们从最初的惊叹到现在广泛应用,而人工智能的下一个引爆点很有可能就是 AI Agent。《大模型应用开发:动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。本书的一大特点是。

2024-07-18 13:44:04 1212

原创 零代码构建自己强大的Agent智能体,偷偷甩掉90%的人

Agent(智能体)的概念大家应该并不陌生了,今天分享通过可视化的方式构建各种各样强大的智能体。关于Agent的定义,我并不想引用官方正式的说法。而是按照我的理解通俗地解释一下。大模型好比是面粉,可以做出各种面食,虽然能解决温饱但不一定好吃。但如果面粉里加点糖,再加点鸡蛋就可以做成面包,既能解决温饱又好吃。Agent就是面包,本地知识库,联网检索等工具就相当于糖、鸡蛋。我理解的Agent就是这么简单。下面给大家上两盘我做的“面包”,所用到工具操作简单、开源、零代码。

2024-07-17 13:43:57 910

原创 AI Agent 在 1688 电商平台中的应用

01LLM 在电商的价值位首先来介绍大模型所赋予电商领域的一些新特性,AI 在电商模式下的应用,以及 1688 对 AIAgent 的探索。1. 大模型赋予的新特性在电商领域,AI 技术的应用涉及众多场景。通过抽象,归纳出大模型的六大基础能力:生成、总结、提取、改写、分类和检索。这些能力共同构成了 AIAgent 在电商环境中解决各种问题的基石。电商中的核心问题在于实现从感知到决策,再到内容生成的完整流程,这一流程需要持续迭代和交互。我们希望通过大模型来解决这一根本性问题,从而推动电商领域的智能化发展。2.

2024-07-17 13:42:06 1469

原创 RAG:在LangChain中使用本地向量embedding模型

向量模型是RAG系统中实现有效信息检索和生成的关键技术之一,它们使得系统能够处理复杂的语言理解任务,并生成更加准确和相关的输出。向量模型将文本转换为向量形式,便于在高维空间中进行快速的相似性检索,这是RAG系统中检索相关信息的基石。通过向量化,模型能够评估不同文本之间的语义相似度,即使在词汇不完全匹配的情况下也能找到语义相关的文档。向量模型帮助系统捕捉输入查询的上下文信息,这对于理解用户意图并检索最相关的信息至关重要。

2024-07-16 11:54:46 293

原创 开发RAG应用,你必须知道的7个Embedding模型

在自然语言处理(NLP)领域,Embedding模型是将文本数据转化为数值向量的核心技术,从而让计算机能够便捷地衡量文本间的语义关联,这种表示法已成为多种基础NLP任务的核心,如文本相似度判定、语义搜索、信息检索、文本重新排序、聚类以及作为下游任务的特征输入。

2024-07-16 11:51:00 1081

原创 手把手教你本地部署清华大模型 ChatGLM3

这是 ChatGPT 应用的访问 URL接着,在仓库目录下执行。

2024-07-15 14:05:29 1523

原创 腾讯多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法

在腾讯 2024 数字科技前沿应用趋势中,强调了“通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台当下多模态大模型不仅仅是学界新宠,也是未来行业发展进步的一大方向,站在这篇综述的基础之上,期待我们可以更快更好的理解未来多模态大模型的发展,赶上这波通用人工智能的新浪潮!

2024-07-15 14:02:54 907

原创 RAG:Langchain中使用自己的LLM大模型

在使用Langchain做RAG和Agent项目中,智能核心是LLM大语言模型;配置好模型是整个流程跑起来的关键。然而很多人初学者在为没有OpenAI的api-key而苦恼,在寻找代理或者替代品中花费了很多的时间。本篇文章将为大家介绍在langchain中使用自己大模型的方法,帮助大家扫清障碍快速搭建RAG和Agent流程。我们选择选择Qwen最新发布的Qwen2-0.5B-Instruct模型,模型可以提前下载好,也可以加载的时候下载。

2024-07-13 14:42:28 859

原创 搭建RAG系统就这么简单:LangChain|RAG是什么?

RAG是什么大模型通过RAG可以访问大量的外部知识库,这有助于提高模型回答问题的准确性和深度。由于大模型通常是在大量数据上预训练的,它们可能不包含最新的信息。RAG可以通过检索最新的数据来弥补这一点。通过检索可靠的信息源,RAG有助于减少模型生成的偏见或错误信息。RAG可以使模型在面对未见过的问题或领域时,通过检索相关信息来提高其泛化能力。对于那些低频或非常规的问题,RAG可以通过检索来提供更加准确的答案,而不需要模型在训练数据中直接学习到。

2024-07-13 14:39:51 702

原创 RAG还是微调?微软出了一份特定领域大模型应用建设流程指南

检索增强生成(RAG)和微调(Fine-tuning)是提升大语言模型性能的两种常用方法,那么到底哪种方法更好?在建设特定领域的应用时哪种更高效?微软的这篇论文供你选择时进行参考。在构建大语言模型应用程序时通常有两种常见的方法来整合专有和特定领域的数据:检索增强生成和微调。检索增强生成通过外部数据增强提示,而微调将额外的知识整合到模型本身中。不过,对这两种方法的优缺点了解的却不够充分。本文中,来自微软的研究者引入一个新的关注点:为需要特定背景和自适应响应的行业(农业)创建 AI 助手。

2024-07-12 13:50:55 703

原创 聊聊如何在内网下构建大模型微调环境

LlamaFactory新版更新后,还是比较方便,只是说llamafactory-cli命令的确是有点蒙,踩个坑就好了。对于LlamaFactory微调来说,本身不难,毕竟都是配置;主要是在内网环境下的依赖包拉取安装是真麻烦,但其实也还好。走一遍的话,还是可以学到很多的。​。

2024-07-12 13:45:39 1011 1

原创 AI Agent满级进化!骑马种田、办公修图,样样精通,昆仑万维等发布通用Agent新框架

近日,昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校机构,联合提出了迄今为止第一个既能玩多种商业游戏又能操作各种软件应用的AI框架——Cradle。在这个全新的通用计算机控制框架加持下,AI Agent无需训练便能像人一样直接控制键盘鼠标,不依赖任何内部API,实现任意开闭源软件交互。目前,Cradle的论文、项目、代码均已开源。论文地址:https://arxiv.org/abs/2403.03186项目主页:https://baai-agents.github.io/Crad

2024-07-12 13:38:59 1014

原创 研究突破:无矩阵乘法的LLMs 计算!

通过在推理过程中使用优化的内核,内存消耗可以比未优化模型减少超过10倍。🤯该论文总结道,有可能创建第一个可扩展的无矩阵乘法LLM,在数十亿参数规模上实现与最先进的Transformer相媲美的性能。另一篇最新论文《语言模型物理学:第3.3部分,知识容量缩放规律》发现,模型实际上每个参数只使用了大约2位数据。因此,这些二进制/三进制方法确实有意义。📌 提出的无矩阵乘法LLM用权重约束为{-1, 0, +1}的三进制累加代替了稠密层中的矩阵乘法操作,从而降低了计算成本和内存使用,同时保持了网络的表达能力。

2024-07-11 11:54:41 353

原创 LLMs可以进行任务规划吗?如果不行,LLMs+GNN可以吗?

大家好,今天向大家介绍一篇最新发布的研究论文(20240530)。这篇论文探讨了如何通过引入GNN来提高大模型在任务规划(task planning)中的性能。

2024-07-11 11:53:14 1301

原创 LLMs的基本组成:向量、Tokens和嵌入

编者按:随着人工智能技术的不断发展,大模型(语言、视觉,或多模态模型)已成为当今AI应用的核心组成部分。这些模型具有处理和理解自然语言等模态输入的能力,推动了诸如聊天机器人、智能助手、自动文本生成等各种应用的发展。理解LLMs背后的基本概念对于有效地利用和开发这些模型至关重要。

2024-07-11 11:46:46 343

原创 RAGFlow开源Star量破万,是时候思考下RAG的未来是什么了

搜索技术是计算机科学中最难的技术挑战之一,迄今只有很少一部分商业化产品可以把这个问题解决得很好。大多数商品并不需要很强的搜索,因为这和用户体验并没有直接关系。然而,随着 LLM 的爆炸性增长,每家使用 LLM 的公司都需要内置一个强大的检索系统,才能使得 LLM 可以真正为企业用起来,这就是 RAG (基于检索增强的内容生成)—— 通过搜索内部信息给 LLM 提供与用户提问最相关的内容,来帮助 LLM 做最终的答案生成。

2024-07-10 14:41:28 670

原创 LLama3最新医疗大模型安装与应用指南

为什么要介绍医疗模型,因为平时我们工作繁忙,可能身体不舒服会拖着到不得已的时候才到医院,特别是老年人怕麻烦,拖延更严重。如果有了这些模型,我们可以向这些模型提问,给一个初步的了解,同时也可以获取一些养生保健知识。因此这些模型是比较良心,造福人类的。

2024-07-10 14:39:10 616

原创 手把手教你轻松本地部署Llama3,个人电脑也能极速运行,快来试试!

是一个用于在本地计算机上运行大型语言模型(LLMs)的命令行工具。它允许用户下载并本地运行像Llama 3、Code Llama等模型,并支持自定义和创建自己的模型。,支持macOS和Linux操作系统和Windows系统。它还提供了官方的Docker镜像,使用户可以通过Docker容器部署大型语言模型,确保所有与模型的交互都在本地进行,无需将私有数据发送到第三方服务。理解了Ollama是什么之后,让我们到官网下载Ollama程序吧~因为我的电脑是windows, 所以这里我下载Windows这个版本。

2024-07-10 13:58:13 996

原创 文档图像处理:大模型的突破与新探索

文档图像处理是指通过计算机对文档图像进行分析和理解,实现自动化的信息提取和处理。文档图像可以是扫描件、照片或者其他形式的图像文件。文档图像处理可以包括文本识别、布局分析、实体关系理解、图像分割等任务。文档图像处理在许多领域都具有重要应用,例如自动化办公、金融、教育等。通过自动化处理,可以提高工作效率,减少人工错误,提供更快速、准确的信息检索和提取。

2024-07-09 11:38:13 671

原创 一文深度解读多模态大模型视频检索技术的实现与使用

通过对自然语言描述的理解,大模型可以将这些描述转换为相应的向量表示,并在高维空间中寻找最匹配的内容。第三代检索技术的优势在于它的灵活性和表现力。用户不必再局限于有限的关键字,而可以用自己的语言进行更精确和细腻的描述。同时,由于大模型能够理解内容的深层意义,搜索结果通常更加相关和准确,增强了用户体验,并为获取和发现信息提供了更加强大的工具。例如,一个用户想要找到一张描绘“一个穿着古代盔甲的战士在日落时分静立在山巅”的图片和视频。

2024-07-09 11:35:57 1527

原创 下半年交火点:智驾全国都能开,智舱多模态大模型

你猜一猜我现在参加什么样的活动呢?“你参加的是WAIC,就是那个人工智能的大Party,超多科技高手都在这……”“你帮我介绍一下这本书吧。“这书叫《反脆弱,从不确定性中获益》,讲的是怎么在混乱里找机会,作者塔勒布,来自土耳其,还写了《黑天鹅》,里面提了不少新词,像反脆弱者,书里挺有给我启发的东西……”以上两段对话来自7月5日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)上,商汤科技发布的“日日新5.5”原生多模态大模型现场演示对话。

2024-07-09 11:34:19 633

原创 AI时代还需要产品经理吗?需要什么样的?

在人工智能技术迅速发展的今天,我们不禁要思考,产品经理这个角色是否仍然重要?AI时代是否还需要他们?首先,我们必须认识到,AI虽然具有强大的数据处理和学习能力,但它并不能完全取代产品经理的角色。产品经理作为连接用户需求和技术实现的桥梁,他们负责洞察市场趋势,分析用户需求,并将这些需求转化为具体的产品规划和设计方案。AI虽然可以辅助产品经理进行数据分析,但无法替代他们对市场趋势的敏锐洞察和对用户需求的深刻理解。其次,产品经理在团队协作和项目管理方面发挥着重要作用。

2024-07-08 11:33:16 797

原创 30岁前懂3点助你成为不被吃的AI产品经理

AI产品经理懂AI算法具体使用场景。

2024-07-08 11:31:17 818

原创 上海交通大学<动手学大模型>大模型教程已经next level!

的动手学大模型教程,对大模型感兴趣的直接冲!就在4月份上交大发布了动手学大模型教程,这份教程来自上海交大**《人工智能安全技术》**课程讲义拓展,教师是是张倬胜教授。目的是通过简单实践,帮助大家进行大模型设计和学术研究。这份教程不仅提供了大模型的入门编程教学,每个部分还包含非常适合新手学习。

2024-07-08 11:17:09 1000

原创 来感受一下“人工智能+”,三甲医院是这样用大模型的

当去年GPT4公布的时候,我们大吃一惊,哪有这样的事;过若干时间后淡忘了,。今年突然出现Sora,惊呆了,文字就能出来一幕剧;难道仅仅是如此吗?不是,都说明。我的意思是,需要让一部分人先用起来。今年,围绕AI的最前沿科技依旧是大热门的话题,而上述这段话正是来自全国政协委员。此建议一出,可谓是立即在网上掀起了不小的热潮。而之所以会有如此建议,是因为在周汉民看来,对于这些最前沿的技术是要尽快体验和使用的:如果你不够了解,就会处于劣势。因为它所带来的是以点带面、连线成片的巨大影响效应。

2024-07-05 13:43:23 672

原创 AI提示词:一个能让你的AI提升10倍逻辑能力的提示词,只有这几个字,Kimi和GPT都适用!

昨天晚上和朋友聊天,聊到AI提示词在实际使用过程中的逻辑能力问题。他也是一个AI提示词的重度使用者,但是会经常遇到一个问题:明明觉得自己的提示词描述的很清楚了,可是AI输出的内容还是达不到自己想要的效果。。。AI大模型在接收到这句提示词的时候,通过逐步思考会更加关注提示词任务中的细节描述,按照步骤进行思考和回答,避免了思维跳跃性。如下图所示,假设在某个场景中我们希望AI大模型根据【A】内容输【D】内容。

2024-07-05 13:40:51 648

原创 大模型提示词工程和落地思考

之前的其他算法比如贪心算法,波束算法等效果不佳,openai 在 gpt2 中使用问题和 top-k 获得了更好效果。仅仅是目前的一个工程实践。

2024-07-05 12:00:48 1203

原创 面向开发者的LLM入门教程系列之提示词工程(1)

是入门 LLM 开发的第一步。对于想要入门 LLM 的开发者,你需要充分掌握本部分的 Prompt Engineering 技巧,并能基于上述技巧实现个性化定制功能。本部分的主要内容包括:书写 Prompt 的原则与技巧;文本总结(如总结用户评论);文本推断(如情感分类、主题提取);文本转换(如翻译、自动纠错);扩展(如书写邮件)等。第一章 简介欢迎来到。

2024-07-04 14:52:34 785

原创 使用LLM来人造数据增强embedding检索模型

今天介绍一篇META发表的一个论文LLM-Augmented Retrieval: Enhancing Retrieval Models Through Language Models and Doc-Level Embedding。旨在通过大语言模型来人造数据,增强检索模型的能力。此外,它提出了一种新的模型无关的文档级embedding框架。其实看这篇文章,学习下人造数据的prompt,以及使用人造数据的时候和真实的检索数据区分下(可以参考作者调试出来的权重参数以及做的消融实验)。

2024-07-04 14:34:39 1115

原创 RAG :vector embeddings 怎么关联使用

Vector embedding 是机器学习和人工智能中使用的一种强大技术,可将原始数据转换为模型可以轻松处理的数字格式。这里说明下 embedding 跟 LLM 毫无关系,在 LLM 出现之前已经纯在这个技术了。这种转换涉及将数据表示为高维空间中的向量,其中相似的位置得更近,从而实现高效的计算和相似性比较。

2024-07-04 14:32:47 647

原创 我在手提电脑上将大模型训练成了语文老师

(图片由大模型生成,如有侵权,立删)记得一年多以前,和不少商家交流大模型解决方案时,他们谈到内部有很多的资料,可以对大模型进行训练,让大模型变得更有智慧,从而为客户提供贴心而专业的服务,但是又不希望这些资料被泄漏出去,所以要求第一是本地化部署大模型,第二是专业化训练方面实现两个“便”,即“简便”而且“便宜”。第一点在当时勉强可以做到,但是要花不少钱,因为相当于把大模型开发运行的整套环境从大厂搬到客户那里去,第二点就更难做到了。

2024-07-03 13:57:09 1036

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除