自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1008)
  • 收藏
  • 关注

原创 【AI大模型】多模态RAG:段、表、图定位解析+数字转统计图型,收藏这一篇就够了!!

多模态的文档类型多模态文档可以分为以下三类:非结构化多模态数据半结构化多模态数据结构化多模态数据

2025-05-07 10:55:29

原创 AI产品经理的基础知识:一篇文章搞懂Transformer以及扩散模型

这篇文章详细介绍了transformformer以及扩散模型的原理以及来源,我认为作为AI产品经理,这些基础概念一定要知道,否则就很难去考虑哪一类AI模型更加适合自己的用户场景,从而进行产品框架设计。

2025-05-06 14:42:20 716

原创 【AI大模型】用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

小红书发布MCP结合大模型的能力,图片生成以及视频生成的MCPs,整个流程都可以完全由AI来完成,真正实现全自动化的内容生产和发布。比如标题、正文、排版可以让大模型LLM来帮你搞定。图片和视频也都可以用AI来生成,比如魔搭社区上的文生图MCP来生成图片,用Minimax MCP来生成视频。

2025-05-06 11:28:24 369

原创 DeepSeek+Coze实战:如何从0到1打造一个热点监控智能体?看完这一篇你就知道了!!

今天我要分享一个Coze智能体的解决方案,小白也能搭建。只需输入自己赛道的关键词就能自动批量获取爆款视频内容,轻松实现100条爆款视频的采集工作。效果如下

2025-05-05 14:08:38 744

原创 Agentic RAG-R1:让大模型从「检索助手」跃升为「思考+搜索王者」!

Agentic RAG-R1 是由北京大学研发的一项开源研究项目,旨在推动语言模型在自主检索与推理能力方面的能力边界。该项目通过引入强化学习策略(GRPO),构建了一个可自我规划、检索、推理与总结的智能体式 RAG 系统。

2025-05-05 11:30:08 457

原创 【AI大模型】大白话带你了解:智能体、LLM、RAG和提示词工程,轻松构建下一代应用

这两年AI应用开发火得不行,但很多小伙伴被一堆专业名词绕晕了。今天咱们就来掰开揉碎说说几个最关键的术语,保证看完你就能和工程师聊上两句了。想象有个24小时待命的虚拟员工,这就是智能体(Agent)。它和传统AI最大的区别就像人类和机器的区别:传统AI只能按固定剧本走,而智能体更像真人,能自己观察环境、思考对策、调用工具完成任务。

2025-05-04 08:00:00 1005

原创 检索增强生成 (RAG)的原理——传统检索+LLM生成相结合

RAG是一种检索增强生成模型,由信息检索系统和seq2seq生成器组成。它的内部知识可以轻松地随时更改或补充,而无需浪费时间或算力重新训练整个模型。举个例子,假设你正在写一篇关于猫的文章,但你不确定如何描述猫的行为。你可以使用RAG来检索与猫行为相关的文档,然后将这些文档作为上下文与原始输入拼接起来,再输入到seq2seq模型中。这样,RAG就可以生成关于猫行为的描述了.

2025-05-03 08:00:00 721

原创 DeepSeek最新离线版下载+安装教程(本地部署)+无限制大模型,收藏这一篇就够了!!

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。

2025-05-02 08:00:00 788

原创 7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。但最近,这种印象正被打破。更多的研究者开始探索在图像生成中引入自回归(如 GPT-4o),在语言生成中引入扩散。香港大学和华为诺亚方舟实验室的一项研究就是其中之一。他们刚刚发布的扩散推理模型 Dream 7B 拿下了开源扩散语言模型的新 SOTA,在各方面都大幅超越现有的扩散语言模型。

2025-05-01 08:00:00 848

原创 你真的了解大模型怎么“调”?四种主流LLM微调方法详解!

如果你是一个开发者,手里有一个强大的语言模型(LLM),想用它来做点厉害的事情,比如文本分类、智能问答,或者识别文本里的关键信息。可问题来了:训练这么一个庞然大物需要海量的计算资源和时间,你手头的电脑可能累到冒烟,甚至还有数据不够多导致模型“学歪”的风险。别慌,今天我们就来聊聊四种LLM微调方法,帮你高效优化模型,轻松应对各种场景。这四种方法分别是:Full-tuning(全量微调)、Freeze-tuning(冻结部分参数微调)、LoRA(低秩适应)和QLoRA(量化低秩适应)。它们各有绝活,能在不同

2025-04-30 11:08:56 785

原创 全世界等了一个月,Qwen3 它终于来了!!

Qwen3 是全球最强开源模型之一,其旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准评估中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,取得了具有竞争力的结果。小型 MoE 模型 Qwen3-30B-A3B 的性能优于 QwQ-32B,而激活参数仅为其十分之一;即使是像 Qwen3-4B 这样的小型模型,也能与 Qwen2.5-72B-Instruct 的性能相媲美。

2025-04-30 11:07:09 616

原创 LLM每周速递!| 涉及推理优化、RAG优化、多AgentOS、LLM行为控制、模型剪枝等

紧跟技术发展趋势,快速了解大模型最新动态。今天继续总结最近一周的研究动态,其中主要包括:大模型并行推理、图RAG性能优化、多Agent操作系统、大模型行为控制、高效大模型剪枝压缩、强化学习RL、多语言大模型等热门研究

2025-04-29 12:00:19 672

原创 【AI大模型】一文详解 Vision Transformers 原理与应用,收藏这一篇就够了!!

Vision Transformers (ViTs) 代表了计算机视觉领域的突破性变革,它利用了彻底革新自然语言处理的自注意力机制。与依赖分层特征提取的传统卷积神经网络(CNN) 不同,ViT 将图像视为更小块的序列,从而能够捕捉视觉数据中的全局关系和长距离依赖关系。这种独特的方法在图像分类、目标检测和生成建模等任务中展现出卓越的性能,使 ViT 成为推进人工智能驱动图像分析的强大工具。其多功能性和可扩展性使其成为不断发展的计算机视觉领域中的一项关键创新。

2025-04-29 11:37:02 996

原创 一文速通什么是AI Agent,Coze智能体怎么入门?看完这一篇你就懂了!!!

最近接触到想要复刻搭建智能体案例的小伙伴,但其对Coze平台的使用熟练度都不是很高。多数都属于初识阶段,面对学习中的卡点无从下手,这里对AI智能体以及Coze基础进行一次整体的介绍。

2025-04-28 12:01:14 648

原创 AI大模型LLM每周速递!| 涉及推理优化、RAG优化、多AgentOS、LLM行为控制、模型剪枝等

紧跟技术发展趋势,快速了解大模型最新动态。今天继续总结最近一周的研究动态,其中主要包括:大模型并行推理、图RAG性能优化、多Agent操作系统、大模型行为控制、高效大模型剪枝压缩、强化学习RL、多语言大模型等热门研究。

2025-04-28 11:18:47 501

原创 【AI大模型】谁能统一Agent 接口?MCP 对比 A2A 、Function Calling,收藏这一篇就够了!!

去年底MCP的热度还没消散,新的Agent接口标准A2A又出来了。就在上周,Google在Cloud Next大会上推出了Agent2Agent(A2A)开放协议。通俗来说,A2A就是帮助Agent之间进行通信的开放标准。一个背后站着Anthropic,一个背后站着谷歌,再加上一个2023年Open AI推出来的Function Calling ,可以说,是个巨头,都想在Agent生态里分一杯羹。

2025-04-27 11:14:29 936

原创 DeepSeek-GRM模型发布,全新推理时Scaling,为R2打前站!

DeepSeek联合清华发布了最新研究成果:通用奖励模型的推理时可扩展性,探讨了如何通过更多的推理计算来改进通用查询的奖励建模(RM),以及如何通过适当的学习方法提高性能与计算扩展的有效性。

2025-04-27 10:40:31 512

原创 DeepSeek-R1蒸馏小模型,用Ollama在本地运行跑起来

DeepSeek-R1作为第一代推理模型,在数学、代码和推理任务上表现优异,与OpenAI-o1模型不相上下。将此类模型部署到本地,可为AI应用带来更强隐私保护、定制化和可控性。

2025-04-26 08:00:00 819

原创 【AI大模型】热门 MCP Server一键部署,建议收藏起来慢慢学!!

全球 AI 开发者们热议“MCP”(Model Context Protocol)。尽管这一协议在2024年由Anthropic发布时并未引起广泛关注,但2025年初,Cursor宣布集成MCP迅速将其带入开发者的视野,3月Manus的爆发更是加速了MCP的普及。而就在3月27日,OpenAI正式宣布其Agent SDK全面支持MCP协议,这一举措标志着MCP将会成为该领域的实施标准,必将重塑AI应用的开发与交互方式。

2025-04-25 11:29:53 645

原创 【AI大模型】面对开源大模型浪潮,基础模型公司如何持续盈利?

生成式 AI 已在诸多领域带来了较大的生产力提升,但显然其潜力尚未被完全释放。这项技术蕴含着巨大的商业潜力,但人们却不知道如何将其释放出来 —— 尤其是考虑到这些技术获得的巨额投资与开源模型的崛起,后者在生成质量和生成速度上已能匹敌闭源模型。

2025-04-25 10:23:54 967

原创 全网最全!大家经常说的大模型,到底什么是大模型,大模型的具体应用,一文说清楚

最近这几年,大模型这词儿可太火了,感觉不管走到哪儿,都能听到有人在讨论。一会儿是这个公司用大模型搞出了新花样,一会儿又是那个研究机构靠着大模型取得了新突破。可到底啥是大模型呢?它又有哪些神奇的应用?今天咱就来好好唠唠,保证让你一看就懂!

2025-04-24 13:53:59 579

原创 【AI大模型】从模型原理到代码实践,深入浅出上手Transformer,叩开大模型世界的大门

作为非算法同学,最近被Cursor、DeepSeek搞的有点焦虑,同时也非常好奇这里的原理,所以花了大量业余时间自学了Transformer并做了完整的工程实践。希望自己心得和理解可以帮到大家~如有错漏,欢迎指出~本文都会以用Transformer做中英翻译的具体实例进行阐述。

2025-04-24 10:49:33 989

原创 只需三步,手把手教你部署本地大模型以及搭建个人知识库!!

读完本文,你会学习到如何使用最好用的软件Ollama部署本地大模型通过搭建本地的聊天软件,了解ChatGPT的信息是如何流转的RAG的概念以及所用到的一些核心技术如何通过AnythingLLM这款软件搭建完全本地化的数据库

2025-04-23 19:40:48 953

原创 【AI大模型】MCP、Function Calling 有什么区别?与 AI Agent 有什么关系?

在当今构建 AI 应用的过程中,Function Calling、MCP 以及 AI Agent 是三个密切相关但层级分明的概念。理解它们的区别与联系,对于开发者设计合适的 AI 系统至关重要。我们可以把这三者类比为“调用指令 → 调度系统 → 自主执行者”,分别解决不同层级的问题。

2025-04-23 14:11:23 1249

原创 【AI大模型】图解 Langchain 流程自动化,刷完文档只为你解放重复劳动

Langchain 就像是一个智能管家,可以帮你连接各种AI工具,自动化处理繁琐的信息流程。

2025-04-23 11:29:47 500

原创 【AI大模型】关于什么是Agent、如何构建Agent,最近最值得读的文章(没有之一)

“Agent”的定义多种多样。一些客户将 Agent 视为完全自主的系统,能够在长时间内独立运行,利用各种工具来完成复杂的任务。另一些客户则用这个词来描述遵循预定义工作流程、更具规范性的实现。在 Anthropic,我们将所有这些类型都归为agentic systems,但在架构上,我们会对工作流和 Agent 做出重要的区分:

2025-04-22 19:43:51 609

原创 【AI大模型】什么是多模态大模型?为什么需要多模态大模型?看完这篇你就懂了!!

“多模态大模型,就是支持多种数据格式的模型”很多人都听说过多模态,也知道多模态大模型,但如果让你介绍一下什么是多模态大模型,它有什么优点和缺点,以及为什么需要多模态,这时可能就有点傻眼了。从应用角度来说,垂直应用的大模型才应该是未来的趋势,那么为什么还要研究多模态大模型呢?今天我们就来了解一下什么是多模态大模型,以及为什么需要多模态大模型。

2025-04-22 14:14:58 699

原创 DeepSeek+Dify 构建本地知识库,真香!建议收藏起来慢慢学!!

Dify 作为同样开源的 AI 应用开发平台,提供完整的私有化部署方案。通过将本地部署的 DeepSeek 服务无缝集成到 Dify 平台,企业可以在确保数据隐私的前提下,在本地服务器环境内构建功能强大的 AI 应用。

2025-04-22 10:59:52 903

原创 Dify知识库分段与数据清洗实战:优化LLM检索效率与回答精准性指南

将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段。

2025-04-21 19:53:39 832

原创 【AI大模型】从架构设计侧剖析: MCP vs A2A 是朋友还是对手?

Anthropic 推出的 MCP(模型上下文协议)取得了成功,这显然激发了 AI 行业里的其他参与者,大家都想来定义一些开放协议,好用在 AI Agent 系统(Agentic Systems)的集成里。上周周,谷歌公开发布了一个叫 A2A(Agent2Agent)的开放协议,目标是规范多 AI Agent 系统通信的实现方式。很多人(可能有点误解)说这两种协议是竞争关系,而不是互补关系。

2025-04-21 11:58:25 587

原创 北航等机构发布最新综述:大语言模型集成(LLM Ensemble)

LLM Ensemble(大语言模型集成)在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段,综合考虑并利用多个大语言模型(每个模型都旨在处理用户查询),从而发挥它们各自的优势。大语言模型的广泛可得性,以及其开箱即用的特性和各个模型所具备的不同优势,极大地推动了LLM Ensemble领域的发展。

2025-04-21 11:29:51 550

原创 【AI大模型】基于ChatGLM-6b从零开始本地部署语言模型,步骤详细无坑版

ChatGLM-6B 是的一种自然语言处理模型,属于大型生成语言模型系列的一部分。"6B"在这里指的是模型大约拥有60亿个参数,这些参数帮助模型理解和生成语言。ChatGLM-6B 特别设计用于对话任务,能够理解和生成自然、流畅的对话文本。 这个模型通过大量的文本数据进行训练,学习如何预测和生成语言中的下一个词,从而能够参与到各种对话场景中。它可以用于多种应用,比如聊天机器人、自动回复系统和其他需要语言理解的技术中,ChatGLM-6B 的能力取决于它的训练数据和具体的实现方式,通常能够处理复杂的语言任务,

2025-04-20 08:00:00 1874

原创 3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)

Fine-tuning 微调如同给DeepSeek做定制手术——通过专业训练让模型精通某个领域,但越专精就越难跨界(比如医疗AI看不懂法律条文)。RAG则是给DeepSeek装智能U盘(外挂)——不修改模型本身,回答时自动调取知识库内容(好比律师查法典办案),通用性无损还能随时更新知识。

2025-04-19 08:00:00 802

原创 【AI大模型部署】使用ollama本地部署AI知识库,保护隐私数据

现在网络上的资源、软件各式各样,想要找到一个好用的工具非常不宜。很多时候下载的软件功能根本不是自己想要的,而且还带有广告或病毒。本想装安装一个工具,却被强制安装了很多恶意软件,造成系统变慢而且还可能其它损失。

2025-04-18 11:50:08 687

原创 【AI大模型】真实场景下落地RAG的十条建议及RAG中如何提升个性化?看完这篇你就知道了!!

RAG无处不在、无孔不入,却又缝缝补补,且出现了诸如GraphRAG、多模态RAG、Deepresearch等许多变体。RAG的方案人手一份,但是依旧在实际落地过程中出现各类问题。

2025-04-18 10:47:41 908

原创 【AI大模型】0成本5分钟!利用开源大模型搭建本地专属AI知识库

你一定经历过各种通用大模型一本正经胡说八道的时候吧,AI一通丝滑输出让人真假难辨,防不胜防。这种情况被称为AI幻觉。大模型产生幻觉不幸“翻车”的原因很大程度上是**“先天不足”**,例如训练时来自特定领域的训练数据就比较缺失或存在偏差等。对于企业,AI的幻觉已经成为阻碍其落地应用的严重缺陷。我们自然想让一些企业内部私有数据也进入到大模型推理分析的过程,让其更好服务于日常业务,但出于信息安全等考量,私有数据显然不可随意上传到第三方平台。针对这种情况,将企业内部知识库和大模型连接起来构建一个本地私有化的

2025-04-17 11:45:34 600

原创 【小白教程】从零学AI智能体,这篇教程值得一看,确实可以封神了!

在学习AI智能体前,我们不妨先思考一个问题:为什么现在大家都在说AI智能体,它到底是不是AGI的最终展现形态?AGI,通用人工智能(Artificial General Intelligence),简单来说,它是一个可以像人类一样灵活地解决任何问题的超级AI。智能体,Agent,它是一种具有自主决策能力的人工智能系统,能感知环境、制定计划、采取行动,并根据反馈调整行为

2025-04-17 10:53:54 456

原创 比较 DeepSeek-R1 模型:32B、70B 和 R1,看完这一篇你就明白了!!

DeepSeek 是一家由梁文锋于 2023 年创立的中国 AI 公司,该公司在发布 DeepSeek-R1 模型后,在人工智能领域取得了重大进展。这种开源语言模型因其在推理任务中的表现而备受关注,可与 OpenAI 的 o1 等模型相媲美。值得注意的是,DeepSeek 仅用通常所需资源的一小部分就实现了这一目标,凸显了中国在 AI 技术领域的快速进步。

2025-04-16 11:52:53 513

原创 【AI大模型】MCP与A2A协议比较:人工智能系统互联与协作的技术基础架构

在人工智能领域的快速迭代发展中,两种协议已成为构建新一代AI系统的关键基础设施:模型上下文协议(Model Context Protocol,MCP)和代理对代理协议(Agent-to-Agent Protocol,A2A)。表面上这两种协议可能存在相似之处,但它们在设计目标和应用场景上有着明确区分,并正在根本性地重塑AI系统与环境及相互之间的交互方式。

2025-04-16 11:07:05 1830

原创 DeepSeek本地部署(局域网+异地访问)数据库(保姆教程),建议收藏起来慢慢学!!

“通过局域网或异地公网访问本地部署的DeepSeek+数据库”, 这是一个常见的场景,我也有用到,本次将整理分享配置“局域网或异地公网”访问的方法!

2025-04-15 14:43:39 2332

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除