自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1199)
  • 收藏
  • 关注

原创 GPT-5.4深夜发布,最适合OpenClaw的天选模型登场了。

深夜凌晨2点,我刚准备睡觉。然后,GPT-5.4,突然发布。一下子激动的睡不着了。真的,这真不是我天天咋咋呼呼啥的,我真的也很少会用激动的睡不着觉这种表述。这是因为,我一直在等正式版的GPT-5.3或者GPT-5.4,来作为我的OpenClaw的首选模型。理由特别简单,因为现代世界三十年,本质上基层都是代码,我们现在看到的关于计算机和互联网的一切,几乎都建立在代码的基础之上。所以你可以理解为,代码能力,在很多时候,就代表着Agent能力的一根粗壮的腿。

2026-03-14 15:56:08 360

原创 下一个时代属于AI Agent!5分钟讲明白什么是Agent?

在使用AI的过程中,一个核心痛点也逐渐浮现:AI 非常聪明,但它只会停留在对话框里聊天和建议。你让它完成一份复杂的市场调研,它只会给你一份大纲,却无法主动行动起来:自动搜索信息、整理数据、打开分析工具、撰写报告,并最终交付结果。而Agent智能体让 AI 不再仅仅是会说的工具,而是真正拥有了自主行动力,能够目标驱动、自我规划、执行复杂任务,甚至组成虚拟团队进行协作。那么,Agent 的本质到底是什么?它与我们熟悉的大模型之间,究竟是怎样的进化关系?为什么说它才是驱动下一波 AI 生产力革命的终极引擎?

2026-03-14 14:53:21 356

原创 (可能全网最全_长的)2万字Openclaw保姆教程

Node.js是一个让JavaScript能在电脑本地运行的环境。简单说:Node.js就像JavaScript的"翻译官",让它能在浏览器之外的地方工作。你不需要深入理解它,只需要确认电脑上已经安装了。

2026-03-11 13:54:34 769

原创 OpenClaw爆火:席卷全球的AI智能体,火爆背后的实力与

2026年AI领域,OpenClaw无疑是最具话题性的存在。这款由Peter Steinberger主导开发的开源AI智能体框架,以“能动手做事,而非仅能聊天”的核心优势,短短数月掀起全球热潮,从技术圈渗透到企业办公、个人生活,其火爆程度可通过多个接地气的案例直观印证。它并非传统对话式AI,而是本地优先部署的AI执行网关,能将自然语言转化为实际操作,可读写文件、对接通讯软件,断网也能运行,兼顾高效与隐私,被网友亲切称为“小龙虾”。OpenClaw的火爆,首先体现在技术社区的狂热追捧。

2026-03-11 11:50:52 378

原创 让普通人轻松学会AI大模型的5个技巧:从入门到精通的实用指南

*:学会AI大模型,本质是学会一种“高效思维方式”**让普通人轻松学会AI大模型,无需掌握复杂的技术原理,核心是掌握“认知筑基、指令精修、场景拆解、迭代验证、安全合规”这5个技巧。学会这5个技巧,普通人不仅能轻松上手AI大模型,更能借助大模型提升工作效率、优化生活品质——职场人能快速完成文案撰写、方案规划,宝妈能精准获取育儿知识、设计启蒙活动,退休老人能便捷解决日常疑问、丰富精神生活。未来,AI大模型将持续迭代,功能将更加强大、交互将更加便捷。

2026-03-06 08:30:00 401

原创 AI大模型零基础入门教程(上海交大免费课程) 从入门到精通

本文介绍上海交大免费的大模型课程《动手学大模型》,源自2024年春季《人工智能安全技术》课程,旨在帮助学员快速入门大模型编程。课程提供丰富的实践教程和文档,适合小白和程序员学习,免费下载地址可在关注"AII大模型"公众号后获取。

2026-03-05 15:16:14 439

原创 主导大型互联网公司AI大模型落地三年,我总结了这套AI大模型全套学习教程

AI大模型这条路,说长不长,说短不短。有人三个月就能上手开发应用,有人三年还在门外徘徊——区别不在于智商,而在于是否真的动手了。你看到的这篇文章,从第一页翻到最后一页,如果不打开电脑敲一行代码,那它只是一堆漂亮的文字。如果你看完第一章,就打开DeepSeek开始调提示词;看完第三章,就去Dify搭一个知识库;看完第五章,就去Coze搓一个Agent——那这篇文章,就是你的通关秘籍。技术的世界很公平:你投入多少时间,它就回报你多少能力。你踩过的每一个坑,都会变成你简历上的亮点;

2026-03-05 14:54:07 417

原创 CuaBot v1.0发布:让AI智能体操作电脑的第三种办法

CuaBot是开源项目,解决了AI智能体操作计算机的痛点。传统方法要么让AI直接控制桌面导致安全问题,要么使用云端沙盒但交互困难。CuaBot让用户和AI各自有独立光标在同一窗口协作,不抢夺控制权,也不需要全桌面截图。它提供安全沙盒环境,支持多智能体并行运行和CLI控制,通过MCP连接确保AI只能看到需要的窗口,保证安全隔离。让AI智能体操作计算机,目前就两种办法,都有些缺陷。第一种,智能体直接截你桌面,控制你鼠标。听起来不错,但用起来就知道了,AI正帮你调试代码呢,你的鼠标突然不听使唤。

2026-02-12 08:15:00 670

原创 拯救大模型“幻觉”?Python_RAG九大架构全解析!

想象一下,你新招了一位天才员工,他博闻强识(预训练模型),但记忆力极差,且知识停留在去年(训练数据截止)。公司最新的产品手册、客户协议,他一概不知。RAG就像是给这位天才配了一个随身文件柜(知识库)和一个高效秘书(检索系统)。每当员工需要回答问题时,秘书会迅速从文件柜中找出相关文件,员工结合这些最新资料,给出准确答复。技术定义:RAG通过让大模型在生成答案前,检索并参考外部知识源,来优化其输出。它让模型不再仅仅依赖训练时学到的“旧知识”,而是能结合你提供的文档、数据库进行回答。标准流程检索。

2026-02-10 14:27:14 646

原创 为什么需要RAG?推荐一个从零搭建RAG的项目,含教学视频

RAG 不是让模型“记住更多”,而是让模型。

2026-02-10 11:41:08 794

原创 Agent Skills完全指南(实战案例)从零开始学配置,一篇看懂,赶紧收藏!

敏叔,我的Agent怎么老是干不好活?像个智障一样!这个问题我可太有感触了。一开始我也觉得,不就是给Agent配几个工具嘛,能有多难?结果用下来之后发现,Agent Skills(技能)这玩意儿,配置好了是智能助手,配置不好就真成“智障”助手了。今天我就把踩过的坑、总结的经验一次性倒出来,带你彻底搞懂Agent Skills到底该怎么玩,怎么让你的Agent真正“聪明”起来。说人话,Agent Skills就是你给AI智能体配备的“工具箱”。会用什么软件(Excel、PPT、Photoshop)

2026-02-09 11:44:39 856

原创 十分钟搞清楚Agent、A2A、MCP和Skills的概念

在2026年,MCP已成为Agent基础设施的基石,比如在电商Agent中调用支付API,或研究Agent查询数据库。没有MCP,早期的工具调用很乱(每个模型格式不同),现在统一后,开发效率提升3倍以上。它常与A2A结合:Agent间协作时,用MCP调用底层工具。这张是MCP最经典的架构分解图:图中左侧是运行了LLM应用的MCP Host,通过MCP Client发出标准化请求;中间是上下文管理器(处理缓存、状态);右侧是各种工具服务器(API、数据库、文件系统)。

2026-02-09 11:40:13 705

原创 大模型的技术生态——怎么理解大模型技术以及应用技术

大模型的技术生态本质上就是围绕着大模型这个“人”转的。大家在学习大模型应用开发时会发现有很多种不同的技术方向和框架,而且不同的技术有其使用的业务场景,因此可能就有部分人认为,不同大模型应用技术之间是无关的。但事实上,从技术的角度出发,技术只是一种工具,而很多业务场景可能需要同时结合多种不同的技术才能满足复杂的业务需求。只不过技术生态经过这么多年的发展,已经形成了一套完善的架构机制,对我们使用者来说入口都是统一的,但其背后的技术实现却是复杂的,并且是可以更换的,但最终对我们用户来说都是无感的。

2026-01-14 11:21:19 941

原创 这是一份大模型应用学习路线!(附学习资料)

最近两年大模型发展很迅速,在理论研究方面得到很大的拓展,基础模型的能力也取得重大突破,大模型现在正在积极探索落地的方向,如果与各行各业结合起来是未来落地的一个重大研究方向大模型应用工程师年包50w+属于中等水平,如果想要入门大模型,那现在正是最佳时机2025年Agent的元年,2026年将会百花齐放,相应的应用将覆盖文本,视频,语音,图像等全模态这一期主要是给大家推荐一个大模型应用学习路线这个学习路线的具体内容如下:第一节:提示词工程。

2026-01-14 10:53:42 1120

原创 从0到1开发一个商用 Agent(智能体),把企业级 Agent 从“搭出来”到“跑起来”!!

在大模型技术迅猛发展的今天,AI 应用正从“泛化对话”迈向“深度业务嵌入”的新阶段。如果说上半场的竞争聚焦于模型能力的展示与通用场景的覆盖,那么下半场的核心战场,则毫无疑问是深入企业业务一线的 Agent(智能体)应用。企业对 AI 的期待早已超越“能聊天、会回答”的初级阶段,转而追求能够理解行业语境、执行复杂任务、保障数据主权,并真正融入业务流程的生产力级智能体。这一趋势并非空穴来风。

2026-01-09 16:39:57 890

原创 大模型技术路径梳理,从零基础入门到精通,看这一篇就够了!

大模型技术路径是一场算力、算法、数据2017年Transformer架构奠定基础2018年BERT/GPT-1确立预训练范式2020年GPT-3展示规模效应与涌现能力2022年RLHF提升模型对齐能力2023年GPT-4/Gemini开启多模态时代2025年RLVR/DPO推动效率与真理导向训练未来技术路径将围绕效率提升、能力深化、安全对齐、生态扩展四大方向发展,最终目标是构建通用人工智能,实现更安全、高效、可解释的智能系统,赋能千行百业。

2026-01-09 16:03:28 981

原创 智能体技能完全指南(超详细)从零基础到精通,一篇全掌握,值得收藏!

什么是LLM AgentSkills?——基于提示词的元工具架构在构建生产级大型语言模型(LLM)驱动的智能体(Agent)系统时,“技能”(Skills)代表了一种至关重要的架构范式。Skills并非传统的外部工具或API调用,而是被精确定义为封装的专业知识(Packaged Expertise),其核心作用在于塑造Agent的思维模式和解决问题的方法 [1]。Skills不直接执行代码,而是提供关键的上下文、指令、领域知识和行为模式,从而显著提升Agent在处理特定、复杂任务时的表现 [1]。

2026-01-06 14:22:43 2326

原创 RAG技术完全指南(非常详细)从零基础到精通,一篇看懂,建议收藏!

2025年即将过去,作为一名深耕RAG技术的算法工程师,我想和大家聊聊这一年RAG技术的真实状态——不是那些震惊体标题下的"RAG已死",也不是各种PPT里的宏大叙事,而是我在实际落地中观察到的技术演进、踩过的坑,以及对2026年的真实判断。技术本身没有对错,关键在于是否用对了地方。下期分享: 7 种必须了解的企业落地RAG 架构回看这一年,RAG经历了从狂热到冷静,技术本身在成熟,但大家的心态也在变化。基础框架会更加稳定- 淘汰期已过,剩下的都是精品垂直应用会涌现。

2026-01-06 14:14:35 795

原创 大模型应用要学会分而治之的思想

大模型长文处理中,只能使用分段处理的思想,这是大模型应用的原则。最近在研究大模型报告生成和长文本处理的功能,然后发现之前在做大模型应用时很少出现上下文超长的情况,最多也就是多轮对话中出现,而多轮对话主要是由于历史记录导致上下文超长,所以只需要做好历史记录管理即可。但在生成报告和长文本处理过程中,其情况和长对话又有一定的区别;因为报告生成和长文本处理一般不涉及历史记录的问题,但需要对文本内容进行分块处理,否则很容易导致上下文超长的问题,而这一点是大模型本身的特性,无法避免。

2025-12-31 11:10:31 1128

原创 三篇论文,写清楚了Agent元年的困境

UC Berkeley与DeepMind研究揭示当前AI Agent技术与市场炒作的巨大差距。生产环境中的Agent表现保守,多Agent系统面临协调成本高、错误放大等问题,增加预算也无法线性提升性能。真正的Agent爆发需要有效工具管理、自我验证能力和高效沟通协议。目前,我们仍处于依赖硬编码和强管控的工程时代,真正的Agent元年尚未到来。2025年,被资本市场定义为「Agent 元年」。Manus、Lovart、Fellou 等多 Agent 应用吸引了相当多的眼球,它们自动化程度高,泛化能力强。

2025-12-31 11:04:05 704

原创 大模型结构化数据流式输出技术详解(附实例)小白到高手进阶,一篇全掌握+赶紧收藏!

文章探讨了在大模型应用中实现结构化数据流式输出的技术方案。针对传统一次性输出导致响应时间长的问题,借鉴网络流式传输思想,提出在接收端对接收的不完整数据进行解析和组装的方法。特别指出解析难点在于处理不完整结构,建议使用栈等数据结构确保数据完整性,并随着数据结构复杂度增加,解析难度也呈几何级增长。这一技术对提升大模型应用前端渲染体验具有重要意义。网络流与模型流式输出同出一门,没有本质上的区别。在大模型应用中,结构化数据在其中扮演着重要角色,特别是在智能体的实现中;

2025-12-25 16:02:30 1080 1

原创 AI Agent开发实战(保姆级教程)从零基础到精通,看完这篇就能上手,值得收藏!

本文系统介绍LangGraph框架构建AI Agent的方法,对比n8n与Dify等低代码平台,通过邮件处理Agent示例展示实现。探讨了可视化工作流在复杂生产环境中的局限性,指出低代码是探索起点而非生产终点,强调复杂场景仍需可编程框架结合严谨工程实践。在大模型(LLM)从“聊天玩具”迈向“生产力引擎”的进程中,如何可靠地指挥 AI 完成多步骤、多工具、带反馈的复杂任务,已成为构建下一代智能系统的核心挑战。

2025-12-25 15:58:51 734

原创 AI大模型RAG与知识库技术详解:从零基础入门到Embedding精通,这一篇就够了!

文章介绍了AI技术中解决特定领域知识需求的三大核心技术:RAG、知识库和Embedding。当前AI大模型在特定场景知识上存在不足,通过知识库作为"外挂"可以弥补这一缺陷。Embedding技术将各类信息转换为向量格式,提高检索效率。RAG技术通过检索相关资料、增强信息、生成答案的过程,使AI能够更好地回答特定领域问题。这些技术本质上是让大模型成为信息编辑整合工具,而非依赖其自身知识储备。今年以来,AI 技术已经融入了我们的工作和生活中。

2025-12-24 10:32:28 758

原创 这是一份系统全面的大模型知识手册!(附学习资料)

文章推荐了一份系统全面的大模型知识手册,分为四个部分:大模型应用基础(CNN、Transformer、GPT等基础知识)、大模型优化技术(微调方法)、分布式训练(Accelerate、DeepSpeed等)和高效微调(Lora、P-tuning等)。手册从基础到进阶全面覆盖大模型知识,适合不同水平读者学习,关注公众号发送"知识手册"可获取。

2025-12-24 10:27:37 845

原创 AI智能体记忆系统完全指南(超详细)从零基础到精通,一篇全掌握,值得收藏!

本文系统性地综述了AI智能体记忆系统的最新研究进展,提出了"形式-功能-动态"三维分类框架。研究指出记忆是基础模型驱动的智能体的核心能力,支撑长期推理、持续适应和复杂环境交互。文章深入探讨了记忆的三种主要形式、三类功能角色及其演化机制,为未来智能体研究提供了系统性的理论基础。智能体与环境:设I = {1, …, N}表示智能体的索引集,其中N=1对应单智能体情况,N>1代表多智能体设置。

2025-12-20 10:52:43 717

原创 面向业务落地的AI产品评测体系设计与平台实现

本文介绍了淘宝闪购技术部AI大模型应用评测体系的构建过程。针对AI产品面临的不确定性和复杂性挑战,文章提出了从"验收式测试"到"共创式评测"的转变,建立了"端到端评测"与"分层评测"相结合的评测策略,以及基于变更分级的评测体系。通过构建标准化流程+插件化扩展的评测平台,实现了AI产品质量保障与持续迭代的闭环,有效支持了90+AI产品的研发与上线。一、背景和挑战在人工智能技术迅猛发展的推动下,各行各业正经历前所未有的数字化转型浪潮。从智能制造的智能调度系统,到医疗领域的辅助诊断工具;

2025-12-20 10:39:35 941

原创 n8n、扣子太难用了,Vibe Workflow才是更大众的解

Refly.AI 是开源的。开源仓库地址:https://github.com/refly-ai/refly如果你之前用 n8n、Claude Skills 或者其他 Workflow 平台,他们还做了产品化的迁移功能,可以一键把那边的东西导过来运行。Vibe Workflow 的核心逻辑是:用 Agent 节点替代传统 Workflow 节点,降低搭建门槛,收集行为数据做飞轮。赌的是模型能力持续提升,产品站在肩膀上跟着涨。

2025-12-19 11:57:20 827

原创 AI提示词工程完全指南(超详细)从入门到精通,一篇搞定!建议收藏!

提示词工程的优化与迭代提示词工程强调通过不断优化提示词,提高大模型的输出质量。

2025-12-19 11:48:04 1610

原创 大模型应用开发实战:从踩坑到精通,收藏这篇就够了!

本文分享了一个智能问答系统的开发优化过程。针对三个不同子场景的智能问答需求,作者最初采用纯RAG技术建立三个知识库,但效果不佳,出现场景判断不清和召回率低的问题。后通过重新思考,改为按数据类型建立两个知识库(结构化与非结构化),并实现条件查询和相似度查询两个工具,让模型根据需求自主选择。此方案简化了技术实现,大幅提升了系统效果,解决了场景区分和混合数据查询问题。大模型应用开发流程正确,但结果不一定正确。由于大模型技术的复杂性,再加上不同业务场景的特殊需求,导致大模型应用的开发难度很大;

2025-12-18 17:52:34 1044

原创 一张图看懂本体与知识图谱的关系(超详细)从零基础到实战精通,收藏这一篇就够了!

知识建模分为数据层和模式层。数据层以图数据库存储事实,通过知识提取生成实体关系,经知识融合去除冗余;模式层借助本体规范概念关系,通过知识推理发现新关联,本体建模明确定义概念联系。数据层实现知识图谱,模式层实现本体建模,共同构建完整知识体系。知识建模在逻辑架构上分为两个层次:数据层和模式层。数据层是以事实为存储单位的图数据库,其事实的基础表达方式是「实体-关系-实体」或者「实体-属性-属性值」。数据层进行知识提取和知识融合。知识提取是基于已有数据生成「实体-关系-实体」;

2025-12-18 14:34:24 1350

原创 LangChain实操教程,多智能体协作:从单兵作战到团队协作系统

创建新文件。

2025-12-18 14:07:20 1069

原创 LangChain多智能体协作实战教程(超详细)从基础架构到动态循环机制,一篇搞定,值得收藏!

创建新文件。

2025-12-17 15:21:58 1065

原创 提示词工程完全指南(超详细)从零基础到精通,一篇就够,建议收藏!

文章介绍了提示词工程作为与大模型交互的核心技术,通过优化输入提示词来释放大模型潜力。提示词具有任务描述、提供上下文和引导输出三大功能,其有效性依赖指示、上下文、例子、输入和输出五大核心要素。文章详细讲解了ICIO框架、链式思维等结构化方法,强调通过明确性、简洁性和结构化来优化提示词,使大模型从工具转变为智能助手,提供高效准确的解决方案。“ 提示词工程是用户与大模型交流的桥梁,提示词的好坏直接影响到模型的效果。”在大模型应用开发中,所有的操作最终的结果都是拼接成提示词输入给大模型,因此可以说提示词是大模型应用

2025-12-17 14:59:54 992

原创 用小模型办大事!阿里团队用Qwen3-0.6B打造简历求职神器!

阿里团队推出SmartResume智能简历解析系统,使用微调的Qwen3-0.6B小模型和YOLOv10版面检测模型,可在十秒内高效解析简历PDF文件。系统能提取基本信息、工作经历、教育背景等结构化信息,通过版面检测重建阅读顺序,将内容稳定转换为结构化字段,为后续程序提供高质量数据集。项目已开源并提供在线体验,展示了AI模型在企效招聘领域的实际应用。目前的AI科技圈一直在致力于将AI模型能力落地应用,一方面要考虑大参模型部署成本,另一方面又要考虑大模型在应用中的运行效率。

2025-12-11 11:28:48 991

原创 大模型应用理论那么简单,为什么实现起来那么复杂?

本文探讨大模型应用开发中理论与实践的差距,以RAG技术为例说明理解理论不等于掌握应用。RAG作为方法论而非具体技术,其难点在于效果优化而非流程实现。大模型应用开发需丰富经验和细节优化,不同模型和环境需针对性测试调整,效果优化比实现更难。很多人都有这样的感受——大模型应用的理论我都懂,但为什么就是做不好?其实理论的简单性和技术的复杂性,往往都隐藏在那些细节里。“纸上得来终觉浅, 绝知此事要躬行。今天闲的没事回头梳理了一下这大半年来开发过程中所遇到的问题,然后画了一个架构图;

2025-12-05 11:51:43 726

原创 一文搞懂MCP与RAG的区别!从零基础到实战应用,建议收藏!

RAG 让模型“知道得更准”MCP 让模型“干得成事”。在企业落地中,优先明确目标是“回答对”还是“把活儿办了”,再决定单用或组合。如果你正把 LLM 接入企业系统:先用 MCP 打通关键工具/数据,再把检索做成可调用的 RAG 工具——既“会说”,也“会做”。

2025-12-04 15:25:09 942 1

原创 谷歌最新《Introduction to Agents》白皮书

文章基于谷歌《Introduction to Agents》白皮书,系统介绍了AI智能体的架构设计、能力分级、生产部署、安全治理及自我进化机制。详细解析了智能体的四大核心组件(模型、工具、协调层、部署),五级能力进化路径,以及多智能体协作模式。同时提供了从开发到运维的全流程指导,包括Agent Ops、安全防护、互操作性等关键技术,帮助开发者构建可落地的生产级智能体系统。过去数年,AI的核心价值集中在被动式任务:回答问题、翻译文本、生成图片,每一步都需要人类指令驱动。

2025-12-04 11:46:36 886

原创 AI Agent记忆系统搭建教程(超详细)从零基础到精通,收藏这一篇就够了!

记忆,是智能的基石,也是认同的来源。如果要让 AI 从“工具”进化为“伙伴”,它首先得像个老朋友一样,记得你的习惯,懂得你的言外之意。别让你的 Agent 永远停留在“初次见面”。给它装上记忆,从今天开始,在数字荒原里与它共同进化。今天的分享就到这里,如果您觉得还不错,请关注我吧~

2025-12-02 15:33:22 1208

原创 4种易用的本地化部署LLM的方法,从零基础到精通,看完记得收藏!

文章介绍了四种在本地运行大模型的方法:Ollama适合个人本地试验和脚本整合;LMStudio提供类似ChatGPT的界面且支持AMD/Intel集显;vLLM是开源推理引擎可提供OpenAI兼容接口;LlamaCPP是轻量级引擎可在个人电脑CPU或GPU上运行LLM。每种方法都有其适用场景和优势,用户可根据自身需求选择合适的工具。

2025-12-02 13:55:43 928

原创 AI大模型瘦身指南:量化vs蒸馏,两种核心技术详解,收藏备用!

要理解量化,我们首先需要知道:大模型本质上是由海量参数组成的。比如GPT-3,就包含了1750亿个参数。每个参数都是一个数值,而这些数值的存储方式,直接决定了模型占用的空间大小。让我们举个简单的例子。假设某个参数的值是1.2768,为了在计算机中存储这个精确的数值,我们需要开辟一定的内存空间。但如果我们做个"四舍五入",把它简化成1或者1.28,所需的存储空间就会大大减少。这就是量化的核心思想——通过降低数值精度来节省存储空间。随着大模型应用的不断普及,模型压缩技术变得越来越重要。

2025-11-29 12:05:01 1115

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除