- 博客(119)
- 收藏
- 关注
原创 Ollama vs LM Studio Mac M 系列完整对比(2026 最新)
官网下载 dmg 安装包,打开后直接在应用内搜索下载模型,点击 Start Server 开启 API。
2026-06-28 00:24:24
14
原创 忍无可忍卸载WPS,换办公软件后电脑终于安静了
今天结合2026年6月全网真实用户反馈、官方最新回应、多款替代软件实测体验,完整聊聊WPS如今口碑翻车的核心原因,再把当下几款无广告、免费合规的替代软件优缺点讲透,不管是低配笔记本、Mac、Windows,还是经常处理PDF、多人协作的上班族,都能找到适配自己的选择。可近大半年,软件体验断崖式下滑,弹窗广告、强制占用C盘、基础功能锁会员、偷偷篡改系统默认打开方式,一堆糟心事堆在一起,上周写重要方案时又弹出续费广告直接卡死文档,我当场下定决心彻底卸载,换了全新办公套件。切换使用一周后,最直观的感受就是清净。
2026-06-27 17:07:06
37
原创 Zero-Shot / One-Shot / Few-Shot / Chain-of-Thought 完整对比(Prompt Engineering 核心技巧)
提供1 组完整标准答案示例,让模型模仿示例的格式、逻辑、措辞生成回答。提供2~5 组标准输入 + 输出示例,是工程里最常用的提示方案,给模型多个参考范本,大幅降低输出跑偏概率。让模型分步拆解、写出中间推理过程,再给出最终答案,专门解决数学计算、逻辑推理、多步骤复杂问题。/ 一步步推导。
2026-06-27 16:46:54
72
原创 在 LangChain 框架中,Runnable 是一个最核心的“底层协议(Protocol)”或“标准接口”。
在 LangChain 框架中, 是一个最核心的“底层协议(Protocol)”或“标准接口”。简单来说,LangChain 里几乎所有的核心组件(如提示词模板、大模型、输出解析器、检索器、自定义函数等),在底层都继承或实现了 接口。它的核心思想是:“任何组件,本质上都是一个‘接受输入,经过处理,产生输出’的独立任务单元。”在早期的 LangChain 中,调用不同组件的命令非常混乱。调用 LLM 用 ,调用 Chain 用 ,调用检索器用 。这导致组件之间很难优雅地拼接。为了解决这个痛点,LangCha
2026-06-27 15:58:43
45
原创 Prompt Engineering 提示词工程 完整详解
提示词工程是一套写指令的标准化技巧,不靠改模型,只靠优化输入文本,精准控制大模型输出内容、格式、逻辑,是开发 LLM 应用最基础、成本最低的优化手段。
2026-06-27 15:48:20
47
原创 Chain Composition|LangChain 链路组合(链式编排)
Chain Composition 是 LangChain 提供的链路拼装体系,用管道、并行、分支等方式拼接提示词、模型、解析器、自定义逻辑,搭建复杂 AI 任务流水线。
2026-06-27 15:41:25
28
原创 from langchain_openai import ChatOpenAI
ChatOpenAI是 LangChain 官方拆分独立包提供的,专门对接 OpenAI 系列对话接口(GPT-4.1、GPT-4o、GPT-3.5-turbo 等),替代旧版。
2026-06-26 16:12:45
127
原创 LLM Token 完整通俗详解(从底层原理到计费、实操全覆盖)
Token 是大语言模型(LLM),可以理解成:模型专属 “文字积木”。人类读写用汉字、英文单词,AI 只认 Token;所有输入提问、AI 输出回答,都会先拆成一堆 Token 再运算。
2026-06-26 14:20:12
183
原创 逐段拆解 client、response 含义
client:创建连接 OpenAI 服务的通信工具;用client发送提问请求;response:接收 AI 服务器返回的整套结果,从中提取 AI 回答文本。
2026-06-26 13:43:18
206
原创 OpenRouter vs Ollama 完整区别对比
一句话总结: OpenRouter = 云端聚合 API(联网、付费、能调用 GPT/Claude 等闭源模型) Ollama = 本地运行工具(离线、免费、只跑开源模型,数据不出本机)云端第三方 AI 网关 / 聚合平台本地开源工具,在你自己电脑跑大模型表格你现在是做课堂 AI API 实验,OpenAI 官方额度耗尽报 429,两个方案取舍:python运行
2026-06-26 12:06:22
197
原创 Debian/Ubuntu 新版系统(Python3.11+)的 PEP 668 外部环境保护机制,不允许直接在系统全局 Python 用 pip 安装包,优先推荐虚拟环境
这是 Debian/Ubuntu 新版系统(Python3.11+)的,不允许直接在系统全局 Python 用pip安装包,防止破坏系统自带工具。下面给你三种稳妥方案,优先推荐虚拟环境。
2026-06-25 17:12:27
180
原创 ChromaDB vs Pinecone 完整对比
本地调试、离线、小数据、省钱、隐私优先 → ChromaDB线上生产、大数据、高并发、不想运维、愿意付费 → Pinecone。
2026-06-24 16:53:53
376
原创 LangChain 完整全解析
极致生态集成:兼容几乎所有大模型、向量库、文件格式、第三方工具,社区方案极多;统一抽象,组件插拔:换本地 Chroma / 云端 Pinecone、切换 GPT / 千问几乎不用改动业务代码;一站式覆盖 RAG、对话、Agent、自动化,从原型到生产完整链路;LCEL 管道语法简洁易读,支持流式、异步、批量;配套 LangSmith 解决复杂 Agent 调试难题。→ LangChain Memory 组件实现会话上下文;
2026-06-23 22:52:08
161
原创 LLM 与 Agent 完整区分:一句话核心
是神经网络模型,训练目标只做:文本理解、逻辑推理、续写文字。输入:用户一段提示词 Prompt输出:一段文字回答开环单次交互—— 一问一答,无后续自主动作短板:知识截止、没有手脚、不会拆分任务、记不住跨会话内容、无法操作外部系统代表:GPT-4o、Llama 3、Qwen、Claude、Gemini Flash/Nano/Mini 等(你前面问的所有模型都只是 LLM)LLM 是思考引擎,只负责文字生成;Agent 是带手脚、记忆、规划的自主执行系统,把 LLM 的思考落地成真实可操作的结果。
2026-06-23 20:02:52
188
原创 short term memory(短期记忆) vs context window(上下文窗口)
Context window = 装记忆的盒子,有固定大小Short term memory = 盒子里现在装着的对话内容盒子太小,里面的旧东西就会被扔掉,短期记忆随之消失。
2026-06-23 14:08:32
204
原创 人类记忆分类与 LLM 的核心映射
将人类的认知记忆分类()与大语言模型(LLM)的架构和工程技术进行映射,是一个极其精妙且深刻的类比。在认知心理学中,这些记忆组成了人类的整个智能系统;而在现代大模型工程(尤其是在 2026 年的 Agent 和 RAG 架构共识)中,它们分别对应着 LLM 的。
2026-06-23 01:31:22
239
原创 大模型知识 / 能力四大载体:MCP、RAG、Fine-tuning、Skills 完整区分
相当于 AI 的 USB-C 接口,统一规范模型访问外部资源(工具、数据库、文件、实时 API),是。:封装一套完整任务流程(SOP、函数调用、思考步骤),靠提示词 / 函数描述定义,:外置向量数据库存文档,提问时检索相关片段塞入上下文,:训练更新模型权重,知识永久内化,对应你之前那句。:Anthropic 推出的。
2026-06-22 22:42:20
198
原创 微调(Fine-tuning)通过更新模型权重,使模型学习特定领域的数据分布、知识和任务模式,并将这些信息编码到参数中,从而在推理时表现出相应能力。
当你进行微调时(无论是全量微调还是 LoRA 等轻量化微调),你把特定领域的任务数据(如:医疗病历、金融合同、特定格式的 JSON 输出)喂给模型。:新知识不再是外挂的,而是融入了模型的注意力机制(Attention Blocks)中,这使得模型在面对该领域从未见过的类似提问时,能够展现出极强的泛化推理(Generalization)能力。此时的参数(Weights)是一个通用的概率分布。:是在大模型工作时,塞给他一本“最新的企业内部百科全书”,随时翻阅(确保获取的事实 100% 准确、最新且随时可查)。
2026-06-22 18:28:54
187
原创 MCP(Model Context Protocol,模型上下文协议)
MCP(Model Context Protocol)是一种让大模型能够用统一方式连接文件、数据库、GitHub、Notion、Slack 等外部工具的开放标准协议,相当于 AI Agent 生态中的“USB-C 接口”。
2026-06-22 13:21:24
237
原创 Skill.md 三阶段加载机制(基于 Progressive Disclosure 渐进披露架构)
整套机制是为了控制 Token 开销,不一次性把完整技能全部塞进上下文,分三层懒加载,对应 Cline/Cursor 编码智能体标准设计。
2026-06-20 05:04:19
205
原创 大模型 Reasoner 完整释义(推理核心单元)
是 AI Agent 体系里的核心认知模块,相当于智能体的 “大脑思考中枢”。Reasoner= 负责逻辑规划、迭代收敛(Progressive Closure)的思考层;Skills= 封装好的标准化业务执行流程;Tools= 底层可调用操作(读文件、终端、Git)。
2026-06-19 21:27:49
199
原创 AI Agent Skills(智能体技能)完整详解
Tool(工具)= 底层原子动作(读文件、跑终端、搜网页)Skill(技能)= 上层复合业务流程,编排多个 Tool 完成一件完整事Agent(智能体)= 调度大脑,识别意图并匹配对应 Skill 执行。
2026-06-19 21:18:11
228
原创 Progressive Closure 渐进式收敛(Agentic Coding 智能体核心概念)
Progressive Closure 是编码智能体分阶段迭代、逐步缩小问题范围、直到完整达成用户目标的闭环执行机制。简单概括:AI 不会一次性写完所有代码,而是分多轮「执行→观测→修正→推进」,每一轮缩小待解决问题的缺口,直到任务完全收尾、验证通过,形成完整闭环(Closure)。
2026-06-18 20:36:36
162
原创 LLM Skills 完整讲解(大模型智能体能力集)
是给 LLM 智能体预先定义好的、标准化的,告诉大模型「它能完成哪些细分工作、每种任务该怎么做、输出什么格式」,是 Agentic Coding(编程智能体)的核心组成部分。对应你上一张图里的Skills分层,由一份份Skill.md文件统一管理。
2026-06-18 20:29:56
188
原创 Gemini Code Assist 完整介绍
个人免费额度极其丰厚,日常写代码几乎不限量;官方原生 IDE 集成,界面流畅无额外配置门槛;百万级超长上下文,读懂完整大型项目;多模态图文混合输入,截图转代码能力强;谷歌云开发场景无可替代,云原生代码生成精准;配套 CLI 终端工具,打通 IDE + 命令行全流程。
2026-06-18 11:44:26
229
原创 Cline(VS Code AI 编程插件)完整介绍
GitHub 5.8w+ Star,VS Code 市场安装量超 500 万;核心设计思路:让 AI 深度操作本地完整代码仓库,而非仅处理单段选中代码;和你截图里的 Continue 是同类型侧边栏 AI 工具,但自动化能力差距极大。
2026-06-18 05:24:26
194
1
原创 OpenRouter 完整介绍
OpenRouter 是统一大模型 API 网关 / 聚合平台,定位「One API for Any Model」:只用一套兼容 OpenAI 标准的接口、一个统一 Key,就能调用全球 60 + 服务商、400 + 款大模型,平台本身不自研大模型,只做流量路由、负载均衡、统一计费与兼容转换OpenRouter。
2026-06-17 04:17:53
161
原创 OpenCode(sst/opencode)完整详解
OpenCode 是开发、MIT 开源协议的,对标 Anthropic 闭源的 Claude Code,主打无厂商锁定、本地离线可用、全链路工程自动化。,2025 年发布,现已 16 万 + Star。
2026-06-17 02:46:54
225
原创 AWS Kiro和Google Antigravity
二者是 2025–2026 主流,分别由 AWS、Google 推出,对标 Cursor、Continue,主打全流程自动化工程开发,下面分开介绍并横向对比。
2026-06-17 01:34:57
319
原创 OpenRouter 完整介绍
OpenRouter 是,定位「One API for Any Model」:只用一套兼容 OpenAI 标准的接口、一个统一 Key,就能调用全球 60 + 服务商、400 + 款大模型,平台本身不自研大模型,只做流量路由、负载均衡、统一计费与兼容转换OpenRouter。
2026-06-17 01:16:05
195
原创 VS Code 免费开源 AI Playground 类插件完整对比
下面分三类整理:全能型 Prompt 调试工作台、Ollama 本地离线专用、轻量 API 调试工具,全部,对标 PyCharm Pro 的 AI Playground。
2026-06-17 00:54:56
139
原创 openai/gpt-oss-120b
gpt-oss-120b 是 OpenAI 于 2025 年 8 月发布的开放权重(Open Weight)大语言模型,也是 GPT-2 之后 OpenAI 首次公开发布权重的旗舰级模型。
2026-06-15 20:40:50
260
原创 codex和open claude两者只有客户端工具开源,底层大模型权重全部闭源
社区独立开发的第三方编程 CLI 工具,仓库完全公开,可本地编译、自定义修改,支持对接几乎所有主流大模型 API:Claude、OpenAI、Gemini、Ollama 本地模型、DeepSeek 等。,Rust+TS 编写,完整源码开放,可自由修改、二次分发、本地编译安装。
2026-06-15 19:33:01
250
原创 GPT-OSS 全称:GPT Open Source Software
GPT-OSS全称:GPT Open Source Software,是OpenAI 官方推出的开放权重大模型系列,2025 年 8 月正式发布,是 OpenAI 继 GPT-2 之后时隔多年再次放出可本地私有化部署的 GPT 权重模型。OSS = Open Source Software(开源软件);注意:它是开放权重模型(权重文件可下载本地运行),并非完整开源训练代码;许可证为宽松的 Apache 2.0,允许商用、二次微调、私有化部署OpenAI。
2026-06-14 05:46:43
247
原创 LangChain+LangGraph+GPT-OSS+Groq Cloud
✅ 全链路开源可控:GPT-OSS 不依赖商用大模型 API,无调用额度与数据出境问题 ✅ 复杂 Agent 能力拉满:LangGraph 原生支持反思、重试、多分支,适合长任务智能体 ✅ 部署灵活:Groq Cloud 云端托管模型,不用自备高端 GPU ✅ 开发成熟:LangChain 生态组件齐全,RAG、工具集成开箱即用。
2026-06-14 05:43:44
287
原创 Devin AI和Lovable区别
解决非技术人快速做网页应用的需求;二者可以搭配使用:Lovable 快速出产品原型,再交给 Devin 做底层架构重构、工程化改造,转为正式线上项目。,解决程序员编码、工程化效率问题;Lovable 面向。
2026-06-13 22:02:50
192
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅