Esaka_Forever-CSDN博客

原创 Ollama vs LM Studio Mac M 系列完整对比（2026 最新）

官网下载 dmg 安装包，打开后直接在应用内搜索下载模型，点击 Start Server 开启 API。

2026-06-28 00:24:24 14

原创忍无可忍卸载WPS，换办公软件后电脑终于安静了

今天结合2026年6月全网真实用户反馈、官方最新回应、多款替代软件实测体验，完整聊聊WPS如今口碑翻车的核心原因，再把当下几款无广告、免费合规的替代软件优缺点讲透，不管是低配笔记本、Mac、Windows，还是经常处理PDF、多人协作的上班族，都能找到适配自己的选择。可近大半年，软件体验断崖式下滑，弹窗广告、强制占用C盘、基础功能锁会员、偷偷篡改系统默认打开方式，一堆糟心事堆在一起，上周写重要方案时又弹出续费广告直接卡死文档，我当场下定决心彻底卸载，换了全新办公套件。切换使用一周后，最直观的感受就是清净。

2026-06-27 17:07:06 37

原创 Zero-Shot / One-Shot / Few-Shot / Chain-of-Thought 完整对比（Prompt Engineering 核心技巧）

提供1 组完整标准答案示例，让模型模仿示例的格式、逻辑、措辞生成回答。提供2~5 组标准输入 + 输出示例，是工程里最常用的提示方案，给模型多个参考范本，大幅降低输出跑偏概率。让模型分步拆解、写出中间推理过程，再给出最终答案，专门解决数学计算、逻辑推理、多步骤复杂问题。/ 一步步推导。

2026-06-27 16:46:54 72

原创在 LangChain 框架中，Runnable 是一个最核心的“底层协议（Protocol）”或“标准接口”。

在 LangChain 框架中，是一个最核心的“底层协议（Protocol）”或“标准接口”。简单来说，LangChain 里几乎所有的核心组件（如提示词模板、大模型、输出解析器、检索器、自定义函数等），在底层都继承或实现了接口。它的核心思想是：“任何组件，本质上都是一个‘接受输入，经过处理，产生输出’的独立任务单元。”在早期的 LangChain 中，调用不同组件的命令非常混乱。调用 LLM 用，调用 Chain 用，调用检索器用。这导致组件之间很难优雅地拼接。为了解决这个痛点，LangCha

2026-06-27 15:58:43 45

原创 Prompt Engineering 提示词工程完整详解

提示词工程是一套写指令的标准化技巧，不靠改模型，只靠优化输入文本，精准控制大模型输出内容、格式、逻辑，是开发 LLM 应用最基础、成本最低的优化手段。

2026-06-27 15:48:20 47

原创 Chain Composition｜LangChain 链路组合（链式编排）

Chain Composition 是 LangChain 提供的链路拼装体系，用管道、并行、分支等方式拼接提示词、模型、解析器、自定义逻辑，搭建复杂 AI 任务流水线。

2026-06-27 15:41:25 28

原创 from langchain_openai import ChatOpenAI

ChatOpenAI是 LangChain 官方拆分独立包提供的，专门对接 OpenAI 系列对话接口（GPT-4.1、GPT-4o、GPT-3.5-turbo 等），替代旧版。

2026-06-26 16:12:45 127

原创 python-dotenv 和 dotenv区别

在 Python 开发中，这两者其实很容易让人产生混淆。

2026-06-26 16:12:07 122

原创 LLM Token 完整通俗详解（从底层原理到计费、实操全覆盖）

Token 是大语言模型（LLM），可以理解成：模型专属 “文字积木”。人类读写用汉字、英文单词，AI 只认 Token；所有输入提问、AI 输出回答，都会先拆成一堆 Token 再运算。

2026-06-26 14:20:12 183

原创逐段拆解 client、response 含义

client：创建连接 OpenAI 服务的通信工具；用client发送提问请求；response：接收 AI 服务器返回的整套结果，从中提取 AI 回答文本。

2026-06-26 13:43:18 206

原创 OpenRouter vs Ollama 完整区别对比

一句话总结： OpenRouter = 云端聚合 API（联网、付费、能调用 GPT/Claude 等闭源模型） Ollama = 本地运行工具（离线、免费、只跑开源模型，数据不出本机）云端第三方 AI 网关 / 聚合平台本地开源工具，在你自己电脑跑大模型表格你现在是做课堂 AI API 实验，OpenAI 官方额度耗尽报 429，两个方案取舍：python运行

2026-06-26 12:06:22 197

原创 Mac 创建 Python 虚拟环境两种主流方案

bash运行执行后当前目录生成venv文件夹，存放独立 Python、pip、所有包。

2026-06-25 20:33:55 212

原创 Debian/Ubuntu 新版系统（Python3.11+）的 PEP 668 外部环境保护机制，不允许直接在系统全局 Python 用 pip 安装包，优先推荐虚拟环境

这是 Debian/Ubuntu 新版系统（Python3.11+）的，不允许直接在系统全局 Python 用pip安装包，防止破坏系统自带工具。下面给你三种稳妥方案，优先推荐虚拟环境。

2026-06-25 17:12:27 180

原创 ChromaDB vs Pinecone 完整对比

本地调试、离线、小数据、省钱、隐私优先 → ChromaDB线上生产、大数据、高并发、不想运维、愿意付费 → Pinecone。

2026-06-24 16:53:53 376

原创 LangChain 完整全解析

极致生态集成：兼容几乎所有大模型、向量库、文件格式、第三方工具，社区方案极多；统一抽象，组件插拔：换本地 Chroma / 云端 Pinecone、切换 GPT / 千问几乎不用改动业务代码；一站式覆盖 RAG、对话、Agent、自动化，从原型到生产完整链路；LCEL 管道语法简洁易读，支持流式、异步、批量；配套 LangSmith 解决复杂 Agent 调试难题。→ LangChain Memory 组件实现会话上下文；

2026-06-23 22:52:08 161

原创 LLM 与 Agent 完整区分：一句话核心

是神经网络模型，训练目标只做：文本理解、逻辑推理、续写文字。输入：用户一段提示词 Prompt输出：一段文字回答开环单次交互—— 一问一答，无后续自主动作短板：知识截止、没有手脚、不会拆分任务、记不住跨会话内容、无法操作外部系统代表：GPT-4o、Llama 3、Qwen、Claude、Gemini Flash/Nano/Mini 等（你前面问的所有模型都只是 LLM）LLM 是思考引擎，只负责文字生成；Agent 是带手脚、记忆、规划的自主执行系统，把 LLM 的思考落地成真实可操作的结果。

2026-06-23 20:02:52 188

原创 Nano / Mini / Flash Model 完整释义（LLM 行业通用）

主打手机、手表、嵌入式、本地离线运行。

2026-06-23 14:31:57 207

原创 short term memory（短期记忆） vs context window（上下文窗口）

Context window = 装记忆的盒子，有固定大小Short term memory = 盒子里现在装着的对话内容盒子太小，里面的旧东西就会被扔掉，短期记忆随之消失。

2026-06-23 14:08:32 204

原创人类记忆分类与 LLM 的核心映射

将人类的认知记忆分类（）与大语言模型（LLM）的架构和工程技术进行映射，是一个极其精妙且深刻的类比。在认知心理学中，这些记忆组成了人类的整个智能系统；而在现代大模型工程（尤其是在 2026 年的 Agent 和 RAG 架构共识）中，它们分别对应着 LLM 的。

2026-06-23 01:31:22 239

原创大模型知识 / 能力四大载体：MCP、RAG、Fine-tuning、Skills 完整区分

相当于 AI 的 USB-C 接口，统一规范模型访问外部资源（工具、数据库、文件、实时 API），是。：封装一套完整任务流程（SOP、函数调用、思考步骤），靠提示词 / 函数描述定义，：外置向量数据库存文档，提问时检索相关片段塞入上下文，：训练更新模型权重，知识永久内化，对应你之前那句。：Anthropic 推出的。

2026-06-22 22:42:20 198

原创微调（Fine-tuning）通过更新模型权重，使模型学习特定领域的数据分布、知识和任务模式，并将这些信息编码到参数中，从而在推理时表现出相应能力。

当你进行微调时（无论是全量微调还是 LoRA 等轻量化微调），你把特定领域的任务数据（如：医疗病历、金融合同、特定格式的 JSON 输出）喂给模型。：新知识不再是外挂的，而是融入了模型的注意力机制（Attention Blocks）中，这使得模型在面对该领域从未见过的类似提问时，能够展现出极强的泛化推理（Generalization）能力。此时的参数（Weights）是一个通用的概率分布。：是在大模型工作时，塞给他一本“最新的企业内部百科全书”，随时翻阅（确保获取的事实 100% 准确、最新且随时可查）。

2026-06-22 18:28:54 187

原创 MCP（Model Context Protocol，模型上下文协议）

MCP（Model Context Protocol）是一种让大模型能够用统一方式连接文件、数据库、GitHub、Notion、Slack 等外部工具的开放标准协议，相当于 AI Agent 生态中的“USB-C 接口”。

2026-06-22 13:21:24 237

原创 Skill.md 三阶段加载机制（基于 Progressive Disclosure 渐进披露架构）

整套机制是为了控制 Token 开销，不一次性把完整技能全部塞进上下文，分三层懒加载，对应 Cline/Cursor 编码智能体标准设计。

2026-06-20 05:04:19 205

原创 Procedural Knowledge 程序性知识

对应另一个概念，是认知科学、LLM Agent 领域核心二分概念。

2026-06-19 21:33:45 199

原创大模型 Reasoner 完整释义（推理核心单元）

是 AI Agent 体系里的核心认知模块，相当于智能体的 “大脑思考中枢”。Reasoner= 负责逻辑规划、迭代收敛（Progressive Closure）的思考层；Skills= 封装好的标准化业务执行流程；Tools= 底层可调用操作（读文件、终端、Git）。

2026-06-19 21:27:49 199

原创 AI Agent Skills（智能体技能）完整详解

Tool（工具）= 底层原子动作（读文件、跑终端、搜网页）Skill（技能）= 上层复合业务流程，编排多个 Tool 完成一件完整事Agent（智能体）= 调度大脑，识别意图并匹配对应 Skill 执行。

2026-06-19 21:18:11 228

原创 Progressive Closure 渐进式收敛（Agentic Coding 智能体核心概念）

Progressive Closure 是编码智能体分阶段迭代、逐步缩小问题范围、直到完整达成用户目标的闭环执行机制。简单概括：AI 不会一次性写完所有代码，而是分多轮「执行→观测→修正→推进」，每一轮缩小待解决问题的缺口，直到任务完全收尾、验证通过，形成完整闭环（Closure）。

2026-06-18 20:36:36 162

原创 LLM Skills 完整讲解（大模型智能体能力集）

是给 LLM 智能体预先定义好的、标准化的，告诉大模型「它能完成哪些细分工作、每种任务该怎么做、输出什么格式」，是 Agentic Coding（编程智能体）的核心组成部分。对应你上一张图里的Skills分层，由一份份Skill.md文件统一管理。

2026-06-18 20:29:56 188

原创 Gemini Code Assist 完整介绍

个人免费额度极其丰厚，日常写代码几乎不限量；官方原生 IDE 集成，界面流畅无额外配置门槛；百万级超长上下文，读懂完整大型项目；多模态图文混合输入，截图转代码能力强；谷歌云开发场景无可替代，云原生代码生成精准；配套 CLI 终端工具，打通 IDE + 命令行全流程。

2026-06-18 11:44:26 229

原创 Cline（VS Code AI 编程插件）完整介绍

GitHub 5.8w+ Star，VS Code 市场安装量超 500 万；核心设计思路：让 AI 深度操作本地完整代码仓库，而非仅处理单段选中代码；和你截图里的 Continue 是同类型侧边栏 AI 工具，但自动化能力差距极大。

2026-06-18 05:24:26 194 1

原创 OpenRouter 完整介绍

OpenRouter 是统一大模型 API 网关 / 聚合平台，定位「One API for Any Model」：只用一套兼容 OpenAI 标准的接口、一个统一 Key，就能调用全球 60 + 服务商、400 + 款大模型，平台本身不自研大模型，只做流量路由、负载均衡、统一计费与兼容转换OpenRouter。

2026-06-17 04:17:53 161

原创 OpenCode（sst/opencode）完整详解

OpenCode 是开发、MIT 开源协议的，对标 Anthropic 闭源的 Claude Code，主打无厂商锁定、本地离线可用、全链路工程自动化。，2025 年发布，现已 16 万 + Star。

2026-06-17 02:46:54 225

原创 AWS Kiro和Google Antigravity

二者是 2025–2026 主流，分别由 AWS、Google 推出，对标 Cursor、Continue，主打全流程自动化工程开发，下面分开介绍并横向对比。

2026-06-17 01:34:57 319

原创 OpenRouter 完整介绍

OpenRouter 是，定位「One API for Any Model」：只用一套兼容 OpenAI 标准的接口、一个统一 Key，就能调用全球 60 + 服务商、400 + 款大模型，平台本身不自研大模型，只做流量路由、负载均衡、统一计费与兼容转换OpenRouter。

2026-06-17 01:16:05 195

原创 VS Code 免费开源 AI Playground 类插件完整对比

下面分三类整理：全能型 Prompt 调试工作台、Ollama 本地离线专用、轻量 API 调试工具，全部，对标 PyCharm Pro 的 AI Playground。

2026-06-17 00:54:56 139

原创 openai/gpt-oss-120b

gpt-oss-120b 是 OpenAI 于 2025 年 8 月发布的开放权重（Open Weight）大语言模型，也是 GPT-2 之后 OpenAI 首次公开发布权重的旗舰级模型。

2026-06-15 20:40:50 260

原创 codex和open claude两者只有客户端工具开源，底层大模型权重全部闭源

社区独立开发的第三方编程 CLI 工具，仓库完全公开，可本地编译、自定义修改，支持对接几乎所有主流大模型 API：Claude、OpenAI、Gemini、Ollama 本地模型、DeepSeek 等。，Rust+TS 编写，完整源码开放，可自由修改、二次分发、本地编译安装。

2026-06-15 19:33:01 250

原创 GPT-OSS 全称：GPT Open Source Software

GPT-OSS全称：GPT Open Source Software，是OpenAI 官方推出的开放权重大模型系列，2025 年 8 月正式发布，是 OpenAI 继 GPT-2 之后时隔多年再次放出可本地私有化部署的 GPT 权重模型。OSS = Open Source Software（开源软件）；注意：它是开放权重模型（权重文件可下载本地运行），并非完整开源训练代码；许可证为宽松的 Apache 2.0，允许商用、二次微调、私有化部署OpenAI。

2026-06-14 05:46:43 247

原创 LangChain+LangGraph+GPT-OSS+Groq Cloud

✅ 全链路开源可控：GPT-OSS 不依赖商用大模型 API，无调用额度与数据出境问题 ✅ 复杂 Agent 能力拉满：LangGraph 原生支持反思、重试、多分支，适合长任务智能体 ✅ 部署灵活：Groq Cloud 云端托管模型，不用自备高端 GPU ✅ 开发成熟：LangChain 生态组件齐全，RAG、工具集成开箱即用。

2026-06-14 05:43:44 287

原创 Devin AI和Lovable区别

解决非技术人快速做网页应用的需求；二者可以搭配使用：Lovable 快速出产品原型，再交给 Devin 做底层架构重构、工程化改造，转为正式线上项目。，解决程序员编码、工程化效率问题；Lovable 面向。

2026-06-13 22:02:50 192

空空如也

空空如也