自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 GEO优化到底是做什么的?我自研了一套全流程系统,分享实战经验

我们团队用几个月时间,自研了一套完整的GEO优化系统,覆盖从诊断到执行到监控的全流程。目前已经在豆包、DeepSeek、通义千问、元宝、文心一言等主流AI引擎上完成了验证。但真正落地的团队不多,能做出案例的更少。有兴趣可以联系聊聊,免费帮你的商户做一次AI搜索可见度诊断。5. 多平台分发 — 内容分发至知乎、头条号、搜狐号、网易号等。4. 内容创作 — 围绕目标关键词,创作AI友好的高质量内容。3. 品牌诊断 — 诊断当前AI提及率,制定优化方案。- 三四线城市小商户(餐饮、家装、教培、本地服务)

2026-06-09 09:24:54 289

原创 向量数据库在 AI 应用中的角色:从 Milvus 到 Chroma

长期记忆(存储 Agent 对话历史的知识片段)、知识库索引(RAG 的核心组件)和语义检索引擎(替代传统关键词搜索)。无论选择哪个产品,都要关注三个关键指标:召回率、查询延迟和写入吞吐量。在实际项目中,我建议先用 Chroma 快速验证方案可行性,当数据量增长或性能成为瓶颈时再平滑迁移到 Milvus 或 Qdrant。这种渐进式策略可以避免过早引入复杂的基础设施,同时保证后续的扩展能力。向量数据库正在快速演进,新的产品和特性不断涌现。理解不同产品的设计哲学和适用边界,才能在实际项目中做出最合适的选择。

2026-06-09 08:07:55 42

原创 向量数据库在 AI 应用中的角色:从 Milvus 到 Chroma

向量数据库已经从「有没有必要用」的阶段进入了「怎么用好」的阶段。对于 AI 应用开发者来说,理解不同向量数据库的定位和权衡,比纠结于某一种技术的细节更重要。从 Milvus 的工业级能力到 Chroma 的极简体验,向量数据库正在不断降低 AI 应用的门槛,让开发者能更专注于业务逻辑而非基础设施。

2026-06-08 14:08:26 151

原创 RAG 技术的进化:从朴素检索到 Agentic RAG

从朴素 RAG 到 Agentic RAG,我们见证了检索增强生成技术的三次跨越。朴素 RAG 证明了"检索 + 生成"这个范式可行,高级 RAG 证明了这个范式可以优化得很深,Agentic RAG 则证明了大模型自主决策能力可以彻底改变信息检索的方式。对于 AI 应用开发者来说,理解这条进化路径的意义在于:RAG 不是终点,它更像是一个起点。未来的 AI 系统不会只有一种固定的检索模式,而是会根据场景和任务动态调整检索策略,真正做到"因时制宜、因事制宜"。

2026-06-08 08:22:37 177

原创 AI 时代的编程教育:还需要学编程吗?

回到开头的问题:AI 时代还需要学编程吗?不仅要学,而且要学得更好、更聪明。但学习的目标和路径需要彻底改变。过去我们学编程是为了「能写出代码」。现在和未来,学编程是为了「能理解、评估、改进代码」。前者是一个技能,后者是一种思维方式。技能可以被工具替代,但思维方式不会——它会渗透到你解决问题的每一个环节,无论你用不用电脑。AI 不是编程教育的终结者,而是放大镜。它放大了懂编程的人的价值,也放大了不懂编程的人的脆弱。在这个新的时代,编程教育的意义不是教人写代码,而是教人以计算思维去理解世界、改造世界。

2026-06-07 14:07:52 178

原创 AI 编程助手实测对比:GitHub Copilot vs Cursor vs Codeium

2025 年到 2026 年,AI 编程辅助工具从"新鲜事物"变成了"开发标配"。市面上最受关注的三个产品——GitHub Copilot、Cursor 和 Codeium——各自在不同场景下有着截然不同的表现。本文基于三个月实际项目中的深度使用,从代码补全、上下文理解、多文件编辑、价格等维度做一次全面的对比评测。Cursor(Composer)>> Copilot(Chat)> Codeium(无)Codeium(免费)> Copilot($10/月)> Cursor($20/月)

2026-06-07 08:10:28 202

原创 为什么说 2025-2026 是 AI 应用的爆发元年

模型能力足够强且稳定推理成本足够低Agent 框架足够可靠基础设施足够完善市场需求足够明确就像 2010 年移动互联网井喷一样,移动网络、智能手机、应用商店、开发工具在那一两年同时到了临界点。今天的 AI 应用也在经历类似的关键节点。选一个你熟悉且真实存在的需求,把 AI 当作工具嵌进去,尽快推出你的第一款 AI 产品。这个窗口不会永远敞开,但此刻,它敞得比任何时候都大。

2026-06-06 14:01:54 230

原创 MoE(混合专家)架构为什么成了大模型标配

传统的 Transformer 模型遇到一个问题:模型越大,推理成本越高。一个 1750 亿参数的 GPT-3,每次生成 token 都需要激活所有参数,计算量极大。不要每次都用全部参数,而是只激活其中一部分「专家」。具体来说,MoE 层包含多个独立的 Feed-Forward Network(FFN)子网络,每个称为一个「专家」(Expert)。输入 token 经过一个门控网络(Router)后,只会被路由到最相关的 top-k 个专家进行处理。

2026-06-06 08:20:05 238

原创 一家教培机构在AI搜索里“消失“之后:GEO优化的技术复盘

《密云本地商户AI搜索优化案例复盘》摘要:本文通过密云某教育机构的真实案例,系统阐述了本地商户如何通过GEO优化重建数字化存在。诊断阶段发现三大核心问题:多平台信息不一致导致实体置信度低、评价缺乏量化描述导致语义权重不足、非结构化内容难以被AI匹配。优化方案包含信息对齐、意图挖掘、结构化内容重构和评价引导改造四个维度,最终实现获客成本降低56%。文章揭示了GEO优化的本质是提升商户在LLM生成答案时的引用概率,而非传统SEO的排名提升,为本地商户提供了可复制的技术方案和实施路径。(149字)

2026-06-05 23:14:33 502

原创 LoRA 微调:用少量数据定制自己的 AI 模型

如果你关注过 AI 模型微调,一定听过 LoRA 这个词。LoRA 全称是(低秩适应),由微软研究院在 2021 年提出,如今已成为大模型微调领域最主流的方案之一。不动原模型权重,只训练一小部分新增的低秩矩阵。打个比方:你有一个训练好的千亿参数大模型,就像一部精装百科全书。你想让它学会写特定风格的文案,以前的做法是在全书上重新标注、从头再印一遍——这既贵又慢。而 LoRA 的做法是,在每一章后面加一张"便签纸",只调整便签纸上的内容,原书纹丝不动。

2026-06-05 14:02:50 234

原创 AI 编程助手实测对比:GitHub Copilot vs Cursor vs Codeium

过去两年里,AI 编程助手从一个新鲜的概念变成了越来越多开发者日常工具箱中的标配。作为一名 AI 技术从业者,我几乎每天都会接触这些工具。和。

2026-06-05 08:18:43 202

原创 AI 编程助手实测对比:GitHub Copilot vs Cursor vs Codeium

过去两年里,AI 编程助手从一个新鲜的概念变成了越来越多开发者日常工具箱中的标配。作为一名 AI 技术从业者,我几乎每天都会接触这些工具。和。

2026-06-05 08:13:33 221

原创 Cursor + Claude:AI 编程辅助工具的新玩法

Cursor + Claude 的组合,本质上是「好的 IDE 集成」+「好的推理模型」的乘法效应。Cursor 让你在编码环境中无缝使用 AI,而 Claude 提供了更深层次的代码理解和架构思考能力。如果你想提升日常编码效率,不妨试试这个组合:用 Cursor 作为主编辑器处理日常编码,用 Claude 处理复杂设计和架构决策。两者的边界清晰、互补性强,是目前 AI 辅助编程的最佳实践之一。

2026-06-04 14:03:26 226

原创 从搜索引擎到对话引擎:信息获取方式的根本变革

从搜索引擎到对话引擎,本质上是从「信息检索」到「知识服务」的跨越。搜索引擎帮你找到信息的位置,对话引擎帮你完成信息的理解和整合。这不是替代,而是分工——搜索引擎负责「定位已知的未知」,对话引擎负责「探索未知的未知」。开始关注 GEO,因为它可能是未来 3-5 年最重要的内容分发渠道之一。当用户的第一个问题不再是「百度一下」,而是「问 AI」,你的内容是否还在答案里,就成了一个值得认真对待的问题。

2026-06-04 08:06:03 231

原创 AI 搜索引擎的崛起:Perplexity、GEO 与传统搜索的差异

AI 搜索引擎代表的不是搜索技术的改良,而是信息获取范式的根本变革。Perplexity 验证了 RAG 架构的产品可行性,GEO 正在重塑内容创作的游戏规则。对于技术从业者,理解这一转变比选择工具更重要——因为无论你用不用 AI 搜索,你的用户已经在用了。这场变革才刚刚开始。

2026-06-03 14:04:20 396

原创 MoE(混合专家)架构为什么成了大模型标配

2023 年,当 Mistral 发布 Mixtral 时,很多人觉得 MoE 只是一个「不错的技巧」。到了 2025 年,MoE 已经成为了大模型的默认架构。这不是偶然——在算力成本压力越来越大的背景下,任何能「用更少计算做更多事情」的技术都会成为主流。对于做 AI 应用的开发者来说,理解 MoE 的几个关键参数(总参数 vs. 激活参数、top-K 值、专家数量)比深入理解注意力机制本身更为实际——因为这些参数直接决定了你的模型在部署时的显存需求、推理速度和成本。

2026-06-03 08:09:00 234

原创 RAG 技术的进化:从朴素检索到 Agentic RAG

如果你正在考虑给自己的产品加上「AI 对话」功能,我的建议是:先从朴素 RAG 跑通最小闭环,然后逐步上 reranker、加查询改写、引入 Router 路由,到最后需要处理复杂查询时再引入 Agentic 模式。」系统自信地回答了一个数字——可惜是错的。:动态判断问题的复杂度,简单问题直接回答不检索,中等复杂度单轮检索,复杂问题启动多步检索链路。——Agentic RAG 的 Token 消耗是传统 RAG 的 3-10 倍,如何用更小的模型、更聪明的缓存策略降低成本,是所有工程团队要面对的现实问题。

2026-06-02 14:03:10 242

原创 为什么说 Claude 的 Artifacts 改变了 AI 交互范式

我在想,也许再过一两年,AI 聊天界面里会直接嵌入一个微型运行时——你说「帮我做一个记账工具」,它不只是给你看预览,而是直接给你一个可以保存、可以分享、可以长期使用的完整小应用。你拿了这个信息之后要做什么,那是你自己的事。如果你从 2022 年底就开始用 ChatGPT,那你一定经历过这个场景:让 AI 写一段代码,它吐了一大段出来,你复制粘贴到编辑器里,跑一下发现不对,又切回对话框让它改,它又吐一大段,你再复制……这个转变,让 AI 从一个「告诉你该怎么做」的军师,变成了一个「直接给你看成品」的工匠。

2026-06-02 08:07:41 175

原创 AI 写代码的边界在哪里?一个实际项目的反思

但一跑测试就炸:有三处状态转移的条件判断是错的,因为它不理解「已支付但未发货」和「已发货但未签收」在业务上的本质区别。它看到的是两个类似的状态名,我看到的是两套完全不同的售后流程。但如果问题是你们公司特有的业务规则,或者需要从零设计一个架构方案,AI 只能给出大路货的建议——看起来都对,但放到具体场景里总是差一口气。所以我现在的工作流变成了这样:复杂的设计决策我自己做,画完图写完设计文档之后,把「执行」的部分拆成小块扔给 AI。这个认识不是从论文里读来的,是踩了一个月的坑换来的。你能说清楚的事,它就能做;

2026-06-01 14:05:09 242

原创 AI 编程助手实测对比:GitHub Copilot vs Cursor vs Codeium

这次对比让我意识到一件事:AI 编程助手的竞争才刚刚开始。Copilot 有生态优势,Cursor 有体验优势,Codeium 有价格优势。未来一年,我猜这三家的差距会进一步拉大,而赢家可能会是那个最懂"开发者真正需要什么"的产品。至少从我目前的使用体验来看,它们已经不只是玩具了——它们是真正能帮你干活的生产力工具。

2026-06-01 08:04:47 204

原创 Qwen2.5 模型架构解读:国产大模型的进化

Qwen2.5 代表了中国大模型在工程化方向上迈出的坚实一步。它没有追求架构上的花哨创新,而是在已有的 Transformer 框架下,把每一个细节——从激活函数到注意力机制,从分词器到训练策略——都做到位了。这种"工程优先"的思路,恰恰是当前大模型落地最需要的。如果你正在选型国产大模型做应用开发,Qwen2.5 系列值得认真考虑。尤其是 MoE 版本的 32B-A14B,在性价比上给出了一个很难拒绝的选择。

2026-05-31 14:01:30 231

原创 AI 写代码的边界在哪里?一个实际项目的反思

AI 写代码正在改变我们的工作方式,这一点毋庸置疑。但如果说"AI 要取代程序员",我觉得还远。更准确的说法是:AI 会取代"只会写重复代码的程序员",但不会取代"能判断边界在哪的程序员"。我们真正的竞争力,不是敲键盘的速度,而是对业务的理解、对系统设计的判断、以及在面对不确定问题时做决策的能力。AI 是工具,不是答案。能判断工具的边界在哪,本身就是一种核心能力。

2026-05-31 08:04:48 182

原创 Token 是怎么来的?大模型文本分词原理入门

Tokenization 是大模型的第一道工序,也是最容易被忽视的环节。它决定了模型「看到」的文本是什么样的,直接影响模型的训练效率、推理速度和理解能力。下次看到界面上跳动的 token 数字时,希望你能想起——这不仅仅是一个计费单位,更是大模型理解人类语言的最基础单元。你还遇到过什么跟 token 相关的有趣问题?欢迎在评论区留言讨论。

2026-05-30 14:01:31 146

原创 大模型的幻觉问题为什么无法彻底消除

每次跟身边朋友聊大模型,总有人会问同一个问题:「为什么 ChatGPT 还是会一本正经地胡说八道?」这个问题背后其实是整个 AI 行业最棘手也最迷人的技术难题——幻觉(Hallucination)。五年过去了,从 GPT-3 到 GPT-4o,再到 Claude、Gemini、DeepSeek,模型智商翻了好几倍,但幻觉问题就像影子一样甩不掉。今天我想聊聊,为什么这个问题从根子上就无法彻底消除。

2026-05-30 08:03:32 303

原创 AI 写代码的边界在哪里?一个实际项目的反思

问题出现在我让 AI 处理更复杂的需求时——比如解析 upstream 块中的 health_check 参数,这些参数在不同版本 Nginx 中的行为不一样。最终我的做法是:让 AI 生成了解析器的初版代码和所有测试用例,然后我自己重写了 health_check 版本感知的核心逻辑,并加上了生产环境需要的数据校验和报警机制。但至少在现在这个阶段,一个好的开发者不是会写多少代码,而是知道什么时候代码应该由 AI 写,什么时候必须自己来。这个能力本身,恰恰是 AI 暂时还教不会我们的。

2026-05-29 08:51:36 580

原创 2026 年 AI 开源的三大趋势

回顾 2026 年上半年,开源 AI 的生态已经从「能否追上闭源」变成了「如何超越闭源」。模型能力不再是瓶颈,Agent 和工具链的成熟度才是。对开发者来说,这是一个非常好的时代——你有更多选择、更低的成本、更好的工具。但也意味着你需要持续学习,因为技术栈的变化速度没有减慢,只是更加体系化了。未来半年我比较关注的方向:一是开源多模态模型的实用性提升(目前文本模型很强但多模态还有差距),二是 Agent 的可靠性和可观测性工具(现在的 Agent 出了错很难排查)。

2026-05-29 08:01:23 552

原创 MCP 协议:AI Agent 连接外部工具的新标准

它不是那种"等等看"的技术——早期参与者的经验会沉淀成生态优势,等到生态成熟再接入,成本反会更高。MCP 是工具的定义和发现机制——Agent 去哪里找工具、工具的接口长什么样、怎么安全地调用。Agent 可以按需读取这些资源,类似 RESTful API 的 GET 请求,但同时支持订阅机制,当资源变化时主动通知 Agent。你用 Claude、GPT、DeepSeek 还是本地跑的 Qwen,只要 Agent 支持 MCP,就能用同一套工具生态。这是最常用的交互模式,也是和传统 API 最接近的部分。

2026-05-28 08:02:04 360

原创 Linux Crontab 定时任务配置实战指南

crontab 虽然古老,但简单可靠,掌握它的几个关键知识点——路径问题、日志配置、特殊字符转义——就能避免绝大多数踩坑场景。下次遇到定时任务不执行的情况,按照「权限→路径→日志→语法」的顺序排查,基本都能快速定位问题。

2026-05-27 08:01:01 285

原创 用一个苹果和一个橘子,给娃讲明白什么是「监督学习」——AI入门亲子教程

老师给出(数据 + 答案)→ [苹果图片 + "这是苹果"]↓AI观察、找规律 → [红色 + 圆形 + 小把儿 = 苹果]↓AI自己判断新数据 → [新水果 → 苹果!↓越练越准,直到学会 ✅要素什么意思故事里对应什么数据(Data)AI看到的信息水果的图片/特征标签(Label)正确答案"这是苹果""这是橘子"模型(Model)AI学会的本事小智判断苹果橘子的能力监督学习 = 有老师教的学习老师提供「题目 + 答案」→ 这叫数据集 + 标签学生总结「规律」→ 这叫特征提取。

2026-05-26 12:06:26 734

原创 GitHub Actions 入门:从零搭建你的第一个 CI 工作流

GitHub Actions 是 GitHub 内置的 CI/CD 持续集成与持续部署工具。简单说,就是当你在 GitHub 上 push 代码、创建 PR 或发布 Release 时,自动执行你定义的一系列任务——比如跑测试、构建项目、部署到服务器。跟 Jenkins、GitLab CI 相比,GitHub Actions 的最大优势是跟仓库深度绑定,不需要额外搭建 CI 服务器,直接在仓库里写个 YAML 配置文件就能跑起来。GitHub Actions 是我用过最顺手的 CI/CD 工具之一。

2026-05-26 08:01:54 175

原创 血与泪的教训:一台腾讯云服务器跑两个 Hermes AI Agent,各绑独立飞书机器人,踩坑全记录

假设你已经在用 Hermes Agent 作为你的 AI 助手,通过飞书 Bot 和它对话。你希望有一个"工作专用"的 Agent,只处理数据分析、代码任务另一个"日常助手"的 Agent,用来查资料、写文案、闲聊或者你想让朋友/同事也能用,但不想让他们看到你的完整系统权限跑两个 Hermes 实例,各绑一个飞书机器人。听起来简单,但我踩了一下午的坑。这篇文章就是帮你把这半天省下来的——跟着做,10 分钟搞定。你只需要去飞书开放平台申请一个机器人,把 App ID 和 Secret 拿来;

2026-05-25 09:28:47 566

原创 分享几个我常用的 Python 调试技巧

user = User("张三", 28)print(user) # 输出:User(name='张三', age=28)这样在调试时看到对象就能直接了解它的状态,不用一个个去查属性值。以上就是我日常开发中经常用到的五个调试技巧。从断点调试到输出美化,从异常定位到对象展示,每个都能在实际工作中提升效率。如果你也有好用的调试方法,欢迎在评论区分享交流。

2026-05-25 08:01:10 203

原创 SSH 远程连接效率提升:5个你可能不知道的实用技巧

SSH 是后端开发中最常用的远程连接工具之一。但大多数人只用连上去就完了,其实 SSH 还有很多隐藏技巧可以大幅提升效率。

2026-05-24 13:37:16 37

原创 Python 类型注解:从入门到日常实用

Python 是一门动态类型语言,这让它足够灵活,但也让大型项目维护起来容易踩坑。类型注解(Type Hints)就是 Python 提供给我们的"安全带"——它不会改变代码的运行方式,但能显著提升代码的可读性和健壮性。

2026-05-24 13:32:06 369

原创 文件读写中的5个实用技巧,帮你少走弯路

善用标准库,关注异常处理。

2026-05-23 08:54:30 18

原创 后端开发必备技能:3分钟学会用tcpdump进行网络抓包分析

做后端开发的同行们,你是否遇到过这样的情况:接口调不通,日志里看不出问题,前端说是你后端的锅,你查了半小时代码也没找到原因。这时候,一个抓包工具往往能让你在几分钟内定位问题。

2026-05-21 08:04:37 181

原创 后端开发必备技能:3分钟学会用tcpdump进行网络抓包分析

抓包分析不是运维的专属技能,后端开发掌握基础抓包能极大提升问题排查效率。tcpdump 学起来只需要半小时,但能帮你解决的问题远不止半小时能算得清的。建议在测试环境多练练手,遇到线上疑难杂症时就会从容很多。以上就是我对网络抓包分析的一些日常经验分享,希望对你有帮助。

2026-05-21 08:02:37 223

原创 AI 开发者必知的 5 个开源工具(2025 最新盘点)

随着 AI 技术的快速发展,开源社区涌现了大量优秀的开发工具。作为一名长期关注 AI 生态的开发者,今天我为大家盘点 5 个值得关注的 AI 开源项目。

2026-05-20 19:05:25 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除