小饕-CSDN博客

原创 RAG 学习之向量嵌入（Embedding）知识总结

向量嵌入是将文本、图片等非结构化数据转换为固定长度的数值向量的过程。嵌入后的向量在高维空间中保留了原始数据的语义信息——语义相近的内容，其向量距离也更近。"猢狲施展烈焰拳" → [0.023, -0.117, 0.089, ..., 0.041] （1536维）"猴子使用火拳攻击" → [0.019, -0.108, 0.092, ..., 0.038] （1536维）↑ 语义相近 → 向量距离近原始文档 → 文本切块 → 【向量嵌入】→ 存入向量数据库 → 检索 → LLM 生成回答特性密集嵌入。

2026-06-02 08:53:41 218

原创 RAG 实战：文本切块（Text Chunking）从入门到精通

默认使用 Python 内置的len()（按字符数计量）。但在实际场景中，你可能需要按token 数"""使用 tiktoken 计算 OpenAI token 数"""chunk_size=200, # 现在是 200 个 token，而非 200 个字符为什么要按 token 计量？中文一个汉字通常占 1-2 个 token，而英文一个单词约 1 个 token同样 200 个字符，中文文本可能有 200-400 个 token，英文可能只有 40-50 个 token。

2026-05-30 19:26:14 391

原创 RAG 数据加载全攻略：从文本到 PDF 的 Loader 选型指南

Unstructured 解析文档时会为每个元素分配唯一 ID，通过 parent_id建立层级关系（比如标题 → 段落 → 表格）。检索时的用法是：用小粒度的。

2026-05-29 14:51:13 463

原创 RAG 系统优化完整指南

原始 chunk 保留用于生成，摘要用于检索# 方案 A：用摘要做 embedding，原文用于生成# 方案 B：摘要 + 原文拼接后做 embeddingsummary = llm.invoke(f"用一句话总结以下内容的关键信息：\n。

2026-05-25 15:51:15 408

原创 RAG学习之--词嵌入技术知识汇总

词嵌入（Word Embedding）是把人类理解的文字、图片、声音等翻译成一组低维稠密实数向量的技术。语义相近的东西，向量也要相近。

2026-05-06 15:46:03 278

原创 RAG 技术方向最新工程技术调研

整理日期: 2026-04-29。

2026-05-04 09:43:33 317

原创 AI编程的三阶段演化：哪些方向真正值得投入，哪些被高估了

从"人类写ROADMAP.md"到"系统自动生成认知时空图谱"之间，没有一个可操作的中间状态。是渐进的？还是需要新的技术组件？文章没有回答。AI编程正在经历一个重要的拐点。代码生成本身正在商品化——Claude、GPT、Gemini、DeepSeek、Kimi都能写代码，差异越来越小。谁来组织Agent的工作？谁能管理上下文、定义规格、保证质量、控制成本？这个问题的答案不在某个万能的大模型里，而在那些解决真实痛点的轻量工具和实践中。GSD用几个Markdown文件就解决了上下文腐烂。

2026-05-04 09:42:32 219

原创从 Word2Vec 到多模态：词嵌入技术的演进全景

BERT 虽然聪明，但用它比较两个句子的相似度特别慢——1 万个句子需要两两比较 1 亿次，大约 65 小时。先把每个句子变成一个"摘要名片"（一个向量），然后再比较就快了。整个流程缩短到约 5 秒，快了超过 4 万倍。它怎么做句子A: "今天天气真好" → 经过 BERT → 平均所有词的向量 → 句子向量A句子B: "今天阳光明媚" → 经过 BERT → 平均所有词的向量 → 句子向量B然后用余弦相似度比较两个向量——数字越接近，意思越相似。训练方法——对比学习。

2026-04-29 21:40:06 540

原创 AI能不能搞科研？当AI不再只靠“脑子大“：SimpleTES如何在21个科学难题上撕开科研新范式

在"生成侧计算"（模型参数、推理长度）之外，“评估侧计算”（试错循环的深度和广度）同样是一条可以持续投入、持续收获的扩展轴线。当这两条轴线同时扩展的时候，AI做科研的能力上限，可能远超我们今天的想象。过去，我们把几乎所有赌注都压在"让模型更聪明"这一条路上。参数从千亿到万亿，推理从秒级到分钟级，仿佛只要脑子够大、想得更久，科学发现就会从天而降。但科学发现从来不是这样的。不是想不到，而是试不够。当同一套框架、同一个开源模型，在完全不同的科学领域里都能打出成果时，这种通用性本身就已经说明了很多问题。

2026-04-25 16:19:23 359

原创 DeepSeek V4发布：让英伟达最焦虑的，不是模型

回看 DeepSeek V4 的整个发布，给我最大的感受不是某个跑分数字。把 1M 上下文做成了开源标配。把国产算力的量产路线图摆上了台面。把顶级 AI 能力的门槛又往下压了一截。没有发布会。没有 PPT。没有一句"遥遥领先"。“不诱于誉，不恐于诽，率道而行，端然正己。不喧哗，但有分量。这个时代最可怕的不是高调的颠覆者，而是安静地改变规则的人。AI 这条赛道，正在从一个"技术竞赛"变成一个"生态战争"。

2026-04-24 19:52:24 370

原创谷歌 AI 掌门人 Demis：“把模型做大“的红利快吃完了

AGI 正在从一个远景判断，变成一个现实工程问题。谁先补齐持续学习、记忆系统、长期规划、一致性这些缺口，谁就更可能定义未来五年的 AI 格局。“推动科学进步，做出能真正给世界带来巨大好处的技术。五年后回头看，这句话可能会很重要。参考：20VC 播客对 Google DeepMind CEO Demis Hassabis 的访谈。

2026-04-23 16:31:29 357

原创美国砸 2859 亿，中国仅用 124 亿，差距却只剩 2.7%？斯坦福这份报告，有点意思

斯坦福这报告，价值不在说了啥，在建立了共同语言、问责基线、问题框架。至于它能不能让社会系统追上技术速度，看你怎么用。下场，还是旁观，自己选。评论区聊聊，你觉得未来 3 年 AI 会咋影响你工作？2026 年 4 月 18 日。

2026-04-19 15:17:14 566

原创 RAG学习之- RAG 数据导入完整指南

│ RAG 数据导入流程 ││ ││ 原始数据 → 读取 → 转换 → 分块 → 向量化 → 存储 ││ │ ││ ├─ TXT 文件 → 直接读取 ││ ├─ CSV 文件 → 结构化转换 ││ └─ 网页 → HTML 解析 + 正文提取 ││ │知识点内容CSV 导入核心结构化 → 自然语言转换网页加载核心HTML 清理 + 正文提取动态网页需要浏览器渲染（Selenium/Firecrawl）文章提取trafilatura 效果最好全站爬取轻量级推荐生产环境。

2026-04-18 21:55:52 233

原创 AI 让人越来越累，真不是你的错

真正成功的打工人会实现财务自由”这话你信吗？反正我不信。

2026-04-18 20:58:42 230

原创 MIT 学生 48 小时学完一学期？我扒了这个刷爆全网的学习法，发现了真相

这个故事是不是真的，其实没那么重要。重要的是：AI 时代，学习的底层逻辑确实变了。以前，学习的门槛是记忆——谁记得多，谁就学得好。现在，记忆可以被外包给 AI，提问能力成了新的门槛。数学，你必须亲手解题，形成肌肉记忆编程，你必须亲手写代码，经历 debug 的痛苦实验，你必须亲手操作，积累手感AI 能帮你理解，能帮你规划，能帮你复盘。但动手练习这一步，谁也替代不了。要点内容故事真实性无法验证，可能是营销内容方法有效性有科学依据，但主要适合文科理科学习需要调整方法，AI 当教练不是当答案机。

2026-04-16 19:30:45 920

原创 RAG 学习之- 检索结果融合技术完整指南

当你的系统使用多路检索（如向量检索 + BM25 + 关键词检索）时，需要将多路结果合并成一个统一的排序列表，这个过程就是检索结果融合。用户查询││ │ │ │↓ ↓ ↓ ↓向量检索 BM25 关键词检索稀疏检索│ │ │ ││↓【融合策略】← 核心技术│↓统一排序 Top-30│↓优点缺点✅ 无需调参，开箱即用❌ 忽略分数大小差异✅ 对异常值鲁棒❌ 只考虑排名信息，丢失分数细节✅ 工业界标准做法❌ 对"垫底"的文档惩罚不够✅ 规避量纲不一致问题优点缺点。

2026-04-16 19:29:20 384

原创 RAG学习之 - 检索质量评估指标详解：从概念到代码实战

你的检索效果怎么样？“怎么证明你的系统比别人的好？“优化之后效果提升了多少？这时候，检索质量评估指标就派上用场了。📖 概念解释（说人话）📐 理论公式📝 计算实例💻 代码实现简单说，就是评判你的检索系统返回的结果好不好。用户查询："Python 怎么读取 JSON 文件？↓检索系统返回 10 篇文档↓怎么评价这 10 篇文档的质量？← 评估指标登场优点缺点✅ 简单直观，容易解释❌ 不考虑排序质量✅ 计算快速❌ 不考虑 K 之后的结果✅ 不需要知道所有相关文档。

2026-04-15 21:01:59 476

原创 14 岁斩获 28 万奖金、17 岁论文让马斯克印象深刻：超级中学生现象背后，AI 时代的教育答案出来了

每个孩子都有自己的花期。过去，这句话是安慰：有的孩子开得早，有的开得晚，没关系。花期不是等待，是点燃。家长的使命，不是逼孩子开花，而是帮孩子找到那团火。火在哪里，兴趣就在哪里。兴趣在哪里，自驱力就在哪里。自驱力 + 能力 + AI，孩子就能走出一条属于自己的路。AI 可以替代技能，替代知识，替代流程。但替代不了的，是一个有热爱、有判断力、有行动力的人。这，才是 AI 时代教育的终极答案。

2026-04-15 11:14:45 544

原创 RAG学习之-Rerank 技术详解：从入门到面试

你让两个人帮你挑苹果，有什么区别？第一个人：快手阿姨（检索）30 秒抓了 10 个苹果给你方法：看颜色（红的拿）、看大小（大的拿）、看位置（手边的拿）结果：快是快，但有些苹果看着红其实有伤第二个人：品果大师（Rerank）接过这 10 个苹果，开始仔细检查方法：摸一摸（软硬）、闻一闻（香味）、掂一掂（水分）、看一看（斑点）结果：告诉你"这 10 个里真正最好吃的 3 个是这几个"快手阿姨（检索）品果大师（Rerank）速度30 秒 10 个 🚀5 分钟 1 个 🐢准确度。

2026-04-14 21:37:54 489

原创 2026 年最被高估的技术？不，Harness Engineering 是 AI 工程的下一个十年

要理解 Harness 为什么现在火了，得先看它是怎么一步步"长"出来的。

2026-04-14 21:19:35 890

原创 RAG学习之查询优化技术学习指南

================================================================================本书系统地介绍了 RAG（检索增强生成）系统中的查询优化技术，从基础概念到高级应用，从理论原理到实践代码，帮助读者全面掌握提升 RAG 检索效果的核心技术。================================================================================文件: 02-query-rewri

2026-04-13 15:13:34 619

原创智能的边缘哈萨比斯谈 AI、科学与人类未来PPT

2026-04-12 20:46:46 28

原创智能的边缘 -诺奖得主，Google DeepMind CEO 哈萨比斯最近访谈 AI、科学与人类未来，普通人如何如何利用AI成为超级个体

什么是智能？1. 功能角度智能是解决问题的能力能学习新知识，适应新环境能进行长期规划，权衡短期和长期利益能创造新知识，而非仅仅复制已有知识2. 计算角度大脑是否在本质上是一台"图灵机"？如果是，那么任何可计算的东西，AI 最终都能做到如果不是（例如存在量子效应），那么 AI 可能有根本性限制"我认为大脑很可能就是一台图灵机，"哈萨比斯说，“到目前为止，神经科学没有发现任何非计算的过程。这意味着什么？这意味着理论上，AI 可以模仿人类的任何智能行为。

2026-04-11 09:40:10 745

原创 Anthropic 搬来「云上劳力工厂」，可以监控多个AI 智能体干活

如果你用过「Claude Code」，你知道 AI 智能体的标准流程：自己规划步骤、调工具、写代码、改文件，干完就歇。Notion 是第一个这么搞的典型：用户在工作区里派任务，Claude 背景跑完，结果回传给用户，就像有个不睡觉的助理。更绝的是，这套自动化流程完全跑在 Anthropic 新出的「Claude Managed Agents」上，一个把智能体基础设施打包上云的产品，企业交指令，Claude 帮你从规划到执行全包。你换模型时只换「脑」，要新工具时只加「手」，升级存储就替掉「记忆层」。

2026-04-10 21:44:50 372

原创 Anthropic 秘密联盟曝光：当 AI 能分钟级挖掘漏洞，我们离网络末日还有多远？

│ AI 网络安全悖论 ││ ││ 进攻方用 AI → 漏洞发现速度 ↑ → 攻击更精准 ││ vs ││ 防御方用 AI → 补丁速度 ↑ → 检测更灵敏 ││ ││ 胜负手：谁先跑到终点线 ││ │GlassWing 的意义，不在于它发现了多少漏洞，而在于它承认了一个现实AI 漏洞挖掘能力已经存在，且不可逆转。禁止技术扩散是不现实的，唯一的选择是让防御者领先一步。这不是"是否会被攻击"的问题，而是"能否在攻击发生前修补"的竞赛。

2026-04-09 19:49:19 477

原创 RAG 学习之-向量数据库与 FAISS 索引完全指南：从原理到选型实战

问题：高维向量太占内存一个 768 维的向量，用 float32 存储：1000 万向量需要：解决方案：用 PQ 压缩PQ 的原理步骤 1：分割向量原始向量：[x₁, x₂, x₃, x₄, x₅, x₆, x₇, x₈] (8 维)↓分割成 m=2 个子向量：子向量 1: [x₁, x₂, x₃, x₄] (前 4 维)子向量 2: [x₅, x₆, x₇, x₈] (后 4 维)步骤 2：对每个子空间独立聚类。

2026-04-09 16:44:02 860

原创别盯着草台班子同事了，开源「女娲.skill」让你直接把大佬的脑子扒下来运行

最近圈子里都在玩那个同事.skill，说实话思路挺秀。把旁边那个写烂代码的哥们的聊天记录扒下来跑个模型，就能复刻一个赛博打工人。但你仔细想想这事儿有多荒谬，咱们身边这帮人，大概率投资干不过芒格，讲道理说不过费曼。既然底层技术已经能把一个活人的行为逻辑提炼成代码了，咱们为啥还要在一个巨大的草台班子里互相蒸馏？说白了就是格局太小。真正的大佬早就把自己的语料库全网开源了。马斯克的法庭证词，Naval的几千条推特，这些全是没加密的源码。我直接把这套逻辑做成了「女娲.skill」并且开源了底掉。

2026-04-08 18:51:21 357

原创 Anthropic CEO 达里奥·阿莫迪（Dario Amodei）访谈分析报告

│ 技术进步（快）经济扩散（较慢但仍是史上最快） ││ ↓ ↓ ││ 1-2 年：天才国家出现 1-5 年：收入开始涌入 ││ 5-10 年：全面经济影响 │AI 很快就会变得超级聪明（1-2 年），会写代码、会用电脑、会做很多现在只有人能做的事。但它真正改变世界还需要更长时间（5-10 年），因为公司适应、法律允许、大家学会用都需要时间。对个人来说，越早学会用 AI，未来越有优势。

2026-04-07 19:45:42 676

原创 AI 会废掉程序员吗？看完这篇就不焦虑了

问你个问题。在 AI 时代，你用什么创造价值？不是"如何成为更好的程序员"，而是"我用什么创造价值"。这两个问题，答案完全不同。范式重构生存指南1. 承认这是重构，不是转型2. 识别旧地图的有效边界3. 探索而不是规划4. 接受身份重构的心理成本5. 小步快跑，持续修正AI 不会取代你，但会用 AI 的人会取代你。旧地图找不到新大陆，但绘制新地图的能力，本身就是新大陆的一部分。互动你是哪个层级的程序员？初级、中层、还是高级？你担心 AI 取代你吗？或者，你已经找到应对之道了？

2026-04-06 17:19:36 373

原创 Anthropic 曝光 Claude“绝望代码“：2026 年，这 5 个 AI 创业机会正在闷声发大财

人类第一次拥有了"读取"和"调节"AI 内部状态的能力。这就像给 AI 装上了"仪表盘"和"调节阀"——既能监控健康状态，又能优化行为表现。企业级 AI 安全监控服务智能客服情绪优化 SDKAI 开发者调试工具Anthropic 的研究打开了一个新世界。在这个世界里，AI 不再是冷冰冰的代码，而是一个有着"171 种情绪空间"的复杂系统。1.这 5 个创业方向，你最想尝试哪一个？2.如果现在就开始，你觉得自己最大的障碍是什么？3.3 个月后，你希望自己达到什么状态？把答案写在评论区。

2026-04-05 20:48:04 513

原创 2026 分水岭：马斯克为何给 “旧世界” 一记当头棒喝

或许二十年后，依托全民基本收入（UBI）的乌托邦会成为现实，但未来七年，依赖 “流程化劳动” 的人，将陷入社会与经济的荒野。他将 2026 年定义为分水岭时刻：世界被残酷割裂，一边是技术呈指数级爆发的 AI 驱动新世界，另一边是固守传统职业安稳、依赖旧有技能的 “旧世界”。2026 年的分水岭已然到来，伴随三大无法回避的警示：转型真空期的阵痛、学历光环褪去、认知力崛起、健康成为基本生存策略。马斯克调侃自己的 “V2 版腹肌” 背后，藏着硬核的战略真相：AI 时代，身体才是承载转型期高压工作的唯一容器。

2026-04-04 16:05:37 636

原创为什么只有中国在“养龙虾“？—— OpenClaw 热潮背后的真实逻辑

"养龙虾"热潮不是单一因素造成的，而是合规环境、成本结构、生态适配、社区文化、政策支持五重因素叠加的结果。合规差异是最根本的结构性原因成本优势（电价+Token）是最直接的经济驱动因素——中国居民电价仅 $0.077/kWh，为美国的 43%、德国的 19%中文生态是降低门槛的关键因素随着 2026 年国内云厂商涨价、欧盟 AI 法案生效，这一格局可能会发生变化。值得持续观察。

2026-04-03 18:13:23 584

原创节出来的 00 后，没做聊天壳子，先盯上了你的 Enter 键

用户愿不愿意接收这个主动建议，就是最硬的指标之一。这比单看日活、时长更真实。因为用户要是点了接受，说明前面这一串至少大差不差，没全废。要是不收，问题可能出在任意一个节点。这个判断方式很工程化，不花哨，挺像真正做产品的人会盯的数。另一个他们很看重的指标，是 Agent 任务里的 Token 消耗。这个说法有点反直觉，但很真实。日常分析型消耗基本固定，

2026-04-03 14:20:18 326

原创 AI 红利？别等了，90% 的人根本没入场券

不用长，200-500 字就行。写什么？写你这周学到的一个新东西。可以是一个工具的使用心得，可以是一个概念的新的理解，也可以是一个踩过的坑。本周学习：Notion 数据库学到的东西：数据库可以关联不同页面，类似 Excel 的 VLOOKUP踩过的坑：一开始没设好属性类型，后面改起来很麻烦下次注意：先规划好结构再创建一年后，你有 50 多篇总结。这些都是你的认知资产。认知是天花板，数据是入场券，Agency 是驱动力。三个没准备好，AI 时代到了，你也只能在门口看着。

2026-04-02 16:19:51 499

原创我从零搭建 RAG 学到的 10 件事

不要等"完全学会"再动手。我第 1 天就借助AI写出了能跑的 Demo，后面边做边学，让AI帮我理解代码和底层原理。先跑通流程，再优化细节。RAG 的 5 步流程很简单，先让它能工作，再调 chunk_size、换 Embedding 模型。用数据说话，不要凭感觉。建个测试集，记录每次调整的效果，迭代几次后效果会明显提升。RAG 不难，难的是开始动手。希望这篇总结能帮你少走弯路。# 附上RAG源代码 naive_rag"""Naive RAG Pipeline 实现。

2026-04-02 06:54:44 820

原创谷歌一篇论文，存储巨头一夜蒸发几百亿：TurboQuant 到底是怎么回事？

2026 年 3 月下旬的一个普通周三，美国股市开盘后，存储芯片板块突然遭遇"黑色时刻"。公司当日跌幅美光科技 (Micron)-4%西部数据 (Western Digital)-4.4%希捷 (Seagate)-5.6%闪迪 (SanDisk)-6.5%几家巨头的市值加起来，一夜蒸发了数百亿美元。谷歌发现了一个数学技巧，能把大模型的"记忆本"压缩到原来的 1/6，还几乎不丢信息——这让卖内存条的公司很紧张。贡献点描述零额外开销量化消除传统量化中的归一化参数存储无偏内积估计。

2026-04-01 15:05:58 400

原创 Anthropic 高管公开表示：别等下一代模型了，立刻开始做 Harness。Harness热潮下的冷思考!

最近 Anthropic 有个观点很火：**"别等下一代模型了，立刻开始做 Harness。"**核心逻辑是：模型已经足够强，真正的竞争力在于如何驾驭它。谁先把状态管理、错误恢复、记忆压缩这套工程做好，谁就赢了。

2026-04-01 14:25:19 372

原创 AI 时代，技术人到底该拼什么？

技术人该积累什么？不是多少门语言，不是会写多牛的 Prompt。是判断力，是对业务的理解，是敢拍板敢扛事的底气。AI 擅长已知的东西。人擅长应对未知。未知这玩意，永远都在。所以人永远有位置，只是位置在哪，得自己想清楚。对了，上面说的那些坑，具体有哪些？一会说。其实就那点事：权限配置错了、接口没限流、日志打了敏感信息。都是血泪，都是教训。就这样。

2026-04-01 13:00:18 328

原创谷歌TurboQuant来了，存储芯片哭了，AI推理爽到飞

过去要16-bit做的事，现在3-bit就能搞定，这让所有做推理服务的公司都爽了，而存储厂商的「量价齐升」逻辑被动摇。算力竞赛里最致命的武器，有时候不是更大的芯片，而是更聪明的数学。之前的量化方法都是把16-bit压到4-bit，但每块数据都要额外存全精度常数，结果压缩的意义被自己的手续费吃掉一半。有意思的是，这不仅是AI推理的事，还杀进了向量搜索这种谷歌核心业务。谷歌官宣TurboQuant算法，把KV缓存压到丧心病狂的3-bit，内存占用直接缩小6倍，推理速度飙到8倍。你没看错，不用重训，几乎没损耗。

2026-04-01 11:31:11 159

原创如果AI是电力，你手里拿的是发电机还是电冰箱？

电力革命最大的赢家，不是国家电网。是美的、格力、戴森。是那些把电力变成"好用产品"的公司。5年后回头看，AI也是一样的剧本。NVIDIA在赚今天的钱。OpenAI在赚今天的钱。但真正的机会，属于那些把AI变成"好用产品"的人。AI时代，做"智能电器"，不做"发电厂"。做解决问题的人，不做卖Token的人。做让用户忘记AI存在的人，不做炫耀AI的人。最后一道选择题，评论区告诉我：A. 发电机 —— 在做基础设施B. 插座 —— 在做套壳C. 电冰箱 —— 在做真正的产品。

2026-03-27 20:52:06 417

LangChain构建大模型应用之Chain

Linux_进程间通信 共享内存shmget方式详解

空空如也

Linux_进程间通信共享内存shmget方式详解