一叶千舟-CSDN博客

原创【Hermes】windows安装与基本使用

Hermes 的安装与基本使用

2026-06-23 22:27:20 50

原创【Harness Engineering】从概念到初步实践

Harness Engineering（驾驭工程） | 菜鸟教程Harness Enginnering翻译过来就是【驾驭工程。我们可以把大模型比作一匹马，那如果我们要更好的去驾驭，就需要通过“马具”来进行约束。Harness Engineering（驾驭工程）是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制和持续改进循环的系统工程实践。它不优化模型本身，而是优化模型运行的环境。人类掌舵，智能体执行（Human Steer, Agent Execute）。

2026-06-20 15:41:01 338

原创【UV】从入门到实战

UV常用命令

2026-06-09 17:17:18 505

原创【Agent Skills】基础概念+精通实践（详细版）

Agent Skills的核心理念其实很简单：把「模型会不会」变成「系统能不能稳定交付」，把「靠提示词玄学」变成「可复用、可迭代的工程能力」。

2026-02-26 18:44:37 1904

原创【AI应用开发设计指南】多轮对话

多轮对话设计：1、滑动窗口；2、历史摘要；3、对话状态跟踪：记忆提取、指代消解、Prompt

2026-02-08 09:34:01 1130

原创 2025：从理论到Agent实战——我的AI深度探索与创作之旅

2025年，从探索者到开发者的这段过程，我过得很充实，从技术到架构思维，再到生活。每天想的一件事应该就是“如何优化？”，这件事也成为了我目前的一个目标。每天都有新模型、新框架、新概念涌现。从LangChain到LangGraph，从单Agent到多Agent系统，从API调用到底层微调，MCP、DEEPAgent...技术的更新和时间一样快...还没好好感受一下2025就快过了，对于我来说，2025的生活记忆应该是一片空白，往年的相册上百，今年的相册到年末了都凑不出“九宫图。

2025-12-28 22:10:45 1080

原创【AI应用开发设计指南】基于QQ邮箱SMTP服务实现验证登录

fastAPI+uvicorn实现qq邮箱验证登录

2025-12-21 01:15:12 1166

原创【AI应用开发设计指南】基于163邮箱SMTP服务实现验证登录

在开发我的法律智能管理助手时，我遇到了一个经典问题：如何为用户提供安全、便捷且成本可控的注册登录方式？短信验证码需要企业资质，第三方OAuth又过于复杂。最终，我选择了国内邮箱验证这条路径——利用最常见、最易得的个人邮箱（如163网易邮箱），通过SMTP协议发送验证码，完美解决了身份验证需求。本文将完整记录从原理认知、环境准备、代码实现到集成到LangGraph智能体架构的全过程。无论你是独立开发者还是小团队，这套方案都能让你在半天内为应用接入稳定的邮箱登录功能。总之只要开启了“

2025-12-20 21:17:09 1093

原创【AI应用开发设计指南】联网搜索功能——搜索引擎推荐

追求快速验证想法：如果目标是用DeepSeek快速做一个能联网的Demo或内部工具，首选腾讯云平台。它能让你在几分钟内就搭出一个联网应用，免去了自己组合、调试API的麻烦。需要高灵活性与全球信息：如果你的应用场景多样，或需要全球、多语言信息，应该选择通用网页搜索API。可以从微软的或国内的博查API（侧重中文）入手，它们都有相对完善的文档和开发者计划。构建复杂AI助手：如果目标是开发需要深度思考、自主规划查询步骤的AI智能体，那么Tavily或Exa.ai这类AI优化API是更专业的选择。

2025-12-16 00:03:49 2058

原创【AI应用开发设计指南】模型回复前的等待显示

主流的开发方式是：①采用流式输出；②输出思维链；

2025-12-14 17:39:44 936

原创【Hyber-V】创建windows10虚拟机

按自己需求以及电脑能力设置内存。

2025-12-11 14:29:28 1442 1

原创【开发策略】MCP 多表查询策略方案

最终效果：不用表名不用字段名不用写学号只要问：“张三的成绩是多少？→ 就能自动得到跨表 JOIN 的结果。

2025-12-09 00:07:48 700

原创【git命令操作指南】

复制输出内容，到 GitHub → Settings → SSH and GPG keys → New SSH key→将内容粘贴到“key”，title随便写。一般在团队开发时创建了多个子分支，最终合并到main这个主分支中。以下命令在创建github仓库会有对应的命令，按你创建的仓库所属的对应命令，顺序执行即可。如果LFS解决不了就可以用这个方法，先执行下面命令【1】移除大文件（如果之前有提交的）返回主分支main，如果主分支是master，main就换成master；如：上传pdf改为【

2025-12-05 15:02:19 1136

原创【Everything 中文版】必备文件搜索工具

windows必备文件搜索工具

2025-11-16 19:36:02 993

原创【Git】2025全图文详解安装教程

有Git BashGit CMDGit FAQsGit GUI面我们就分别介绍一下这几个。

2025-11-15 13:36:58 11184 5

原创【Docker安装】Windows10专业版安装教程

Docker安装

2025-11-14 18:15:41 2239

原创【windows常见问题】无法以管理员身份运行

问题类型：所有进程无法“以管理员身份运行”

2025-11-12 22:32:22 1548

原创【vscode配置python环境】全流程图文教程

▲vscode配置python环境；▲创建虚拟环境；

2025-11-12 21:31:58 6524

原创【python】全流程图文安装教程

▲python安装；▲编写第一个python脚本

2025-11-12 17:32:50 2981 1

原创【VS Code】安装+配置全流程

vscode安装+初始配置图文教程

2025-11-12 16:00:04 3389

原创【windows常见问题】pin不可用，无法登录Windows

电脑重新启动，开机时出现logo时，不停按下“esc”键（不同电脑快捷键会有所不同，参考下图即可）（执行后应看到“已复制 1 个文件”的提示。成功进入桌面后，必须立即恢复我们修改的系统文件，否则会留下安全漏洞。（20634为我的用户名，123456为设置的新秘密）根据向导，验证您的Microsoft账户密码后，将“查看方式”改为“大图标”或“小图标”。（按回车，看到“命令成功完成”的提示）正常重启电脑，等待进入您之前卡住的。您会回到“PIN不可用”的登录界面。点击开始菜单，点击您的头像，选择。

2025-11-11 21:14:34 2262

原创【Windows重装】全流程图文教程

windows重装：从制作引导盘到windows激活全流程图文教程

2025-11-11 20:44:21 15749 5

原创【深度学习&微调实践】SFT监督学习实操全流程（附代码）

SFT训练流程模拟演示实践

2025-11-04 18:08:57 1318

原创【AI大模型应用宝典60题】56-60

★Deepseek-R1和Deepseek-R1-Zero；★蒸馏；★；强化学习；★训练策略

2025-11-02 11:52:18 822

原创【机器学习&深度学习】强化学习与监督学习SFT、RL、RLHF、PPO、DPO

方法类比记忆SFT教厨师照菜谱做菜模仿示范RL靠奖励不断试出更好做法试错进步RLHF人类品尝反馈 + 奖励改进让模型符合人类价值PPO防止厨师一次改太多的规则稳定训练方法DPO不用评分、不用试错，直接学偏好更简单便宜的偏好训练RL训练就是让模型不断生成回答 → 得到奖励 → 更新策略 → 输出更优的回答。SFT 教会模型“会回答”，RL（RLHF）教模型“回答得更好、更符合人类偏好”。类型：监督学习训练信号：标准答案（人类示范）目标：让模型学会“会回答”“按示范输出”特点。

2025-11-01 20:40:04 1236

原创【AI大模型应用宝典60题】51-55

★SFT；★PPO与DPO；★RL、RLHF

2025-11-01 18:13:46 998

原创【AI大模型应用宝典60题】46-50

★QLORA；★词元标签；★模型预训练；

2025-10-31 17:02:32 890

原创【AI大模型应用宝典60题】41-45

★TSDAE：平均池化与特殊词元；★STSB与MTEB；★SetFit；★预训练微调常见问题；

2025-10-30 17:54:54 887

原创【AI大模型应用宝典60题】36-40

★负例样本；★MNR、余弦相似度损失、softmax损失；★交叉编码器、双编码器；

2025-10-29 17:57:21 735

原创【AI大模型应用宝典60题】31-35

★CLIP；★BLIP-2；★文本分块+RAG；★向量相似度检索与倒排序索引

2025-10-28 18:52:23 1023

原创【AI大模型应用宝典60题】26-30

★分块；★Agent；★RAG

2025-10-28 16:04:49 902

原创【AI大模型应用宝典60题】21-25

★提示词；★问答链；★提示词注入；

2025-10-26 11:48:47 932

原创【AI大模型应用宝典60题】16-20

★嵌入模型；★词袋法和文档嵌入；★c-TF-IDF与TF-IDF；★密度聚类与质心聚类；

2025-10-25 11:58:04 1076

原创【AI大模型应用宝典60题】11-15

★。

2025-10-24 18:35:27 836

原创【AI大模型应用宝典60题】6-10

每个注意力头并不只关注一个词元，而是从不同子空间学习多样化的关联模式，一个头可能捕捉语法结构（如主谓一致），另一个头关注关键词匹配，因为在推理时，每一步都要缓存 K/V，如果每个头都要独立缓存，就非常占显存。经过多层 Transformer 的非线性变换后，最终的 token 表示是上下文相关的。，不需要复杂的Transformer结构，也不考虑句子级的上下文动态变化。类比：Q像“问题”，K像“档案关键字”，点积表示“问题与档案匹配度”。）与大模型产生的上下文相关的嵌入相比，有什么区别？

2025-10-23 18:12:36 1084

原创【AI大模型应用宝典60题】1-5

在回答完三点后，可以做一个更高层次的总结，展示你的视野：“所以，这三种架构的选择本质上是任务需求和计算成本之间的权衡。如果任务纯粹是理解、分析、分类，选编码器，效果最好且高效。如果任务是开放式的生成，或者希望模型非常灵活，选解码器。如果任务需要先深度理解再创造性输出，即典型的‘序列到序列’问题，那么即使成本高，也值得选择编解码器。另外，值得注意的是，随着像GPT-3/4这样超大规模解码器模型的出现，其强大的涌现能力在一定程度上模糊了这种界限，

2025-09-11 17:32:13 960

原创【数据库】Navicat Premium 17 安装

链接: https://pan.baidu.com/s/1xEBuFmR4LGxcApNDBaSNeQ?

2025-09-07 18:41:48 3452

原创【机器学习&深度学习】RAG边界处理策略

边界处理主要有2种策略：1、关键次词限定根据定义的关键词来判断用户问的问题是否与模型的知识库领域相关。但是这个方法存在一个比较严重的弊端，如果用户的问题没有包含指定的关键词，却与模型的知识领域相关，会出现问题不匹配的情况；2、判断重排序过滤节点（推荐）直接判断重排序过滤的节点是否为空，如果为空，则表示检索的内容相关性都不强，从而判断为用户问题与模型的知识库领域不相关；

2025-09-03 19:09:20 1195 1

原创【机器学习&深度学习】LLM：在检索与重排序中的适用场景

▲LLM 可以做 Embedding，但不划算，实际中几乎不用。▲LLM 可以做 Rerank，尤其适合小规模精排（Top-K → LLM）。▲Embedding 模型是轻量高效的主力，负责大规模建库和初筛。

2025-09-03 12:12:55 1182

原创【机器学习&深度学习】向量检索到重排序：RAG 系统中的优化实践

▲向量检索提供了高效的初步筛选；▲重排序模型在 Top-K 候选集中发挥关键作用，让相关文档真正靠前；▲性能与精度权衡：模型越大，精度越高，但延迟也越高，需要结合场景选择合适的 reranker（如 bge-reranker-base 适合在线，bge-reranker-large 适合离线）。

2025-09-02 20:55:10 928

【深度学习&微调实践】SFT监督学习-精致医疗r1数据

2407条精致医疗数据

2025-11-03

【图生视频模型测试】Wan-AI/Wan2.2-TI2V-5B

Wan2.2-TI2V-5B模型图生视频效果展示

2025-08-25

html3D动态凯旋门

里面包含11个版本迭代的3D动态凯旋门效果：版本1.0：简易版本版本2.0：建筑渲染版本3.0：优化建筑群版本4.0：增加公路和车流版本5.0：去除压在公路上的建筑版本6.0：优化车流群版本7.0：添加烟花效果版本8.0：添加树木版本9.0：美化建筑群版本10.0：添加云朵版本11.0：添加动态热气球

2025-08-19