安如衫-CSDN博客

原创机器学习基础（二）：注意力机制——Attention in Transformers

原始 Transformer 结构采用 Encoder-Decoder，Encoder 负责上下文建模，Decoder 通过自回归生成输出，二者通过 Cross-Attention 相连。文章重点拆解 Self-Attention 的 Q、K、V 机制：用点积计算相关性并经缩放与 Softmax 得到权重，再对 V 加权求和得到上下文化表示；解释了为何需要独立的 Q/K/V 投影以打破对称、解耦语义并做信息过滤。

2025-11-23 12:52:00 1315

原创 LLM基础（五）：微调与强化学习——后训练

本文介绍LLM“后训练”技术，用于实现模型对齐。核心包括：1) 依赖标准答案的“监督微调”(SFT)；2) 依赖奖励函数的“强化微调”(RFT)。文章强调了成功的关键是“评估驱动”的迭代闭环（评估-分析-靶向-微调），并证明数据质量远胜于数量。最后简要介绍了生产环境中的监控、告警与干预。

2025-11-06 23:53:37 1169 1

原创写长寿代码之设计模式：控制反转（IoC）到底反了谁的控制？

我们常说的设计哲学听起来玄之又玄，但核心目标其实很现实：让代码生命周期更长、易于修改、能承受规模扩展和需求变化。有些编程设计模式起名字特别直白，字面就能看出意图；但是，控制反转这个名字就显得没那么通俗直白了，实际上，这里的“控制”指的是对象创建、依赖注入、生命周期、调度策略等本应全由开发者显式控制的行为。

2025-07-27 21:24:18 719

原创 Go Context 深入浅出：根本哲学、源码解读与代码实践

本文探讨了上下文(Context)包的设计思路与实现。Context可用于跨进程信息透传和任务级联取消，确保资源及时回收。Done()用于状态查询、Cause()/Err()用于取消原因识别、Value()用于键值存储、Deadline()用于超时控制。通过Go代码示例展示了级联任务取消的实现，当父任务取消时，所有子任务会同步终止并输出取消原因。

2025-07-09 23:25:54 906 2