提莫不会飞-CSDN博客

原创 PocoEmit遥遥领先于AutoMapper之打通充血模型的任督二脉

UseContext是在Mvc下,使用当前HttpContext的RequestServices子容器。就怕异步中获取到了HttpContext,但执行中途被释放了,后面就可能异常了。由于识别出FromKeyedServices,就不需要UseDefault。但是实体有更多逻辑依赖外部服务,这些外部服务Dto不见得提供的了。支持FromKeyedServices和FromServices。没法引用外部服务的充血模型气血不通,业务表达能力大大下降。充血模型需要用到外部服务,又不想依赖外部服务的具体实现。

2025-12-17 21:05:07 880

原创强化学习系统性学习笔记（一）：从理论基础到策略优化

在形式化表述中,我们通常采用马尔可夫决策过程作为数学抽象,将学习问题定义为:智能体在一系列状态中选择动作,观察环境反馈的奖励和新状态,目标是找到能够最大化长期累积奖励的策略。更重要的是,我们需要采用特殊的技术来确保更新的稳定性,如限制策略变化幅度、使用信赖域约束、或采用截断目标函数,这些正是TRPO和PPO等先进算法的核心创新。拥有模型后,智能体可以在不与真实环境交互的情况下,通过前向模拟评估候选策略的表现。和对应采样的轨迹,构造的loss函数的梯度方向确实指向期望回报的上升方向,这是策略梯度定理保证的。

2025-12-17 21:03:37 369

原创用开源模型强化你的 OCR 工作流

大的视觉语言模型 (Vision-Language Models, VLMs) 的崛起，正在彻底改变文档智能 (Document AI) 的格局。如今，许多 OCR 模型都是在现有 VLM 的基础上进行微调得到的。一个典型例子是 AllenAI 发布的 OlmOCR，它不仅开源了模型本身，还公开了训练所用的数据集，为他人提供了可复现与可扩展的基础。得益于更强大的视觉理解能力，这些模型能处理低质量扫描件、理解复杂元素 (如表格、图表、图片等) ，并将文本与视觉内容融合，以回答跨文档的开放式问题。

2025-12-15 14:16:37 651

原创结构化机器学习项目第二周：误差分析与学习方法（四）多任务学习

此外，机器终究是由我们人设计的，因此，对于是否适用多任务学习，一个最符合直觉的判断方式就是：如果一个人掌握任务 A 的知识后会更容易学会任务 B，那机器学习模型也可能如此。模型最前面的几层负责提取底层特征，之后，不同任务会接上不同的“小网络模块”，我们称为 task head（任务头）。在上一篇的迁移学习中，我们知道，把一个任务的模型迁移到另一个任务中应用的前提是：两个任务的低层次特征十分相似。现在任务改变，样本中出现了猫和狗的“合照”，标签自然也会增加，实现同时识别猫和狗的多任务学习。

2025-12-15 14:15:54 858

原创进阶学习 PHP 中的二进制和位运算

有了这个概念，我们可以轻松理解为什么有这么多数字的内存表示，以及它们实际上是什么：uint8 是无符号 8 位整数（十进制 0 到 255），uint16 是无符号 16 位整数（十进制 0 到 65,535）。十六进制数字（base 16）可以表示任何数字，为此，它不仅使用十个数字 0、1、2、3、4、5、6、7、8 和 9，还使用从拉丁字母借来的六个额外字符：a、b、c、d、e 和 f。人类通常使用十进制（base 10），它允许用数字 0、1、2、3、4、5、6、7、8 和 9 来表示任何数字。

2025-12-14 13:15:37 912

原创 GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力？

TriviaQA的突破：少样本71.2%不仅超闭卷微调模型（T5-11B的60.5%），还追平“开卷+微调”的RAG模型（68.0%），证明“大模型可将海量常识内化为参数，无需外部检索”（论文图3.3显示：模型规模每扩大10倍，TriviaQA准确率提升约15个点，呈线性增长）；考试类阅读（RACE）差：RACE题型为“多选+细节定位”，需严格匹配文本细节，而GPT-3易受“常识干扰”（如文本说“小明10岁”，选项说“小明9岁”，模型可能因常识“儿童多为9-10岁”误选）。

2025-12-14 13:14:52 279

原创 Redis实战终极指南：从客户端集成到性能优化，手把手教你避坑【第四部分】

逻辑过期：不设物理过期时间，把过期时间存到value里（比如{"value":"库存100","expire":1620000000}），查询时检查过期，过期则异步更新；2. 检查连接池参数；INFO MEMORY：内存使用情况（used_memory_rss物理内存、mem_fragmentation_ratio碎片率）；错误：set user:123 "{\"name\":\"张三\",\"age\":18}"（String存JSON，占100字节）；2. 检查是否有大量计算（比如Lua脚本）；

2025-12-13 19:40:20 294

原创从零开始打造 Laravel 扩展包：开发、测试到发布完整指南

如果你有多个扩展包（比如一套 UI 组件），可以用 monorepo 的方式统一管理，配合 laravel/pint 和 phpstan 这些工具共享配置。做扩展包不只是分享代码那么简单，它让你深入了解开源项目的运作机制，学会如何维护一个公开的项目，也能为 Laravel 生态做出贡献。如果你写过一些能在多个项目里复用的功能——自定义验证规则、辅助函数、UI 组件之类的——那恭喜，你其实已经有了做扩展包的基础。把测试放在扩展包目录里，这样即使 Laravel 升级了，你也能及时发现兼容性问题。

2025-12-13 19:39:40 820

原创 jemalloc思想的极致演绎：深度解构Netty内存池的精妙设计与实现

这种频繁的移动会导致额外的性能开销。最终，当事件驱动降低了线程调度的微观成本，资源复用消除了内存管理的隐性消耗，而分层解耦提升了模块协作的宏观效率时，一个高吞吐、低延迟的健壮系统便水到渠成。例如：在q025的范围为[25%, 50%) 时，即使Chunk的使用率降低到25%，它仍然可以保留在q025中，直到使用率降低到25%以下（即进入q000的范围）。为了提高内存分配的利用率，Netty在分配小于8KB的内存时，不再直接分配整个Page，而是将Page进一步划分为更小的内存块，由Subpage进行管理。

2025-12-12 17:13:19 235

原创一键配置 Web 前端开发环境（PowerShell 自动化脚本）

Write-Log "⚠️ 未检测到 Visual Studio Code，尝试使用 winget 安装 VS Code..." "Yellow"Write-Log "⚠️ 未以管理员身份运行，已设置用户级别的环境变量 VOLTA_FEATURE_PNPM = 1" "Yellow"Write-Log "⚠️ Volta 未安装，尝试使用 winget 安装 Volta..." "Yellow"Write-Log "⚠️ 使用 winget 安装 $($pkg.Name)..." "Yellow"

2025-12-12 17:12:44 439

2501_94622938的博客