自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 PocoEmit遥遥领先于AutoMapper之打通充血模型的任督二脉

UseContext是在Mvc下,使用当前HttpContext的RequestServices子容器。就怕异步中获取到了HttpContext,但执行中途被释放了,后面就可能异常了。由于识别出FromKeyedServices,就不需要UseDefault。但是实体有更多逻辑依赖外部服务,这些外部服务Dto不见得提供的了。支持FromKeyedServices和FromServices。没法引用外部服务的充血模型气血不通,业务表达能力大大下降。充血模型需要用到外部服务,又不想依赖外部服务的具体实现。

2025-12-17 21:05:07 880

原创 强化学习系统性学习笔记(一):从理论基础到策略优化

在形式化表述中,我们通常采用马尔可夫决策过程作为数学抽象,将学习问题定义为:智能体在一系列状态中选择动作,观察环境反馈的奖励和新状态,目标是找到能够最大化长期累积奖励的策略。更重要的是,我们需要采用特殊的技术来确保更新的稳定性,如限制策略变化幅度、使用信赖域约束、或采用截断目标函数,这些正是TRPO和PPO等先进算法的核心创新。拥有模型后,智能体可以在不与真实环境交互的情况下,通过前向模拟评估候选策略的表现。和对应采样的轨迹,构造的loss函数的梯度方向确实指向期望回报的上升方向,这是策略梯度定理保证的。

2025-12-17 21:03:37 369

原创 用开源模型强化你的 OCR 工作流

大的视觉语言模型 (Vision-Language Models, VLMs) 的崛起,正在彻底改变文档智能 (Document AI) 的格局。如今,许多 OCR 模型都是在现有 VLM 的基础上进行微调得到的。一个典型例子是 AllenAI 发布的 OlmOCR,它不仅开源了模型本身,还公开了训练所用的数据集,为他人提供了可复现与可扩展的基础。得益于更强大的视觉理解能力,这些模型能处理低质量扫描件、理解复杂元素 (如表格、图表、图片等) ,并将文本与视觉内容融合,以回答跨文档的开放式问题。

2025-12-15 14:16:37 651

原创 结构化机器学习项目 第二周:误差分析与学习方法(四)多任务学习

此外,机器终究是由我们人设计的,因此,对于是否适用多任务学习,一个最符合直觉的判断方式就是:如果一个人掌握任务 A 的知识后会更容易学会任务 B,那机器学习模型也可能如此。模型最前面的几层负责提取底层特征,之后,不同任务会接上不同的“小网络模块”,我们称为 task head(任务头)。在上一篇的迁移学习中,我们知道,把一个任务的模型迁移到另一个任务中应用的前提是:两个任务的低层次特征十分相似。现在任务改变,样本中出现了猫和狗的“合照”,标签自然也会增加,实现同时识别猫和狗的多任务学习。

2025-12-15 14:15:54 858

原创 进阶学习 PHP 中的二进制和位运算

有了这个概念,我们可以轻松理解为什么有这么多数字的内存表示,以及它们实际上是什么:uint8 是无符号 8 位整数(十进制 0 到 255),uint16 是无符号 16 位整数(十进制 0 到 65,535)。十六进制数字(base 16)可以表示任何数字,为此,它不仅使用十个数字 0、1、2、3、4、5、6、7、8 和 9,还使用从拉丁字母借来的六个额外字符:a、b、c、d、e 和 f。人类通常使用十进制(base 10),它允许用数字 0、1、2、3、4、5、6、7、8 和 9 来表示任何数字。

2025-12-14 13:15:37 912

原创 GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?

TriviaQA的突破:少样本71.2%不仅超闭卷微调模型(T5-11B的60.5%),还追平“开卷+微调”的RAG模型(68.0%),证明“大模型可将海量常识内化为参数,无需外部检索”(论文图3.3显示:模型规模每扩大10倍,TriviaQA准确率提升约15个点,呈线性增长);考试类阅读(RACE)差:RACE题型为“多选+细节定位”,需严格匹配文本细节,而GPT-3易受“常识干扰”(如文本说“小明10岁”,选项说“小明9岁”,模型可能因常识“儿童多为9-10岁”误选)。

2025-12-14 13:14:52 279

原创 Redis实战终极指南:从客户端集成到性能优化,手把手教你避坑【第四部分】

逻辑过期:不设物理过期时间,把过期时间存到value里(比如{"value":"库存100","expire":1620000000}),查询时检查过期,过期则异步更新;2. 检查连接池参数;INFO MEMORY:内存使用情况(used_memory_rss物理内存、mem_fragmentation_ratio碎片率);错误:set user:123 "{\"name\":\"张三\",\"age\":18}"(String存JSON,占100字节);2. 检查是否有大量计算(比如Lua脚本);

2025-12-13 19:40:20 294

原创 从零开始打造 Laravel 扩展包:开发、测试到发布完整指南

如果你有多个扩展包(比如一套 UI 组件),可以用 monorepo 的方式统一管理,配合 laravel/pint 和 phpstan 这些工具共享配置。做扩展包不只是分享代码那么简单,它让你深入了解开源项目的运作机制,学会如何维护一个公开的项目,也能为 Laravel 生态做出贡献。如果你写过一些能在多个项目里复用的功能——自定义验证规则、辅助函数、UI 组件之类的——那恭喜,你其实已经有了做扩展包的基础。把测试放在扩展包目录里,这样即使 Laravel 升级了,你也能及时发现兼容性问题。

2025-12-13 19:39:40 820

原创 jemalloc思想的极致演绎:深度解构Netty内存池的精妙设计与实现

这种频繁的移动会导致额外的性能开销。最终,当事件驱动降低了线程调度的微观成本,资源复用消除了内存管理的隐性消耗,而分层解耦提升了模块协作的宏观效率时,一个高吞吐、低延迟的健壮系统便水到渠成。例如:在q025的范围为[25%, 50%) 时,即使Chunk的使用率降低到25%,它仍然可以保留在q025中,直到使用率降低到25%以下(即进入q000的范围)。为了提高内存分配的利用率,Netty在分配小于8KB的内存时,不再直接分配整个Page,而是将Page进一步划分为更小的内存块,由Subpage进行管理。

2025-12-12 17:13:19 235

原创 一键配置 Web 前端开发环境(PowerShell 自动化脚本)

Write-Log "⚠️ 未检测到 Visual Studio Code,尝试使用 winget 安装 VS Code..." "Yellow"Write-Log "⚠️ 未以管理员身份运行,已设置用户级别的环境变量 VOLTA_FEATURE_PNPM = 1" "Yellow"Write-Log "⚠️ Volta 未安装,尝试使用 winget 安装 Volta..." "Yellow"Write-Log "⚠️ 使用 winget 安装 $($pkg.Name)..." "Yellow"

2025-12-12 17:12:44 439

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除