自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

进一步有进一步的欢喜~

欢迎一起探讨算法知识~

  • 博客(450)
  • 资源 (1)
  • 收藏
  • 关注

原创 【新手必看】以DIN论文为例,手把手教你用透arXiv学术平台

本文以 DIN 论文为例,教新手用 arXiv:看基础信息、读论文、找同领域研究、查引用,解锁学术平台核心功能。

2025-12-20 17:37:40 926

原创 小模型逆袭!一文读懂模型蒸馏:为何小参数也能媲美大模型?

从技术本质出发,用通俗的语言拆解其中的核心逻辑,再结合工业界典型案例深化理解,全程无复杂公式,开发者一看就懂!

2025-12-20 16:04:25 1125

原创 学术论文作者栏“暗语”全解析:从小红书WorldSense论文看懂单位、一作、通讯作者

学术论文作者栏的“隐藏信息”拆解得明明白白,以后看论文再也不用猜!

2025-12-20 15:15:48 707

原创 Git撤销修改:git restore . 与 git reset --hard 万字详解

本文详解Git撤销修改的`git restore .`与`git reset --hard`命令,从核心区域概念出发,对比两者适用场景与风险,指导开发者精准选择撤销方式。

2025-12-16 23:59:02 652

原创 互联网大厂都在哪些顶会上发论文?AI/ML/CV/NLP/推荐系统全解析

本文将为你系统梳理 AI 各子领域的主流顶会,揭秘工业界的真实科研策略。

2025-12-15 00:15:59 1164

原创 公式里的 | , ; 到底啥意思?一篇讲透机器学习符号语言

手把手教你拆解每一个符号的含义,最后总结出一套通用的“公式阅读法”,让你以后看到任何类似表达都能从容应对。

2025-12-14 23:44:27 931

原创 扩散模型(Diffusion Model)详解:从原理、U-Net结构到生成机制

本文将系统性地讲解扩散模型的核心思想、数学原理、关键组件(尤其是 U-Net 结构)以及完整工作流程,从而助力理解“AI 是如何从一张噪声图一步步画出逼真图像的”。

2025-12-14 22:50:03 1506

原创 从 PRM 到 G-E:推荐重排架构的范式升级与工业实践

本文将系统梳理其 G-E(Generator-Evaluator)架构演进背景、核心思想、实现细节、工程价值与未来方向,带你深入理解这场推荐重排的技术范式升级

2025-12-14 22:08:43 970

原创 Transformer+Listwise:一文读懂个性化重排模型PRM

PRM作为Transformer在推荐重排任务中的经典实践,通过“个性化向量融合+Transformer全局交互建模+Listwise损失优化”的三重设计,完美解决了传统重排模型的痛点

2025-12-14 11:02:08 994

原创 马尔可夫:让随机系统 “忘记过去”,强化学习才敢上场

本文将结合实际场景和通俗类比,从基础概念到应用落地,层层拆解马尔可夫过程的核心逻辑,同时解答学习中常见的疑问

2025-12-14 01:18:29 771

原创 从 “碗状函数” 到 “坑坑洼洼”:机器学习的凸与非凸之战

本文将从凸函数的数学定义、直观理解出发,结合机器学习中的典型案例,对比凸函数与非凸函数的核心差异,并探讨非凸优化的实际解决方案,帮助读者建立对凸函数的系统认知。

2025-12-14 00:30:14 704

原创 AI 时代,笨功夫最值钱

AI 的崛起,不仅改变了工作方式,更正在重塑人类学习的本质——它让“深度理解”和“系统思考”从精英专属的能力,变成人人可及的基础设施。这是一场认知普惠的革命

2025-12-13 15:07:41 1137

原创 深入理解 find 与 grep 路径参数位置差异:Unix 哲学下的设计逻辑

为什么 find 的路径必须写在前面,而 grep 的路径却放在后面?这并非随意安排,而是深深植根于 Unix 设计哲学、命令诞生背景与核心定位 的底层逻辑。

2025-12-13 14:48:56 594

原创 告别“这个分支是干啥的?”:Git分支层级命名实战

Git分支层级命名规范是团队协作的"安全网",通过`[类型]/[需求ID]/[功能描述]`结构,实现语义化、可追溯、防冲突,配合标准化操作,大幅提升协作效率与代码质量。

2025-12-11 23:47:47 1330

原创 一文读懂 git fetch:为什么专业开发者都先 fetch 再 pull?

git fetch 是 Git 协作的 "安全冗余" —— 它让你在不触碰本地代码的前提下,看清远程仓库的完整面貌

2025-12-11 23:39:28 1037

原创 Git 技巧:忽略 .gitignore 本身?一招搞定无需 git add

不想让 Git 跟踪 .gitignore 自己的修改,同时又不想执行 git add 提交它。本文就来详细讲解如何用 git update-index --assume-unchanged 命令实现这个需求

2025-12-11 23:31:26 711

原创 范数的命名渊源、数学本质与 tf.norm 核心应用

本文梳理了范数从几何长度抽象为矩阵 / 张量度量的演化脉络,揭秘其人名、地名命名渊源,同时详解tf.norm参数配置与在机器学习正则化、梯度裁剪等场景的核心应用。

2025-12-11 00:51:34 1039

原创 箭头一按,命令即现:Bash/Zsh历史命令前缀匹配全攻略

本文提供Bash和Zsh历史命令前缀匹配的终极优化方案,5分钟配置让命令检索效率提升300%,告别"大海捞针"式搜索,实现丝滑流畅的终端操作体验。

2025-12-11 00:23:17 976

原创 RankMixer:推荐系统的“算力与精度“双突破之道

RankMixer 的 “去 attention 化”“稀疏专家” 思路,为大规模模型的工业落地提供了极具参考价值的范式

2025-11-16 00:34:38 2025

原创 DLRM论文精读:《Deep Learning Recommendation Model for Personalization and Recommendation Systems》

DLRM是Meta提出的工业级推荐模型,通过拆分式架构高效融合稠密与稀疏特征,采用显式二阶交互与混合并行策略,在保证精度的同时突破超大规模嵌入表的内存与训练瓶颈,成为兼顾效率、可扩展性与实用性的推荐系统基准模型。

2025-11-15 20:35:21 616

原创 Holdout机制:推荐系统中评估部门级业务贡献的黄金标准

Holdout机制通过保留一部分用户永不参与实验,构建纯净对照组,从而准确评估推荐系统整体对业务指标的真实贡献。它有效避免了多模块AB实验叠加导致的虚假提升,是大厂衡量部门级技术价值的黄金标准。只有Holdout验证过的增长,才是可持续、可信赖的增长。

2025-11-15 17:16:22 791

原创 大模型对齐内卷史:RLHF 麾下 PPO、DPO、GRPO 的神仙打架!

本文从RLHF基础流程入手,逐步拆解SFT、RM等核心组件,深入剖析三大算法的技术原理、核心差异与适用场景。

2025-11-15 02:19:37 836

原创 谁动了我的埋点?——前端、客户端与数据中台的三角关系

本文系统厘清前端与客户端的职责边界,详解数据从采集、上报到使用的标准化链路,明确DE、数据平台与端侧团队的协同机制,助力技术团队高效协作、提升数据可用性与业务响应速度。

2025-11-15 00:51:19 710

原创 数据三剑客:客户端、服务端与DE的协作江湖

DE数据采集依赖客户端埋点与服务端协同,服务端作为行为日志承接者和业务数据持有者,是实现高质量数据整合不可替代的枢纽。

2025-11-15 00:23:21 826

原创 包管理器大揭秘:从 pip 到 yum,一行安装命令背后的 “神仙操作”

本文深度拆解语言级(pip/npm/Maven 等)与系统级(yum/apt/brew 等)包管理器核心逻辑,揭示其 “仓库查询→依赖解析→自动化安装” 的共性范式,对比两类工具在管理范围、适用场景的核心差异。结合实战案例讲解工具用法与避坑技巧,帮助开发者理清工具选择逻辑,轻松搞定软件安装配置,提升开发部署效率。

2025-11-14 23:58:22 1108

原创 嵌入式Linux驱动开发全流程:工具协作+核心概念拆解(从入门到理解)

本文将以 “嵌入式 Linux 驱动项目” 为核心主线,串联 Kbuild、交叉编译器、GDB 等关键工具的协作流程,同时拆解 Unix、Linux、GNU 等核心概念,用类比 + 实操案例的方式深入浅出讲解,帮你构建完整的知识体系。

2025-11-08 20:13:58 959

原创 一文理清 CMake、Make、Kbuild、GCC 关系:从基础到进阶的构建工具链全解析

在C/C++开发、Linux内核/驱动开发中,我们总会接触到CMake、Make、Kbuild、GCC这些工具,但很多开发者对它们的角色定位、协作关系一知半解。本文将从核心关系入手,逐步拆解每个工具的作用,结合实战场景讲解协作流程,再拓展相关进阶概念,帮你彻底打通构建工具链的知识体系。

2025-11-08 19:59:11 954

原创 推荐系统 QKV 终极拆解:电商爆单、内容高留存的核心密码

本文聚焦推荐系统序列建模核心 QKV,解析其 “查询 - 匹配 - 取值” 本质逻辑,对比电商(重转化、时序依赖)与内容(重语义、兴趣延续)场景的差异化设计。解答 K=V 的适用边界,强调工业级优先 K≠V 的标准方案,辅以维度选择、特征增强等调优技巧,为开发者提供贴合业务的 QKV 设计指南,助力精准提升电商转化与内容留存效果。

2025-11-08 17:21:54 1015

原创 Git分支管理核心:git fetch与git checkout创建分支完全指南

理解`git fetch`的同步机制和`git checkout -b`的分支创建逻辑,能帮你规避90%的分支管理问题,让协作更高效、版本控制更规范。

2025-11-08 16:59:54 790

原创 Git分支上游追踪完全解析:git branch -u与--set-upstream-to用法精讲

每次执行`git push`或`git pull`时,是否总需要手动输入完整的远程仓库和分支名称?其实Git提供了「上游追踪分支(upstream branch)」功能,能帮我们简化这些重复操作。

2025-11-08 16:48:21 886

原创 Git 开发全流程规范:分支创建+关联远程+rebase同步+分支清理实战

本文结合实际开发场景,完整演示「基于 master 新建分支→关联远程 master→开发期间同步主分支变更→代码合并→本地分支清理」的全流程,同时详解分支清理的行业惯例和避坑技巧,帮你掌握规范且高效的 Git 操作方案。

2025-11-08 16:44:26 1007

原创 Git Commit 高频提示详解:用户名邮箱配置及其他常见提示解决方案

本文聚焦 `git commit` 过程中最常见的 3 类核心提示,结合实际操作案例,详细拆解出现原因、正确解法和避坑技巧,让你遇到提示不再慌!

2025-11-08 16:05:20 1731

原创 Git 中 behind 和 ahead of 含义详解:分支同步状态一眼看透

Your branch is ahead of 'origin/分支名' by X commits本地分支的提交记录比关联的远程分支多 X 次,本地代码包含远程没有的新修改(本地领先远程,远程需要同步本地的更新)。Your branch is behind 'origin/分支名' by X commits, and can be fast-forwarded本地分支的提交记录比关联的远程分支少 X 次,远程代码包含本地没有的新修改(本地落后远程,本地需要同步远程的更新)。其中。

2025-11-08 15:55:58 1253

原创 Git push/pull 避坑指南:什么时候加 origin?什么时候不用加?

在 Git 日常开发中,很多新手都会困惑:执行 git push 或 git pull 时,有时候必须写 git push origin 分支名,有时候直接写 git push 就能生效。到底什么时候需要加 origin?什么时候可以省略?

2025-11-08 15:53:19 1088

原创 Linux 软件安装 “命令密码本”:yum/apt/brew 一网打尽

Linux 软件安装命令混乱源于发行版派系差异。本文拆解 Red Hat 系(yum/dnf)、Debian 系(apt)、macOS(brew)三大工具体系,讲清命令用法与适用场景,附系统判断、问题排查技巧。掌握 “先辨派系、选对工具” 核心逻辑,无论开发运维还是新手,都能告别命令试错,轻松搞定软件安装。

2025-11-08 13:47:30 823

原创 从 Bash 到 Zsh:程序员的命令行 “效率内卷” 指南

本文深度解析 Bash 与 Zsh 的核心差异、判断切换技巧、配置方法及演进历程,搭配服务器实操案例,覆盖新手到进阶场景,帮开发者高效选型并提升命令行效率。

2025-11-08 12:57:20 947

原创 3 分钟搞懂 PYTHONPATH:从报错到精通,新手也能秒变导入大神

本文聚焦 Python 开发高频痛点ModuleNotFoundError,以PYTHONPATH为核心,从底层原理出发,拆解模块搜索路径逻辑,通过 “失败 + 成功” 对比案例直观展示配置效果。涵盖 Linux/Mac/Windows 全系统配置、临时 / 永久生效方案,附可直接复制的终端命令与语法解析,还拓展了 Java、C/C++ 的类似环境变量机制。从原理到实操,从问题排查到多语言类比,让你彻底掌握PYTHONPATH,自由组织项目目录,摆脱模块导入困扰。

2025-11-08 12:33:13 1038

原创 别再手写 Makefile/VS 工程!CMake:1 份配置搞定多平台

本文针对跨平台编译的痛点,用 “翻译官” 类比拆解 CMake 核心功能 —— 生成适配不同系统的编译规则,而非直接编译。对比 CMake 与 make、kbuild 的差异,详解多系统安装步骤,通过 “Hello World”、多文件、链接外部库 3 个案例带新手实战,解答 “运行端是否装 CMake” 等疑问,助读者快速掌握这一 “跨平台编译利器”。

2025-11-02 22:21:04 669

原创 Git SSH 密钥:用 “锁和钥匙” 搞定远程仓库,从此告别反复输密码!

本文围绕 Git SSH 密钥展开,用 “锁(公钥)与钥匙(私钥)” 类比讲清非对称加密原理,详解 Windows/macOS/Linux 系统的密钥生成步骤,以及 GitHub/GitLab 的公钥配置流程。同时强调私钥保密、权限设置等安全要点,补充多设备 / 多账号的多密钥管理方案,帮助读者告别反复输密码,实现安全高效的 Git 远程操作。

2025-11-02 18:40:25 1101

原创 Python 列表踩坑实录:别把 “引用” 当 “拷贝”!3 个案例讲透深浅拷贝

本文聚焦 Python 列表内存操作逻辑,系统解析引用赋值、浅拷贝与深拷贝的技术差异。引用赋值(b=a)仅新增对象引用,无新对象;浅拷贝(如list.copy())创外层新对象,嵌套对象仍共享引用;深拷贝(copy.deepcopy())递归复制所有层级,实现完全内存隔离。文中还给出场景化方案,助力规避操作风险,提升代码健壮性。

2025-10-24 02:34:53 644

开源快捷键使用,方便用户快捷操作

开源快捷键使用,方便用户快捷操作 capslox历史版本(免费)

2025-08-25

日常工具mark,for快捷操作

日常工具mark,for快捷操作

2025-08-25

DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

2025-02-08

树模型论文汇总.zip

xgboost、lightgbm、catboost论文汇总。 XGBoost[1]是2014年2月诞生的专注于梯度提升算法的机器学习函数库,此函数库因其优良的学习效果以及高效的训练速度而获得广泛的关注。仅在2015年,在Kaggle[2]竞赛中获胜的29个算法中,有17个使用了XGBoost库,而作为对比,近年大热的深度神经网络方法,这一数据则是11个。在KDDCup 2015 [3]竞赛中,排名前十的队伍全部使用了XGBoost库。XGBoost不仅学习效果很好,而且速度也很快,相比梯度提升算法在另一个常用机器学习库scikit-learn中的实现,XGBoost的性能经常有十倍以上的提升。在KDD会议上,XGBoost的作者陈天奇将这一库函数所涉及到的理论推导和加速方法整理为论文发表出来[4],本文据此对其原理做简单的介绍。尽管这是一个机器学习方面的函数库,但其中有大量通用的加速方法,也值得我们学习。

2019-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除