自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 如何用强化学习驾驭多目标的艺术平衡:精读《Deep Pareto Reinforcement Learning for Multi-Objective Recommender System》

《DeepPRL》提出了一种多目标推荐新范式。传统方法用固定权重调和目标冲突,而DeepPRL通过两大创新实现了动态权衡:超网络模块精准预测目标间的复杂关系;上下文强化学习模块则依据用户状态实时生成最优权重。系统通过端到端训练,学会为不同用户在帕累托前沿上智能导航,从而在多平台实验中同步提升点击率、观看时长等冲突目标,实现了从静态妥协到动态平衡的范式跃迁。

2025-12-21 22:13:06 1006

原创 当多目标排序遇上知识蒸馏:精读《Multi-objective Learning to Rank by Model Distillation》

Airbnb研究团队提出了一种基于知识蒸馏的多目标排序框架,通过软标签平衡搜索系统中的"不可能三角"。传统方法面临多目标冲突、数据不均衡等问题,该研究创新性地将约束优化问题转化为知识蒸馏任务:先训练多个单目标专家模型,再让学生模型学习这些专家输出的加权融合软标签。实验证明该方法不仅提升了离线指标(NDCG+1.1%)和在线转化率(+0.37%),还简化了系统架构。研究还提出自蒸馏机制实现知识传承,并通过软标签灵活融入不可微的业务规则。这种将复杂多目标问题转化为优雅蒸馏框架的思路,为工业级

2025-12-17 23:08:46 829

原创 对数组进行绝对值排序的几种实现方式

本文总结了数组绝对值排序的多种实现方式。对于基本类型数组,可通过转换为Integer数组后排序、使用Java 8的IntStream流式处理或手动实现快速排序;引用类型数组可直接用Comparator。集合类如ArrayList可用sort方法,优先队列可通过自定义比较器实现。性能方面,基本类型效率更高,小数据量推荐流式处理,大数据量建议手动实现。不同场景推荐不同方法:日常开发用转换或流处理,高性能需求手动实现,集合处理直接用sort方法。文末还给出了各方法的适用场景和性能对比表格。

2025-05-30 16:23:10 567 2

原创 【Java】回溯算法全攻略,超详细

本文系统总结了回溯算法的核心要点与实现方式。回溯算法通过探索所有候选解来寻找所有可能的解,其基本模板包含递归处理路径、回溯撤销步骤的关键结构。文章详细分类了5种典型回溯问题:组合问题(如77题)、分割问题(如131题)、子集问题(如78题)、排列问题(如46题)以及去重处理场景,针对每类问题提供了标准代码模板和关键注意事项(如结果集存储方式、去重技巧等)。特别是,文中强调了三种去重方法(新建Set、列表法和used数组法)的应用场景与实现细节,为系统掌握回溯算法提供了清晰框架。

2025-05-26 17:13:20 1504

原创 【Java】Java数组与集合初始化

本文总结了数组和集合基本的初始化方法

2025-05-20 19:14:51 470 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除