自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Dby_freedom的博客

一个关于 Recommendation System & Machine Learning 的技术分享博客

  • 博客(307)
  • 收藏
  • 关注

原创 算法与数据结构(二十五)TopK问题:基于快排的Python模板

首先,先写partition模板。

2023-12-04 09:35:05 537

原创 算法与数据结构(二十四)最优子结构原理和 dp 数组遍历方向

你看。

2023-08-14 09:37:24 1070

原创 算法与数据结构(二十三)动态规划设计:最长递增子序列

注:此文只在个人总结 labuladong 动态规划框架,仅限于学习交流,版权归原作者所有;也许有读者看了前文,学会了动态规划的套路:找到了问题的「状态」,明确了dp数组/函数的含义,定义了 base case;但是不知道如何确定「选择」,也就是找不到状态转移的关系,依然写不出动态规划解法,怎么办?。

2023-08-14 09:03:41 549

原创 算法与数据结构(二十二)动态规划解题套路框架

第一个斐波那契数列的问题,解释了如何通过「备忘录」或者「dp table」的方法来优化递归树,并且明确了这两种方法本质上是一样的,只是自顶向下和自底向上的不同而已。第二个凑零钱的问题,展示了如何流程化确定「状态转移方程」,只要通过状态转移方程写出暴力递归解,剩下的也就是优化递归树,消除重叠子问题而已。如果你不太了解动态规划,还能看到这里,真得给你鼓掌,相信你已经掌握了这个算法的设计技巧。计算机解决问题其实没有任何特殊的技巧,它唯一的解决办法就是穷举,穷举所有可能性。

2023-08-09 09:04:24 484

原创 算法与数据结构(二十一)二叉树(纲领篇)

如果可以,写出这个递归函数的定义,并充分利用这个函数的返回值,这叫「分解问题」的思维模式。

2023-08-03 09:47:13 529

原创 算法与数据结构(二十一)前缀和数组&差分数组

前缀和数组适用场景:原始数组不会被修改的情况下,频繁查询某个区间的累加和;前缀和数组优势:前缀和数组是典型的空间换时间的解决方案,将 前缀和 进行便利存储(O(n) 时空复杂度),然后 O(1) 时间复杂度得到最终数组区间和;差分数组适用场景:差分数组的主要适用场景是频繁对原始数组的某个区间的元素进行增减;个人体感,差分数组的适用范围更广一些,尤其是针对问题的抽象如公交车&航班问题;

2023-07-23 15:54:13 294

原创 算法与数据结构(二十)回溯法总结(排列)

在上一篇题解中,我总结了回溯算法的三种类型,以及什么时候用回溯算法,怎么写回溯算法,如果没看过的,强烈建议先看:C++ 总结了回溯问题类型 带你搞懂回溯算法(大量例题)下面就来讲解第二种类型——排列类型(ABC三道例题),此题(字符串全排列)为例题C,先上回溯六步走① 画出递归树,找到状态变量(回溯函数的参数),这一步非常重要② 根据题意,确立结束条件③ 找准选择列表(与函数参数相关),与第一步紧密关联④ 判断是否需要剪枝**⑤ 作出选择,递归调用,进入下一层⑥ 撤销选择1.全排列–问题描述

2022-05-03 11:40:04 951

原创 算法与数据结构(十九)回溯法总结(子集&组合)

1. DFS 和回溯算法区别DFS 是一个劲的往某一个方向搜索,而回溯算法建立在 DFS 基础之上的,但不同的是在搜索过程中,达到结束条件后,恢复状态,回溯上一层,再次搜索。因此回溯算法与 DFS 的区别就是有无状态重置2.何时使用回溯算法当问题需要 “回头”,以此来查找出所有的解的时候,使用回溯算法。即满足结束条件或者发现不是正确路径的时候(走不通),要撤销选择,回退到上一个状态,继续尝试,直到找出所有解为止3.怎么样写回溯算法(从上而下,※代表难点,根据题目而变化)① 画出递归树,找到状态变量

2022-05-03 11:25:46 1340

原创 CTR预估 论文精读(十七)--ESMM: Entire Space Multi-Task Model

ESMM: Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate 论文总结本文介绍 阿里妈妈团队 发表在 SIGIR’2018 的论文《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》。文章基于 Multi-Task Learning

2021-01-11 11:29:22 1436

原创 CTR预估 论文精读(十六)--Youtube 排序系统:Recommending What Video to Watch Next

1. 摘要In this paper, we introduce a large scale multi-objective ranking system for recommending what video to watch next on an industrial video sharing platform. The system faces many real-world challenges, including the presence of multiple competing rank

2021-01-04 20:41:39 824

原创 CTR预估 论文精读(十五)--MMOE: Multi-gate Mixture-of-Experts

MMOE: Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts0. 论文摘要Neural-based multi-task learning has been successfully used in many real-world large-scale applications such as recommendation systems. For example, in movi

2021-01-03 20:42:24 2490

原创 CTR预估 论文精读(十四)--Deep Rerank: Personalized Re-ranking for Recommendation(PRM)

Deep Rerank: Personalized Re-ranking for Recommendation 论文解读0. 论文摘要Ranking is a core task in recommender systems, which aims at providing an ordered list of items to users. Typically, a ranking function is learned from the labeled dataset to optimize the

2020-12-25 17:06:30 1926 1

原创 CTR预估 论文精读(十三)--Behavior Sequence Transformer for E-commerce Recommendation in Alibaba(BST)

Behavior Sequence Transformer for E-commerce Recommendation in Alibaba 论文解读0. 摘要In this paper, we propose to use the powerful Transformer model to capture the sequential signals underlying users’ behavior sequences for recommendation in Alibaba.1. 创新点其

2020-11-07 17:58:52 1361 1

原创 CTR预估 论文精读(十二)--Deep Session Interest Network(DSIN)

We observe that user behaviors are highly homogeneous in each session, and heterogeneous cross sessions. Based on this observation, we propose a novel CTR model named Deep Session Interest Network (DSIN) that leverages users’ multiple historical sessions i

2020-11-06 19:16:02 444

原创 CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)

Deep Interest Evolution Network(DIEN) 论文解读0. 摘要Deep Interest Evolution Network (DIEN) uses interest extractor layer to capture temporal interests from history behavior sequence. At this layer, an auxiliary loss is proposed to supervise interest extracti

2020-11-03 20:30:06 487

原创 CTR 预测理论(二十五):矩阵和向量乘法总结

推荐系统中常涉及矩阵、向量乘法,此处结合现有文献做一个小结,仅用于学习交流使用。

2020-03-16 15:11:25 699

原创 CTR 预测理论(二十四):推荐系统中序列(Sequence)与会话(Session)区别

本博文旨在对序列建模中遇到的 Sequence 和 Session 做分析介绍。

2020-02-20 15:20:26 3045 6

原创 CTR 预测理论(二十三):推荐系统用户兴趣特征表征方式

在推荐系统场景中,关于用户兴趣特征的表征对于提升最终模型点击率预估具有重要意义,结合已有资料,于此文对目前主流用户特征表征方式进行一次梳理。

2020-01-10 19:50:34 2495 1

原创 CTR 预测理论(二十二):推荐系统如何做 User Embedding

如何对推荐系统场景下的user做embedding以尽量保留用户更多行为偏好信息一致是业界重点探索方向,此处做一个现有方法汇总。

2019-12-16 19:51:40 2328

原创 CTR预估 论文精读(十)--xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems

以xDeepFM为引,整理一下CTR深度学习模型的发展脉络,并对xDeepFM做具体解读。

2019-12-05 10:04:26 1266 5

原创 算法与数据结构(一):滑动窗口法总结

滑窗法在算法题中大量应用,其思想简洁强大,但是往往在维护左右指针时候容易出错,现总结整理如下:

2019-10-16 23:32:28 36026 7

原创 算法与数据结构(十八):硬币找零问题总结

一、 01硬币找零问题(01背包)给定不同面额的硬币 coins 和总金额 m。每个硬币最多选择一次。计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,返回 -1。状态表示f[i][j] 表示只看前 i 个物品,总价值是 j 的情况下的最小硬币数目。状态转移f[i, j] = min(f[i-1, j], f[i-1, j-ci] + 1) 分别对应了...

2019-10-05 13:33:28 1574

原创 算法与数据结构(十七):BFS, DFS 算法总结

BFS, DFS 算法总结BFS, DFS 作为算法题中一种常见题型,其解题方式相对固定,但其运算思想很巧妙,先总结与此。LeetCode 207. Course ScheduleThere are a total of n courses you have to take, labeled from 0 to n-1.Some courses may have prerequisites...

2019-10-04 20:49:10 568 2

原创 算法与数据结构(十六):Python 内建排序方法总结

Python 内建排序机制很强大,此处对其进行一个较为系统的使用总结。

2019-09-15 11:18:55 273

原创 CTR 预测理论(二十一):数据预处理总结

数据预处理作为算法工程师的基本功,其预处理往往需要结合数据、模型、训练目标等多方面要求,现整合目前现有资料,做一个总结,后续再陆续添加。

2019-08-22 10:04:07 3557

原创 CTR 预测理论(二十):特征选择总结

特征筛选作为一个老生常谈的问题,但自身一直缺乏一个较为完整的梳理,现结合现有资料,总结于此。

2019-08-21 23:24:52 3580

原创 算法与数据结构(十五):最大子序和算法总结

最大子序和算法经常遇到,虽然也能写出,但往往不能直接想到最优雅的写法,现总结与此,仅供学习交流使用。

2019-08-13 23:50:04 412

原创 CTR 预测理论(十九):高维稀疏特征场景中 LR 比 GBDT 效果好的原因

个人曾经也很多次思考过:高维稀疏特征的时候,LR 的效果会比 GBDT 好的原因,现查阅资料总结与此。

2019-08-06 21:00:50 2549

原创 算法与数据结构(十四):IO 模板总结(C++ & Python)

不少网络笔试不像 LeetCode 帮你完成 I/O,需要手动完成;个人深受其痛,现将常用的 IO 模板总结与此,分别总结了 C/C++ 和 Python 代码。

2019-08-02 20:57:12 950

原创 算法与数据结构(十三):字符串反转题型总结

字符串反转总结字符串反转(如 “hello world” 转变为 “world hello”)作为一种常见题型,如果利用 python 作很简单,但是用 C++ 做往往需要考虑旋转、平移等策略,比较麻烦,这里对此类题型做一个小结。

2019-07-31 14:35:55 534

原创 排序算法总结(Python版)

经典排序算法总结与实现经典排序算法在面试中占有很大的比重,也是基础,为了未雨绸缪,在寒假里整理并用Python实现了七大经典排序算法,包括冒泡排序,插入排序,选择排序,希尔排序,归并排序,快速排序,堆排序。希望能帮助到有需要的同学。

2019-07-24 23:47:43 23843 13

原创 CTR 预测理论(十八):机器学习数据分析建模完整流程

结合个人学习及网上参考资料,先将从数据集加载、预处理、建模流程总结如下,文中参考了很多现有资料,该文仅供自身学习与学术交流。

2019-07-24 23:05:54 1426

原创 算法与数据结构(十二):Jump Game 题型总结

Jump Game 总结Jump Game 作为一个系列题,对理解贪婪算法、DFS 都有较好的体现,现总结与此。

2019-07-18 14:45:51 391 1

原创 算法与数据结构(七):二分查找法总结

二分查找法作为一种常见的查找方法,将原本是线性时间提升到了对数时间范围,大大缩短了搜索时间,具有很大的应用场景,而在LeetCode中,要运用二分搜索法来解的题目也有很多,但是实际上二分查找法的查找目标有很多种,而且在细节写法也有一些变化。

2019-07-14 23:55:20 989

原创 算法与数据结构(十一):Intervals 题型总结

Intervals 作为一种在面试中被问过两次的面试题型,现总结于此,该博文仅用于学习交流;

2019-07-05 21:20:19 869

原创 CTR 预测理论(十七):回归和分类损失函数总结

损失函数作为建模的一个重要环节,一个针对模型、数据集都合适的损失函数对于建模的好坏至关重要,现查询相关资料,将常见的分类、回归损失函数及常用的 Tensorflow 代码总结于此,仅用于学习交流。

2019-07-05 20:35:31 4184

原创 算法与数据结构(十):排列与条件组合算法总结

排列、条件组合算法总结排列、组合问题作为一种经常出现在各类算法考核中的编程题,其思路较为固定,但是变形比较多,结合一些自身学习、思考,现总结如下。

2019-07-02 16:13:12 1702

原创 算法与数据结构(九):最佳买卖股票总结

最佳买卖股票总结买卖股票问题作为 LeetCode 中一类题,其思想很有指导意义,现总结如下;

2019-07-01 14:59:42 786

原创 算法与数据结构(八):构建二叉树总结

利用前序、中序(后序)构建二叉树想起最近做到的两道利用前序、中序以及利用中序、后序构建二叉树的题,其也广泛出现在面试题中的选择题中,现整理总结如下。

2019-07-01 10:23:05 289

原创 算法与数据结构(六):旋转有序数组搜索总结

旋转有序数组搜索总结LeetCode 上两道很经典的旋转数组二分查找,对于理解二分查找以及旋转数组查找指定元素都是极其有意义的,现总结于此,仅供自身复习及交流分享。

2019-06-30 16:15:11 570

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除