![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
搜索推荐
文章平均质量分 78
搜索推荐
得克特
深度学习 python
展开
-
多目标融合参数搜索
权重分类目人群。原创 2024-06-10 16:39:13 · 836 阅读 · 0 评论 -
Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation
D2Q原创 2024-06-01 18:36:08 · 641 阅读 · 1 评论 -
Tree based Progressive Regression Model for Watch-Time Prediction in Short-video Recommendation
在TPM中引入观看时间顺序的关系,并且将问题分解为多个条件依赖的分类任务,用二叉平衡树来表示。观看时间的期望可以通过遍历树得到,同时将观看时长预测的方差引入到目标函数中作为不确定性估量。此外还用后门调整融入到TPM中,从而减轻偏差放大。D2Q为快手提出的Duration-Deconfounded Quantile,根据视频的时长进行等频分组,在每组中用传统回归模型对观看时间进行建模。如果用回归来建模的话,会导致模型梯度由长视频主导,使得模型预估不准确。这篇论文是快手在2023年,建模短视频观看时长的论文。原创 2024-05-30 22:12:09 · 306 阅读 · 0 评论 -
过拟合与欠拟合
过拟合有较为明显的对比可以判断,但欠拟合却是不容易判断的。训练集效果很好,测试集效果变差,在保证训练集与测试集样本分布一致的情况下,很容易得出过拟合的结论。欠拟合不太容易通过这种直接的对比来判断。原创 2024-04-21 18:48:35 · 288 阅读 · 0 评论 -
lambdamart
这个loss就是BPR(Bayesian Personal Ranking)Loss。有的博文也会叫做PairWise Logistic Loss 损失函数。RankNet使用了sigmoid函数来转化排序概率。文档相关性相等的情况。的公式能推导出下面第二行公式。包含以下三种情况,包含了。原创 2024-04-09 17:56:51 · 922 阅读 · 0 评论 -
推荐系统-向量召回
Ppostazt1∗ztazt所有发生过点击行为的用户总数点击过t的用户数a是一个超参,一般在1e-3~1e-5之间。原创 2024-04-01 14:01:09 · 1038 阅读 · 0 评论 -
排序模型全量计算替代召回可行吗
推荐系统:召回和排序原创 2024-02-18 11:10:18 · 726 阅读 · 0 评论 -
FiBinet解读
FiBinet原创 2023-10-30 15:02:36 · 244 阅读 · 0 评论 -
推荐优化理论与实践
推荐排序原创 2023-10-24 10:22:54 · 207 阅读 · 0 评论 -
lightGBM 训练rank记录
文章目录调参num_leaves和max_depthmin_data_in_leaf和min_sum_hessian_in_leafmonotonic constraintsgroup_column和ignore_columncategorical_featurelambda_l1和lambda_l2bagging_fraction和bagging_freq关于类别特征 Categorical Feature SupportlambdaRank label代码调参学习率和迭代次数部署模型文件调参num_原创 2021-06-09 11:46:10 · 1385 阅读 · 1 评论 -
AUC的一些基础知识
最近计算了搜索排序的auc指标,记录一下~AUC很大一个好处是其对正负样本比例不敏感AUC:一个正例,一个负例,预测正样本为正的概率值比预测负样本为正的概率值还要大的可能性。或者:从一堆0和1中,把1预测为1的概率比把0预测为1的概率大的概率。百度百科:随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。比较而言,第二个定义更好理解一些。具体算法看下知乎的答案吧如何理解机器学习和统计中的AUC?简单理解计算方式:将M+N个样本原创 2020-12-23 16:54:25 · 820 阅读 · 0 评论 -
DKN推荐算法实战
DKN是应用知识图谱 + KCNN + 注意力机制的推荐系统。其应用了三部分embeddings,单词、实体和上下文向量。关于知识图谱的实体关系向量化请看我的上篇博客TransE代码实践(很详细)。DKN的理论知识可以参考知识图谱与推荐系统结合。以下是model类的代码:_build_inputs构建了用户点击过的单词和实体输入以及label标签,候选的单词和实体输入。_build_mo...原创 2019-09-29 17:48:42 · 6382 阅读 · 2 评论 -
GBDT + LR 推荐算法实践
理论包含CART、GBDT、LR,我得抽时间好好写一下。代码调用lightgbm代码有两种方式,这里选择一种安装lightgbm安装lightgbm的依赖brew install libomp,不安装会报错brew install libompimport lightgbm as lgbimport pandas as pdimport numpy as npfrom skl...原创 2019-09-23 17:43:58 · 770 阅读 · 0 评论