自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

d541941799的博客

原创交叉熵下的模型评估，auc还是loss？

交叉熵下的模型评估，auc还是loss？

2022-11-16 10:27:22 510 1

原创 dnn模型参数调优经验

learning rate调优1）在数据集较小的情况下，nn的learning rate大于embed的learning rate模型的效果会更好，这主要是因为数据集小，模型无法收敛。而nn能更快的拟合数据集，导致效果会好一些；2）在数据充分的情况下，nn的learning rate小于embed的learning rate模型的效果会更好，在稀疏的工业场景下，embed的更新频率一般要低于nn，将embed的learning rate设置大一些会有更好的效果。同时这也是尽量让模型用embeding

2020-05-12 16:56:06 3033

原创深度学习之蒸馏模型

蒸馏模型蒸馏模型的目的是为了将大模型/复杂模型学习到的东西传递给小模型。大模型将学习到的东西浓缩在输出值之中，输出值是一个0~1的概率值，我们称之为soft-target。可以通过设置温度T来调节输出值的分布，T越大得到的soft-target越软（均匀）。很显然假设复杂模型输出的solf target是100%准确的话，以0～1的soft target代替原样本中的[0, 1]这种hard ...

2020-02-20 15:43:23 1679

原创推荐领域常见的dnn模型框架结构

dindin中文名深度兴趣网络，由阿里提出并使用到工业上。din主要解决的问题是multi-hot特征的处理方式。传统的multi-hot特征的处理方式大多都是对多个id embedding求均值作为该multi-hot特征最终对输入。din的思想是根据待预估的对象对multi-hot特征的id embedding进行加权计算均值。以我们在广告上的尝试作为例子对din的网络结构进行介绍。首先我...

2020-02-20 14:35:26 1861

原创多目标学习之esmm

ctr/cvr联合训练是多目标学习的重要应用，在我们的广告推荐中被证实有效；背景：cvr模型训练的数据较少（ctr/cvr），却需要对整个大盘数据进行预估，这个不科学，因此希望能够利用到整个大盘对数据，比如show/ctr对数据；ctr/cvr联合训练将ctr的数据（show/ctr）也合并到cvr训练数据中，训练数据label由原来的二维表示是否转化调整成二维表示是否点击（第一维）和...

2020-02-19 23:25:53 764 1

原创特征工程总结

2018-07-10 10:50:21 189

原创机器学习常见基础概念一

1 信息增益比决策树中信息增益比大的特征优先选择2 基尼系数基决策树中基尼系数小的特征优先选择，和信息增益比刚好相反。尼系数代表了模型的不纯度，基尼系数越小，则不纯度越低，特征越好3 剪枝中的正则化参数α一般来说，α越大，则剪枝剪的越厉害，生成的最优子树相比原生决策树就越偏小。4 鲁棒性鲁棒性/抗变换性（英文：robustness）原是统计学中的一个专门术语，20世纪70年代初开始在控制...

2018-07-03 09:25:18 168

转载 Greenplum优化

尽量选择连接条件作为Distribution Key，如有个SQL：insert into tablec (auction_id,….) select * from tablea left join talbeb on tablea.selid=tablec.id;优化前耗时120秒，优化方式：将tablea的Distribution Key 改为selid，tableb的改为id，tablec的...

2018-07-03 09:11:42 962

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

段广东 CSDN认证博客专家 CSDN认证企业博客

码龄6年

IP 属地：上海市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

70万+: 周排名

126万+: 总排名

9165: 访问

: 等级

189: 积分

0: 粉丝

3: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

多目标学习之esmm
buptygz: 有出现离线预测cvr和ctcvr预估的copc都偏低，预估值偏高的情况吗？怎么解决呢

最新文章

提示

确定要删除当前文章？

取消删除