![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
xxaxtt
这个作者很懒,什么都没留下…
展开
-
CSDN编辑技巧
如何调节图片尺寸?参看CSDN博客图片调整大小,复制图片地址,通过width变量调节图片大小,简单好用!<img src="https://img-blog.csdnimg.cn/20190530003848720.jpeg" width="20%">原创 2021-03-20 18:40:59 · 68 阅读 · 0 评论 -
秒杀功能优化
秒杀功能优化目标应该时尽可能覆盖更多的用户数,让更多得用户感受到自己确实能秒杀到。不能让用户感觉,自己网不行所以抢不到,这是算法设计的缺陷。原创 2020-11-08 00:15:41 · 58 阅读 · 0 评论 -
新用户的点击率如何优化?
新用户和行为少的用户,在很多情况下可以用相同的策略来优化点击率。新用户的缺点是用户行为数据少,优点是新用户往往积极性很高。点击率优化方法:处理行为数据少的问题。可参考Airbnb的方式,将user _id映射到group_id,然后用group_id的行为来近似该用户的行为。分组可以参考用户的各种静态特征来分组。利用好新用户积极性高的优势。向B端展示新用户时,对新用户进行提权,B端能获得高的互动性,新用户也能感受到自己被需要。相关性问题可以设置阈值,相关性达标后才提权。...原创 2020-10-29 11:42:50 · 369 阅读 · 0 评论 -
文本分类模型
阿里的标题分类?知乎的多标签分类?原创 2020-10-28 22:20:17 · 392 阅读 · 0 评论 -
CNN和RNN学到了什么?
CNN学到了什么?一维卷积可以学到波形,例如心电图上的各种尖峰,可用来识别各种心电图病症。二维卷积可以学到一个形状,例如三角形、椭圆等,组合起来就能识别人脸等。RNN学到了什么?...原创 2020-10-22 21:04:24 · 176 阅读 · 0 评论 -
leetcode刷题记录
秋叶集问题。 算法提前已经想好,实现的时候一开始没有处理好边界条件,需要让i,j满足0<i<j<n-1, 然后再求g=f[i]-f[j]+n-r[n-1]的最小值。原创 2020-10-18 20:43:33 · 49 阅读 · 0 评论 -
激活函数总结
relusigmoidtanh原创 2020-10-17 08:24:27 · 51 阅读 · 0 评论 -
损失函数和最大似然
从数据获取模型,需要有衡量标准即损失函数。首先需要知道条件概率P(y|x),让概率最大就能求得模型。概率P取负对数后,就是损失函数。回归问题。观测值为高斯分布时,得到平方差损失MSE。观测值为laplace分布式,得到平均绝对误差MAE。分类问题。由多分类的观测概率,可以得到交叉熵损失。...原创 2020-10-15 13:51:39 · 665 阅读 · 1 评论 -
FM和FFM
时间复杂度?效果对比原创 2020-10-15 11:19:46 · 170 阅读 · 0 评论 -
dropout方法
dropout在训练和预测时的差异。dropout代码实现。dropout为什么可以防止过拟合?相当于同时训练了多个神经网络,最终预测结果是多个网络bagging的结果。那模型bagging为什么可以防止过拟合?如果bagging的n个模型相互独立,那么预测平均值方差=单个方差/n。因此bagging方法确实可以减少预测方差,减少过拟合。...原创 2020-10-15 11:09:18 · 408 阅读 · 0 评论 -
L1和L2正则化
为什么L1正则化具有稀疏性。L1和L2正则化的贝叶斯解释。为什么正则化可以降低过拟合?原创 2020-10-15 07:37:59 · 48 阅读 · 0 评论 -
推荐系统代码: DIEN
tf.name_scope?原创 2020-10-14 11:56:40 · 463 阅读 · 0 评论 -
过拟合问题总结
阿里DIN论文中,auc只有0.6,但是一样会出现过拟合问题。原创 2020-10-14 09:56:17 · 770 阅读 · 0 评论 -
推荐系统论文:DIN
优点疑问DICE是什么?改进点原创 2020-10-13 17:50:12 · 111 阅读 · 0 评论 -
DIEN论文
优点List item疑问List item改进点辅助损失函数的负样本取得不好,基本只考虑了随机负样本,只能区分大的性趣差异,无法区分细微的兴趣差异。可以使用ELECTRA的方法,用生成器产生小差异的负样本,然后用判别器去学习细微的兴趣差异。...原创 2020-10-13 10:30:15 · 144 阅读 · 0 评论 -
ELECTRA论文
bert的mask到底有什么问题?损失函数Ld的符号对吗?原创 2020-10-11 20:43:50 · 202 阅读 · 0 评论 -
XdeepFM和CIN
CIN和crossNet都是显式构造交叉特征的典范。其巧妙之处在于,通过k阶交叉构造k+1阶交叉,从而将复杂度控制到可接受范围。CIN中将sum pooling替换为max pooling,可能效果会更好。CIN中应该加入x0的一阶项,形成一个完整的泰勒级数。...原创 2020-10-10 10:12:06 · 617 阅读 · 0 评论 -
NLP模型
bertxlnet原创 2020-09-21 15:09:59 · 125 阅读 · 0 评论 -
数据归一化问题
deepfm连续特征输入时需要归一化吗?LR输入特征需要归一化吗?原创 2020-09-17 11:48:28 · 116 阅读 · 0 评论 -
推荐算法总结
youtube?亚马逊?Airbnb?抖音?淘宝?deepFM的数据集?原创 2020-09-14 12:11:41 · 147 阅读 · 1 评论 -
模型训练缺失值问题
1,不处理,删除,填充2,xgboost对确实值的处理3,神经网络对缺失值的处理原创 2020-08-08 10:29:09 · 334 阅读 · 0 评论 -
xgboost: python版和java版预测得分不同
使用同样的特征和模型,在python和java中输出的预测得分不同。经调研和测试发现,主要是二者missing的默认值不同,python中默认值为np.nan, 而java中默认值为0f。将java中的missing值设置为Float.NaN, 就可以得到和python一致的预测得分了。...原创 2020-07-31 23:59:04 · 508 阅读 · 1 评论