自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小码仔

学习、总结、学习

  • 博客(4)
  • 收藏
  • 关注

原创 机器学习-加权采样算法简介

场景用户画像的构造中,想象一个场景:你经过辛辛苦苦抓数据,清洗数据,收集用户行为,目的就是给用户计算兴趣标签。这时候你可能会遇到一个两难的问题:如果给用户计算出兴趣标签的权重了,那应该保留多少标签呢?保留太多的话,每次召回候选集时,计算复杂度可不低,只保留少部分吧,那真是手心手背都是肉,生怕丢弃的标签才是用户的真爱。怎么办?这时候,你需要的一个简单的加权采样算法,每次召回时并不使用全部用...

2018-06-05 21:22:54 11211 1

原创 机器学习中的Stacking模型融合

最近学习了模型融合的方法,遇到了Stacking的方法来解决模型融合的问题,因此做了以下总结。1.Stacking是什么?Stacking简单理解就是讲几个简单的模型,一般采用将它们进行K折交叉验证输出预测结果,然后将每个模型输出的预测结果合并为新的特征,并使用新的模型加以训练。模型融合的图示如下2.Stacking的好处在哪里?做大数据的比赛的一般是是使用单一模...

2018-06-04 18:10:56 20005 3

原创 CNN神经网络的个人总结

CNN神经网络的总结:[英文链接](https://medium.com/@RaghavPrabhu/understanding-of-convolutional-neural-network-cnn-deep-learning-99760835f148)CNN(Convolutional neural network) 简称卷积神经网络,主要是用于图像识别、图像分类、对象检测、人脸识别等...

2018-06-22 22:32:32 1537

原创 机器学习中常用的评价指标

推荐的时候一般是需要返回一个个性化的推荐列表,这个简称为Top-N推荐。评价指标:Top-N推荐的预测准确率一般是通过准确率(precision)/召回率(recall)来度量。召回率(Recall): R(u)是根据用户在训练集上的行为给用户做出的推荐列表。T(u)是用户在测试集上的行为列表。计算过程: 首先找出R(u)与T(u)的交集,计算出交集,然后用得到的交集除T(u)中...

2018-06-05 19:44:46 509

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除