- 博客(5)
- 资源 (7)
- 收藏
- 关注
原创 集成算法:随机森林
在集成算法这一章中,我们大概的阐述了一下常用的两种集成算法,这里我们就具体研究一下 baggingbaggingbagging 算法中最常用的模型:随机森林。 由前面我们了解:baggingbaggingbagging + 决策树 = 随机森林,所以在学习随机森林之前,我们必须了解决策树相关的知识,这些我在ID3,C4.5,CART中已经比较详细的讲过一遍,这里就不在赘述了,有不懂的童鞋可...
2019-02-27 16:30:58 777
原创 集成算法
RF通过Bagging的方式将许多个CART组合在一起,不考虑计算代价,通常树越多越好。RF中使用CART没有经过剪枝操作,一般会有比较大的偏差(variance),结合Bagging的平均效果可以降低CART的偏差。在训练CART的时候,使用有放回的随机抽取样本(bootstraping)、随机的抽取样本的特征、甚至将样本特征通过映射矩阵P投影到随机的子空间等技术来增大g(t)的随机性、多样...
2019-02-27 14:54:54 451
原创 推荐系统实践(九)----推荐系统测评
前面讲解了这么多推荐系统的算法,但是一个推荐系统做出来之后,我们并不知道其效果怎么样,这种时候,就需要对推荐系统进行测评,来告诉我们这个推荐的性能和效果怎么样。测评一般包括测评指标和测评维度。 测评指标 评测指标可用于评价推荐系统各方面的性能,这些指标有些可以定量计算,有些只能定性描述,有些可以通过离线实验计算,有些需要通过用户调查获得,还有些只能在线评测。一般情况下使用如下:1....
2019-02-20 18:30:11 861
原创 推荐系统实践(八)----评分预测
目前为止都是在讨论 TopNTopNTopN 推荐,即给定一个用户,如何给他生成一个长度为 NNN 的推荐列表,使该推荐列表能够尽量满足用户的兴趣和需求。本书之所以如此重视 TopNTopNTopN 推荐,是因为它非常接近于满足实际系统的需求,实际系统绝大多数情况下就是给用户提供一个包括N个物品的个性化推荐列表。 但是,很多从事推荐系统研究的童鞋最早接触的却是评分预测问题,评分预测问题一直...
2019-02-20 17:11:16 1071
原创 推荐系统实践(七)----基于邻域的社会化推荐算法
今年抖音非常火爆和流行,我们在刷抖音的时候,经常会发现给我们刷到自己微信或者是抖音好友喜欢的小视频,这里很多人都就会很好奇,抖音怎么知道这些人是我的好友,甚至知道我和好友的兴趣就一样呢,这就有了基于社交网络数据的推荐算法。ps:抖音的推荐是多种算法实现的,基于社交网络数据应该只是其中的一个分支。 社会化推荐之所以受到很多网站的重视,是缘于如下优点: 1. 好友推荐可以增加推荐的信任...
2019-02-15 17:45:30 1727 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人