![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐与挖掘
文章平均质量分 76
ForDi昵称已经存在
这个作者很懒,什么都没留下…
展开
-
推荐系统的常见推荐算法的性能比较
数据集是movielens-1M(下载)版本。1. 训练集大小对于推荐性能的影响使用SlopeOne算法,每次随机选取6%的用户预测其喜好,进行5次实验,取MAE的均值,得到下表: 训练集大小(%)MAE900.71718149700.73005925500.转载 2014-12-28 10:47:39 · 5210 阅读 · 2 评论 -
协同过滤之ItemCF(c++实现)
ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西.通常情况下,ItemCF算法可归纳为如下三个步骤:1、计算用户曾经评过分的每一个物品与当前物品的相似度;2、从用户曾经评过分的物品中,选出与当前物品相似度最高的k个作为当前物品的邻居;3、利用邻居物品评分的加权平均值来预测用户对当前物品的评分代码如下:#include#inc原创 2014-12-31 15:43:12 · 1442 阅读 · 0 评论 -
协同过滤之UserCF(c++实现)
UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西。user-item矩阵如下:I1I2I3I4I5U12341-U24-533U31-345U434-54U5--432原创 2014-12-28 17:05:08 · 1885 阅读 · 0 评论 -
基于关联规则的简单理解
链接:http://baike.baidu.com/link?url=ZzfmeN289lOb1w-M9RMVcXGC_640er78GeVEegbQUF5nFC3qaTZQEojbY7Prp1mDDfMs_ZTGqgRpcitBeXEeMa根据韩家炜等观点,关联规则定义为:假设是项的集合。给定一个交易数据库D,其中每个事务(Transaction)t是I的非空子集,即原创 2015-03-06 10:46:53 · 3705 阅读 · 0 评论 -
UserCF与ItemCF杂想之余弦相似度
User-Item矩阵 I1 I2 I3 I4 I5 U1 4 3 2 1 - U2 4 - 5 3 3原创 2015-01-01 17:11:39 · 2677 阅读 · 2 评论 -
关联规则挖掘技术——主流推荐算法评述
啤酒和尿布的购买有关系吗?答案是,跟尿布一起购买最多的商品就是啤酒。据沃尔玛的分析调查,美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。对于隐藏在啤酒和尿布这类表面上风马牛不相及的商品背后的关联,如果不通过数据挖掘的技术,是没有办法靠拍脑袋的办法想出来的。这就是关联规则挖掘中最经典的例子。什么是关联规则挖掘技术?关联规则挖掘的根本目的是转载 2015-03-06 13:59:08 · 3628 阅读 · 0 评论 -
相似度计算方法总结
转自:http://blog.sina.com.cn/s/blog_62b83291010127bf.html 在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分 类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很多,最近查阅了相关的资料,这里整理罗列下。转载 2015-06-23 11:18:04 · 13633 阅读 · 0 评论