- 博客(8)
- 收藏
- 关注
转载 交叉验证
交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力(generalize),交叉验证一般要尽量满足:
2016-04-24 11:06:54 473
转载 协同推荐Slope One算法
相信大家对如下的Category都很熟悉,很多网站都有类似如下的功能,“商品推荐”,"猜你喜欢“,在实体店中我们有导购来为我们服务,在网络上我们需要同样的一种替代物,如果简简单单的在数据库里面去捞,去比较,几乎是完成不了的,这时我们就需要一种协同推荐算法,来高效的推荐浏览者喜欢的商品。一:概念 SlopeOne的思想很简单,就是用均值化的思想来掩盖个体的打分差异,举个例
2015-07-22 11:32:31 397
转载 各大推荐引擎资料汇总
最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。欢迎大家留言补充。也欢迎同行加我微博进行交流。(最近发现各家推荐技术进步很快,这里整理的可能已经是过去时了,不过最近不搞这个,没有精力补充了。)视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。Hul
2015-07-22 11:25:27 429
转载 Slope one简单的协同过滤算法
现在做的一个项目中需要用到推荐算法, 在网上查了一下. Beyond Search介绍了一个协同过滤算法(Collaborative Filtering) : Slope One;和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对很高;基本概念Slope One的基本概念很简单, 例子1, 用户X, Y和A都对Item1打了分.
2015-07-22 11:20:55 383
转载 Slope One简单高效的协同过滤算法
现在做的一个项目中需要用到推荐算法, 在网上查了一下. Beyond Search介绍了一个协同过滤算法(Collaborative Filtering) : Slope One;和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对很高;基本概念Slope One的基本概念很简单, 例子1, 用户X, Y和A都对Item1打了分.
2015-07-22 11:19:10 512
转载 机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目录: 1. 欧氏距离 2. 曼哈顿距离 3. 切比雪夫距离 4.
2015-06-11 20:53:38 394
转载 《Item-to-Item Collaborative Filtering》笔记
摘要:购买或者打分行为为工程师线上编程标题为妈妈线上婴儿玩具click-through andconversion rates点击率、转化率banneradvertisements:品牌广告top-sellerlists:销售排行榜电子商务推荐的挑战:(1)千万用户、百万商品(2)许多需要实时的推荐(3)新用户冷启动问题(4)老用户兴趣太
2015-04-21 16:31:30 649
转载 数据挖掘学习路线图
学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。 一、目
2015-04-13 10:20:52 8541
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人