自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 交叉验证

交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力(generalize),交叉验证一般要尽量满足:

2016-04-24 11:06:54 467

转载 协同推荐Slope One算法

相信大家对如下的Category都很熟悉,很多网站都有类似如下的功能,“商品推荐”,"猜你喜欢“,在实体店中我们有导购来为我们服务,在网络上我们需要同样的一种替代物,如果简简单单的在数据库里面去捞,去比较,几乎是完成不了的,这时我们就需要一种协同推荐算法,来高效的推荐浏览者喜欢的商品。一:概念     SlopeOne的思想很简单,就是用均值化的思想来掩盖个体的打分差异,举个例

2015-07-22 11:32:31 391

转载 各大推荐引擎资料汇总

最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。欢迎大家留言补充。也欢迎同行加我微博进行交流。(最近发现各家推荐技术进步很快,这里整理的可能已经是过去时了,不过最近不搞这个,没有精力补充了。)视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。Hul

2015-07-22 11:25:27 415

转载 Slope one简单的协同过滤算法

现在做的一个项目中需要用到推荐算法, 在网上查了一下. Beyond Search介绍了一个协同过滤算法(Collaborative Filtering) : Slope One;和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对很高;基本概念Slope One的基本概念很简单, 例子1, 用户X, Y和A都对Item1打了分.

2015-07-22 11:20:55 371

转载 Slope One简单高效的协同过滤算法

现在做的一个项目中需要用到推荐算法, 在网上查了一下. Beyond Search介绍了一个协同过滤算法(Collaborative Filtering) : Slope One;和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对很高;基本概念Slope One的基本概念很简单, 例子1, 用户X, Y和A都对Item1打了分.

2015-07-22 11:19:10 501

转载 机器学习中的相似性度量

在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。  本文的目的就是对常用的相似性度量作一个总结。  本文目录:  1. 欧氏距离  2. 曼哈顿距离  3. 切比雪夫距离  4.

2015-06-11 20:53:38 383

转载 《Item-to-Item Collaborative Filtering》笔记

摘要:购买或者打分行为为工程师线上编程标题为妈妈线上婴儿玩具click-through andconversion rates点击率、转化率banneradvertisements:品牌广告top-sellerlists:销售排行榜电子商务推荐的挑战:(1)千万用户、百万商品(2)许多需要实时的推荐(3)新用户冷启动问题(4)老用户兴趣太

2015-04-21 16:31:30 634

转载 数据挖掘学习路线图

学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。 一、目

2015-04-13 10:20:52 8442

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除