算法
文章平均质量分 54
正弈
淘宝正弈感兴趣领域spidermysqlhadoop分布式大数据数据可视化
展开
-
集体智慧编程读书笔记——第二章 提供推荐
1. 概念:协作性过滤算法是对一大群人进行搜索,并从中找出与我们品味相近的一小群人。算反对这些人所偏爱的其他内容进行考察,并将它们组合起来构造出一个经过排名的推荐列表。2. 表示方法:书中的例子用嵌套字典表示用户的喜好数据。{"person":{"item1":score, "item2":score}}。PS:形式化是很重的步骤,机器学习最难的步骤之一。3. 用户相识度计算欧原创 2013-03-29 11:30:56 · 702 阅读 · 0 评论 -
网页去重-算法篇
网页去重-算法篇 摘抄与:http://zz.shangdu.com/index-htm-m-cms-q-view-id-691.htmlhttp://zz.shangdu.com/index-htm-m-cms-q-view-id-692.htmlhttp://zz.shangdu.com/index-htm-m-cms-q-view-id-693.html前一篇(网页转载 2013-04-09 09:53:01 · 850 阅读 · 0 评论 -
推荐算法(1)——常用的推荐方法
互谅网行业,推荐无处不在。推荐的方法大致分为2类——基于用户相识度的推荐,基于物品关联的推荐。1. 基于用户相识度的推荐用户相识度计算是通过用户的行为计算用户的“距离”。用户行为有多个维度,比如对某个商品的打分,用户的年龄、职业,用户浏览的站点等等。就购买行为来讲,有用户的购买商品,浏览的商品,购买商品的价格,购买商品的关联等。比如一个男士买啤酒后,又买了尿布,很可能说明他家里有个原创 2013-03-28 14:04:58 · 1713 阅读 · 0 评论 -
推荐算法(2)——常用的预测算法
推荐算法莫过于预测用户的想要的东西给予推荐。常用的预测算法有:slope one算法,hmm算法,1. slope one算法slope one算法是一种简单的协同过滤算法。基本原理是通过平均值预测对某个事物的喜好程度,因为slope one算法认为平均值可以代替某2个未知个体之间的打分差异。如:户 对事物A打分对事物B打分X原创 2013-03-28 14:37:55 · 2596 阅读 · 0 评论 -
对互联网海量数据实时计算的理解 ——摘抄自http://tech.ddvip.com/2011-10/1319783898169602.html
对互联网海量数据实时计算的理解1. 实时计算的概念互联网领域的实时计算一般都是针对海量数据进行的,除了像非实时计算的需求(如计算结果准确)以外,实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。个人理解,互联网行业的实时计算可以分为以下两种应用场景:1) 数据源是实时的不间断的,要求对用户的响应时间也是实时的。主要用于互联网流式数据处转载 2013-07-28 16:55:12 · 622 阅读 · 0 评论