数据挖掘
文章平均质量分 81
哈维先生
这个作者很懒,什么都没留下…
展开
-
个性化推荐系统
基于内容的系统(Context-based System) 基于内容的系统集中关注项的属性。项之间的相似度通过计算它们的属性之间的相似度来确定。 协同过滤系统(Collaborative Filtering System) 协同过滤系统集中关注用户与项之间的关系。项之间的相似度通过同时对它们进行评级的用户所评级的所有项上的评级结果之间的相似度来确定。原创 2013-09-16 08:18:10 · 190 阅读 · 0 评论 -
推荐系统中所使用的混合技术介绍
文/陈运文 在推荐系统实际运用中,各种混合技术是其中一项极为重要的核心技术。在工程实践中我们发现,混合技术对提升推荐效果、改进推荐系统的性能等都有重要意义,因此本文对该专题进行如下的一些总结和介绍。 引言 在这个信息爆炸的时代,消费者面临众多选择、未知的领域、过载的信息时,往往无所适从;然而与此同时,内容的生产者(例如商家)也在苦苦寻觅合适的用户,寻找最便捷的渠道,而解决这两类矛转载 2014-03-19 11:22:24 · 1108 阅读 · 0 评论 -
用Hadoop构建电影推荐系统
用Hadoop构建电影推荐系统 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop,转载 2014-03-04 14:56:36 · 2177 阅读 · 1 评论 -
智能推荐系统开发中的十个关键注意点
作者:陈运文 博士,盛大智能推荐团队负责人 亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中,很多优秀的方法被提出,很转载 2014-03-19 10:37:12 · 961 阅读 · 0 评论 -
Kmeans算法
Kmeans算法 k-means 算法接受参数 k;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。 K-means算法的基本思想是:以空间中k个点原创 2014-03-21 15:32:20 · 1517 阅读 · 0 评论 -
CentOS下安装word2vec的linux教程
关于google的word2vec项目,这里就不用介绍了,接下来需要很干货的分享给大伙,在CentOS下安装word2vec的linux教程。关于如何在各个linux操作系统上安装word2vec,google的word2vec项目首页并未过多讲,或是详细的描述安装的linux教程。 word2vec项目的官网上,只有这么几段简短的关于使用的描述和linux教程: Quick转载 2014-07-08 12:07:25 · 2135 阅读 · 0 评论