数据挖掘
文章平均质量分 53
IamLsz
专注服务端及数据。
展开
-
使用mrjob简单的编写mapreduce模型的程序
这次主要简单的分享下mapreduce编程模型,mapreduce作为分布式计算模型中最流行的一种,自从由google的论文发布这一模型之后,就受到了很多人的追捧,这次我们也跟随一下潮流。为了不让大家看着头晕,我不打算直接用hadoop(由java编写的mr模型的实现),而是采用python一个简单的实现来操作。 本着简单的原则,我们从最经典的一个例子wordcount来讲解。word原创 2014-06-12 15:11:28 · 2396 阅读 · 0 评论 -
Knn实现简单的物品推荐
KNN算法是机器学习里面比较简单的一个分类算法了,整体思想比较简单:计算一个点A与其他所有点之间的距离,取出与该点最近的k个点,然后统计这k个点里面所属分类比例最大的,则点A属于该分类。原创 2014-07-10 15:55:23 · 2274 阅读 · 0 评论