- 博客(3)
- 资源 (15)
- 收藏
- 关注
原创 hive学习之wordcount单词统计
单词统计相当于编程开始的HELLO WORLD。应该都跑过。假设这里有一个文档,里面有两行这样的话:Hello World Bye WorldHello Hadoop GoodBye Hadoop最终要显示的结果如下:程序如下: Map:public class MapClass extends MapReduceBase implements Ma
2012-04-06 18:12:31 934
转载 基于Hadoop平台的并行数据挖掘算法工具箱与数据挖掘云
一 基于云计算的海量数据挖掘2008年7 月,《Communications of the ACM》杂志发表了关于云计算的专辑,云计算因其清晰的商业模式而受到广泛关注,并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3,Google公司的Google Apps Engine, IBM公司的Blue Cloud,Microsoft公司的Windows Azu
2012-04-06 12:12:04 670
转载 推荐系统之协同过滤
协同过滤(Collaborative Filtering)是现今推荐系统中应用最为成熟的一个推荐算法系类,它利用兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的资讯,个人透过合作的机制给予资讯相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选资讯(参考wiki,文字有点生硬,不过却很好的描述了协同过滤的一个互动性:用户参与用户获益)。边整理边写了整整一天o(╯□╰)o
2012-04-01 16:38:33 400
基于Lucene的Web站内信息搜索系统
2009-09-21
人民银行Avamar成功案例.pdf
2009-07-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人