- 博客(10)
- 收藏
- 关注
转载 linux sort 命令详解
原帖:http://www.cnblogs.com/51linux/archive/2012/05/23/2515299.htmllinux sort 命令详解sort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始!1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按A
2015-12-29 12:24:24 360
转载 hadoop-Streaming学习
原帖地址:http://cp1985chenpeng.iteye.com/blog/13129761.概述Hadoop Streaming是 Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或脚本文件作为 Mapper和 Reducer,例如: $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hado
2015-12-28 17:50:37 354
转载 使用Mahout搭建推荐系统之入门篇4-Mahout实战
原始地址:http://my.oschina.net/Cfreedom/blog/201828目录[-]一、基本内容二、运行环境三、程序运行3.1 调整N值和Threshold值对推荐结果的影响:3.2. 针对DataModel做一些数据分析, 类似于博文2, 判断item和user数量, value范围, 方差等.3.3 选择DataM
2015-12-17 11:05:25 3629 1
转载 使用Mahout搭建推荐系统之入门篇3-Mahout源码初探
原始地址:http://my.oschina.net/Cfreedom/blog/201829用意: 希望了解Mahout中数据的存储方式, 它如何避免java object带来的冗余开销。学完知识,要进行些实战 去分析数据。 花了些时间看了看Mahout的源码和官方资料,记录下自己的一些收获。文字写了很多, 有点啰嗦了, 但是这些东西都是我这段时间学习推荐系统的一
2015-12-17 11:04:31 592
转载 使用Mahout搭建推荐系统之入门篇2-玩转你的数据1
原始地址:http://my.oschina.net/Cfreedom/blog/173635目录[-]一. 前期数据分析的三个阶段二. 数据分析实例三. 不错的数据来源用意: 搞推荐系统或者数据挖掘的, 对数据要绝对的敏感和熟悉, 并且热爱你的数据. 分析数据既要用统计分析那一套,又要熟悉业务发掘有趣的特征(feat
2015-12-17 11:02:39 555
转载 使用Mahout搭建推荐系统之入门篇1-搭建REST风格简单推荐系统
原始链接:http://my.oschina.net/Cfreedom/blog?catalog=408809 用意: 网络上有很多关于使用mahout搭建推荐系统的文章,但是还没有一个从建立推荐系统原型至部署到简单服务器的完整教程. 虽然部分朋友对推荐系统很感兴趣, 但是因hadoop的复杂而却步. 同时对于那些没有任何Web开发经验的朋友来说, 一个完整的小型推荐
2015-12-17 11:00:33 1339
转载 使用Mahout搭建推荐系统之入门篇-Mahout源码初探
原文地址:http://f.dataguru.cn/thread-248282-1-1.html用意: 希望了解Mahout中数据的存储方式, 它如何避免java object带来的冗余开销。学完知识,要进行些实战去分析数据。花了些时间看了看Mahout的源码和官方资料,记录下自己的一些收获。文字写了很多, 有点啰嗦了, 但是这些东西都是我这段时间学习推荐系统的一些感悟,希
2015-12-17 10:53:29 728
转载 hadoop2.5.2 mahout0.10.1 测试文本分类器
原文链接:http://blog.csdn.net/landebug/article/details/46520339说明:本文是对下面这篇文章的一个更新,下面这篇文章环境采用的是mahout0.9 + hadoop2.2.0,本人的是mahout0.10.1+hadoop2.5.2--------------------------------------
2015-12-17 10:51:12 364
转载 HBase简介
一、HBase概述HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java。它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务,可以存储海量稀疏的数据,并具备一定的容错性、高可靠性及伸缩性。主要应用场景是实时随机读写超大规模的数据。
2015-12-16 10:43:48 546
转载 hbase安装配置(整合到hadoop)
版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]如果想详细了解hbase的安装:http://abloz.com/hbase/book.html 和官网http://hbase.apache.org/1. 快速单击安装在单机安装Hbase的方法。会引导你通过shell创建一个表,插入一行,然后删除
2015-12-16 10:39:50 426
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人