- 博客(7)
- 资源 (19)
- 收藏
- 关注
原创 安装spark的前端展示可视化sparkR
1 安装R语言R语言是主要用于统计分析、绘图的语言和操作环境。官方网站:http://www.r-project.org/Windows下面有直接的安装包,直接下载安装很方便,但是对于刚出的CentOS6.0上不能直接通过yum 安装R,需要自己编译。下载页面:http://ftp.ctex.org/mirrors/CRAN/1.1更新源到fedoraproject
2014-02-23 17:17:49 4070 1
翻译 Spark0.9分布式运行MLlib的线性回归算法
1 什么是线性回归线性回归是另一个传统的有监督机器学习算法。在这个问题中,每个实体与一个实数值的标签 (而不是一个像在二元分类的0,1标签),和我们想要预测标签尽可能给出数值代表实体特征。MLlib支持线性回归以及L1(套索)和L2(脊)正规化的变体。Mllib还有一个回归算法,原始梯度下降(在下面描述),和上面描述的有相同的参数二元分类算法。可用线性回归算法:LinearRegres
2014-02-17 22:38:33 2235
原创 Spark0.9分布式运行MLlib的协同过滤
在接下来的例子中我们将要装载一个评级数据。每一行包含一个用户、一个产品和一个评级。我们使用默认ALS.train()方法,这个方法假设评级是明确的。我们通过预测评级的均方误差的来评估推荐模型评级的。1 什么是协同过滤协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内
2014-02-14 21:46:41 3779 2
翻译 Spark0.9分布式运行MLlib的二元分类算法
MLlib是的Spark实现一些常见的机器学习(ML)的功能以及相关的测试和数据生成器。 MLlib目前支持4种常见的类型的机器学习问题的设定,即,二元分类,回归,聚类和协同过滤,以及一个底层原始梯度下降优化。这个指南将概述在MLlib支持的功能,并且还提供调用MLlib的一些例子。依赖库MLlib使用jblas线性代数库,它本身取决于本地Fortran程序。如果不是已经安装在你的节点
2014-02-10 23:41:47 3321 1
原创 spark0.9分布式安装
spark安装包:spark-0.9.0-incubating-bin-hadoop2.tgz操作系统: CentOS6.4jdk版本: jdk1.7.0_211. Cluster模式1.1 安装Hadoop用VMware Workstation创建三台CentOS 虚拟机,hostname分别设置为 master,slaver01, slaver02
2014-02-08 17:36:52 8593 7
原创 spark0.8.1分布式安装
spark安装包:spark-0.8.1-incubating-bin-hadoop2.tgz操作系统: CentOS6.4jdk版本: jdk1.7.0_211. Cluster模式1.1安装Hadoop用VMware Workstation创建三台CentOS虚拟机,hostname分别设置为 master,slave01, slave02,设
2014-02-02 22:31:10 1714
原创 hadoop-2.2.0 分布式安装
hadoop安装包:hadoop-2.2.0.tar.gz操作系统: CentOS6.4jdk版本: jdk1.7.0_211. 配置namenode和datanode 配置成功的关键在于确保各机器上的主机名和IP地址之间能正确解析。修改每台机器的/etc/hosts文件,如果该台机器作namenode用,则需要在文件中添加集群中所有机器的IP地址及其对应 主机
2014-02-02 18:40:04 3498
opencv编译必须的文件
2019-01-18
python3 64位CRF编译结果
2018-08-01
mac 版sublime
2017-11-30
R on Spark
2014-02-23
hadoop面试题
2013-08-17
用HTML5新特性开发移动App
2013-03-20
Word 转换器(Word Converter)
2013-03-20
星号密码查看器
2013-03-20
extremeTable
2007-09-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人