一、R语言是第一代机器学习工具,其优势如下
1、因为R语言是统计学家发明的语言,然后封装了很多的数学公式
2、R语言有很多第三方的包,算法的包,画图的包
但是当数据量过大时候,R语言就显得很吃力了。当数据量过大时候我们就开始用Mahout。
二、Mahout是第二代机器学习语言。
Mahout使用mapreduce实现了R语言的若干算法。
三、既然有了基于mapreduce的第二代机器学习语言。那么便有了MLLib(Machine Learning Lib)。
MLLib基于Spark
特点介绍
• 主要用于统计分析、绘图、数据挖掘
• R内置多种统计学及数字分析功能。R的功能也可以通过安装包(Packages,用户撰写的功能)增强。
• 因为S的血缘,R比其他统计学或数学专用的编程语言有更强的面向对象(面向对象程序设计)功能。
其他介绍
• R的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。
• 虽然R主要用于统计分析或者开发统计相关的软件,但也有人用作矩阵计算。其分析速度可媲美专用于矩阵计算的自由软件GNU Octave和商业软件MATLAB。
• SPSS - 另一种统计分析软件
• SAS系统 - 另一种统计分析软件
安装
• R官网下载3.1.3【注:安装路径不能有空格和特殊字符】
• IDE开发环境使用Rstudio
机器学习流程