在去了解大数据开发时,发现了对大数据分析的介绍,从前辈的介绍中了解了一点两者的不同:
大数据开发的关键字是:计算机, Java 开发, 架构 ,Linux, hadoop, Hive,Spark,MapReduce, Mysql ,ETL等
大数据分析的关键字是:统计学, EXCEL, SQL, 数据挖掘算法, SPSS ,R,数据分析工具 ,Python, 数学建模等
从关键字的对比中可以发现,大数据主要是做 Java 软件开发,更偏向于计算机专业,需要更多的开发经验,需要对海量数据进行管理,维护。而数据分析主要通过掌握数据分析工具,数据分析算法,从事数据的价值分析工作,提供决策等。
看完了简短的介绍之后,想要对大数据分析做更深的了解,于是就选择先学习一下R语言。
R语言是由由奥克兰大学的 Ross Ihaka 和Robert Gentleman 共同创立发明,其语法和词法分别源自Scheme和S语言。R语言的定义:一个能够自由有效地用于统计计算和绘图的语言和环境,它提供了广泛的统计分析和绘图技术。
关于R:R是免费的开源软件;具有全面的统计研究平台,提供了各种各样的数据分析技术;R是一个程序设计语言,可以很容易地通过使用用户定义的函数扩展;可以从多个数据源获取数据并将其转化为可用的形式;可以运行在多个平台上,如Windows,Unix,Mac
其它关于R:R书籍:《数据挖掘与R语言》,《R语言实践》,《R语言编程艺术》;R主页https://www.r-project.org
了解了R的基础知识后,需要进入到R学习第一步,
1、进入R主页下载R,点击download R
2、点击下方任意一个即可
3、根据自己的需求下载不同平台上的
4、点击进入之后,如果是第一次则点击第一次下载
5、下载之后,按照正常软件安装即可
6、打开桌面快捷方式,出现如下界面,就可以进行程序编写了
7,第一课之R基本语法
赋值采用左箭头 <— ,等号=则显得不专业;如x<—rnorm(5);即创建了一个x向量,它包含5个来自正态分布的随机偏差
mean():均值,mean(weight)表示体重的均值;
sd():标准差,sd(weight)表示集合体重的标准差;
cor():相关度,cor(age,weight)表示年龄和体重的相关度;
plot():绘图/图形,plot(age,weight)表示年龄和体重的图形表示;
获取帮助的常用的函数为help.start();
demo(graphical)会出现R当中一些统计图
getwd()查看当前工作空间
setwd()改变工作空间
推荐R语言介绍网站:图灵社区http://www.ituring.com.cn/book/tupubarticle/9801