为什么选择R?
丰富的资源:涵盖了多种行业数据分析中几乎所有的方法。
良好的扩展性:十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分析、绘制精美的图形。
完备的帮助系统:每个函数都有统一格式的帮助,运行实例。
GNU软件:免费、软件本身及程序包的源代码公开。
R与其他统计软件比较
SAS: 速度快,有大量统计分析模块,可扩展性稍差,昂贵。
SPSS: 复杂的用户图形界面,简单易学,但编程十分困难。
Splus: 运行S语言,具有复杂的界面,与R完全兼容,昂贵。
用户需要对命令熟悉:与代码打交道,需要记住常用命令。
占用内存:所有的数据处理在内存中进行,不适于处理超大规模的数据。
运行速度稍慢:即时编译,约相当于C语言的1/20。
相比点击鼠标进行操作,R仍能够大大提高效率。
优势:
能完成绝大部分数据相关的分析、统计、挖掘、可视化等工作
能和Hadoop等大数据解决方案一起工作
劣势:
讨厌的赋值符号 <-
涉及到中文的时候乱码问题总是出现
关于R语言的优劣势详细了解:
内容介绍:
R语言语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。
作为当前在世界范围内最受欢迎的数据挖掘开发语言——R语言以其特有的开放性、高可扩展性以及顶尖的制图功能吸引了越来越多的数据分析爱好者。
内容列表:
课时1:R语言是什么、R的优势、资源 16:08
课时2:R的安装、获取帮助、工作空间管理 23:35
课时3:R包的使用、结果的重用、如何处理大数据集 23:43
课时4:R数据集的概念、向量、矩阵和数组 27:43
课时5:R数据框、因子和列表 24:51
课时6:R的常用命令 17:38
课时7:R的list列表详解 15:19
课时8:R的数据源导入方法 22:41
课时9:R的用户自定义函数 14:05
课时10:R访问MySQL数据库 13:01
课时11:R的集成开发环境(IDE)--Rstudio 17:49
课时12:R如何画图,图形参数、符号、线条和颜色 25:10
课时13:R图形的文本属性、尺寸、标题和自定义坐标轴 36:38
课时14:R图形的次要刻度线、参考线、图例和文本标注 30:25
课时15:R的图形组合、图形布局的精细控制 30:57
课时16:R基本的数据管理--创建变量、变量重编码和重命名 21:43
课时17:R基本数据管理--如何处理缺失值、日期值得使用、数据类型转换 30:14
课时18:R基本数据管理--数据集合并、子集的提取以及随机抽样函数 22:23
课时19:R高级数据管理--数学函数、统计函数和概率函数 21:19
课时20:R高级数据管理--字符处理函数、将函数应用于矩阵和数据框 17:49
课时21:R高级数据管理--重复和循环、条件执行、转置 19:24
课时22:R基本图形--条形图(堆砌、分组、均值)、条形图的微调 26:36
课时23:R的基本图形——饼图 17:04
课时24:R基本图形--直方图 09:55
课时25:R基本图形--核密度图 10:05
课时26:R基本图形——箱线图 08:27
课时27:R实例——预测海藻数量之问题描述与目标、数据集格式 16:12
课时28:R实例——预测海藻数量之数据预处理 17:47
课时29:R实例——预测海藻数量之获取预测模型 12:37
课时30:R实例——预测海藻数量之模型的精简和调优 11:11
课程目标
掌握R语言的使用以及实际的操作案例
适合人群
大数据学习者、开发者
阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)