【大数据】R语言速成与实战

内容了解:

R:是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

关于R的一个比较准确的描述是:R是一门用于统计计算和作图的语言,它不单是一门语言,更是一个数据计算与分析的环境。统计计算领域有三大工具:SAS、SPSS、S,R正是受S语言和Scheme语言影响发展而来。其最主要的特点是免费、开源、各种各样的模块十分齐全,在R的综合档案网络CRAN中,提供了大量的第三方功能包,其内容涵盖了从统计计算到机器学习,从金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高性能计算模型,可以说无所不包,无所不容,这也是为什么R正在获得越来越多各行各业的从业人员喜爱的一个重要原因。

主要特点:

R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:

1.R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。

2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。

  1. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.

4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2]

5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.

R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。

但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。 。

R语言的下载可以通过CRAN的镜像来查找。

R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和USTC提供的。

总的来说:R语言的优劣势已经很明显 !

R语言的优势是免费开源易操作,劣势是慢、慢、慢!

教学课程:R语言的速成与实战

(R语言语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到)

教学大纲

课时1:R语言是什么、R的优势、资源 16:08

课时2:R的安装、获取帮助、工作空间管理 23:35

课时3:R包的使用、结果的重用、如何处理大数据集 23:43

课时4:R数据集的概念、向量、矩阵和数组 27:43

课时5:R数据框、因子和列表 24:51

课时6:R的常用命令 17:38

课时7:R的list列表详解 15:19

课时8:R的数据源导入方法 22:41

课时9:R的用户自定义函数 14:05

课时10:R访问MySQL数据库 13:01

课时11:R的集成开发环境(IDE)--Rstudio 17:49

课时12:R如何画图,图形参数、符号、线条和颜色 25:10

课时13:R图形的文本属性、尺寸、标题和自定义坐标轴 36:38

课时14:R图形的次要刻度线、参考线、图例和文本标注 30:25

课时15:R的图形组合、图形布局的精细控制 30:57

课时16:R基本的数据管理--创建变量、变量重编码和重命名 21:43

课时17:R基本数据管理--如何处理缺失值、日期值得使用、数据类型转换 30:14

课时18:R基本数据管理--数据集合并、子集的提取以及随机抽样函数 22:23

课时19:R高级数据管理--数学函数、统计函数和概率函数 21:19

课时20:R高级数据管理--字符处理函数、将函数应用于矩阵和数据框 17:49

课时21:R高级数据管理--重复和循环、条件执行、转置 19:24

课时22:R基本图形--条形图(堆砌、分组、均值)、条形图的微调 26:36

课时23:R的基本图形——饼图 17:04

课时24:R基本图形--直方图 09:55

课时25:R基本图形--核密度图 10:05

课时26:R基本图形——箱线图 08:27

课时27:R实例——预测海藻数量之问题描述与目标、数据集格式 16:12

课时28:R实例——预测海藻数量之数据预处理 17:47

课时29:R实例——预测海藻数量之获取预测模型 12:37

课时30:R实例——预测海藻数量之模型的精简和调优 11:11

课程目标

掌握R语言的使用以及实际的操作案例

适合人群

大数据学习者、开发者

阿里云大学官网

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值