R语言
文章平均质量分 91
取个name太难
为了生存,转行干前端…
展开
-
R语言笔记十二:绘图函数
1.R语言四大作图系统基础绘图系统(graphics包,默认已加载)lattice包ggplot2包grid包demo(graphics):可以对graphics包中的绘图函数绘制demo图。help(package=“graphics”):对graphics包中的函数进行详细介绍。2.R基础绘图系统1)高级绘图高级绘图是一步到位,可以直接绘制出图;2)低级绘图低级绘图不能单独使用,必须在高级绘图产生图形的基础上,对图形进行调整,比如加一条线,加上标题文字等。3.R绘图输入数据原创 2020-08-01 17:59:52 · 3213 阅读 · 3 评论 -
R语言笔记十一:相关性分析函数及相关性检验函数
1.相关性分析 相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。简单来说就是变量之间是否有关系。 相关性可能是正相关,也可能是负相关,需要根据相关系数决定。相关系数的大小表示相关程度的强弱。2.相关性衡量指标原创 2020-07-28 21:06:14 · 21199 阅读 · 2 评论 -
R语言笔记十:独立性检验函数
1.独立性检验函数 独立性检验是根据频数信息判断两类因子彼此相关或相互独立的假设检验。所谓独立性就是指变量之间是独立的,没有关系。独立性检验算法:卡方检验、Fisher检验、Cochran-Mantel-Haenszel检验2.假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。原假设——没有发生备择假设——发生了具体做法:根据问题的需要对所研究的总体作原创 2020-07-26 11:33:54 · 3642 阅读 · 0 评论 -
R语言笔记九:R函数、选项参数、统计函数
1.R函数(1)lm()是R语言中经常用到的函数,用来拟合回归模型。它是拟合线性模型最基本的函数lm()格式如下:fit<-lm(formula,data)其中,formula指要拟合的模型形式,data是一个数据框,包含了用于拟合模型的数据。结果对象(本例中是fit)存储在一个列表中,包含了所拟合模型的大量信息。表达式(formula)形式如下:Y~X1+X2..Xn举例,输入:a<-c(1,2,3,4,5)b<-c(2,4,6,8,10)mydata<-原创 2020-07-25 10:31:07 · 5746 阅读 · 1 评论 -
R语言笔记八:数据转换之reshape2包、tidyr包、dplyr包
1.数据转换之reshape2包(1)使用merge函数x <- data.frame(k1=c(NA,NA,3,4,5),k2=c(1,NA,NA,4,5),data=1:5)y <- data.frame(k1=c(NA,2,NA,4,5),k2=c(NA,NA,3,4,5),data=1:5)merge(x,y,by)合并函数:by表示根据x和y中的某一列进行合并。如:merge(x,y,by=c(“k1”,“k2”))(2)reshape2包(使用R中的airqualit原创 2020-07-23 12:16:28 · 2686 阅读 · 1 评论 -
R语言笔记七:数据转换,取子集,数据框的添加合并、翻转、排序、计算,数据的中心化与标准化
1.数据转换(1)关于数据框的转换矩阵转换为数据框:dstate.x77 <- as.data.frame(state.x77)is.data.frame(dstate.x77)返回TRUE数据框转换为矩阵:as.matrix(data.frame(state.region,state.x77))数据框中的数据类型不相同,转换为矩阵后,所有元素都变成字符串类型。注意:不是所有数据结构都能进行转换,比如有些数据框就不能转换为向量或者因子。(2)关于向量的转换向量转换为矩阵:x &l原创 2020-07-19 15:35:04 · 4639 阅读 · 0 评论 -
R语言笔记六:获取数据、读入文件、写入文件、读写Excel文件及读写R格式文件
1. 获取数据(1)R获取数据的三种途径- 利用键盘来输入数据;- 通过读取存储在外部文件上的数据;- 通过访问数据库系统来获取数据。例如有以下数据:(2)键盘输入数据:此外,还可以通过edit来输入数据:data2 <- data.frame(patientID=character(),admdate=character(),age=numeric(),diabetes=character(),status=character()) &nbs原创 2020-07-18 09:56:14 · 7119 阅读 · 4 评论 -
R语言笔记五:常见错误
1.定义向量时忘记加字母“c”。2.赋值符号错误。可以使用“alt”+“-”自动生成赋值符号。3.字符串一定要加引号。4.安装R包的时候也一定要加引号。5.文件路径问题:在Windows系统中,文件路径需要使用两个反斜线"//",或者一个正斜线""。6.提示找不到某函数:可能是没有安装对应的扩展包或者包还没有被载入。7.R严格区分大小写。……...原创 2020-07-13 15:12:26 · 2762 阅读 · 3 评论 -
R语言笔记四:因子、缺失数据、字符串、时间序列
1.变量分类- 名义型变量:比如省份- 有序型变量:如:good、better、best- 连续型变量:如年龄2.因子 在R中名义型变量和有序型变量称为因子(factor)。这些分类变量的可能值称为一个水平(level),例如good、better、best,都称为一个level。有这些水平值构成的向量就称为因子。table函数进行频数统计,如:mtcars$cyl &nb原创 2020-07-13 14:57:52 · 3727 阅读 · 6 评论 -
R语言笔记三:矩阵、数组、列表和数据框
1.矩阵 矩阵是二维的,需要有行和列。向量是一维的。 在R软件中,矩阵是有维数的向量,这里的矩阵元素可以是数值型、字符型或者逻辑型,但是每个元素必须拥有相同的模式,这个和向量一致。(1)创建矩阵:m <- matrix(1:20,4,5)行数和列数的分配必须满足分配条件。若分配的行列过大,分配的元素不足够,则报错。m <-原创 2020-07-09 21:27:44 · 5654 阅读 · 2 评论 -
R语言笔记二:向量、向量索引及其运算
1.内置数据集R中的内置数据集存储在datasets这个包中,这些数据一般搜集于真实的调查数据。help(package=“datasets”):查看数据集包。data():列出所有数据集。直接输入数据集名字,就可以使用该数据集。这些内置数据集的名字都是默认的,我们在创建变量的时候最好不要与内置数据集的名字重叠。常用内置数据集:...原创 2020-07-06 21:25:37 · 13249 阅读 · 11 评论 -
R语言笔记一:R、RStudio和R包的安装及使用
(课程视频链接:https://www.bilibili.com/video/BV19x411X7C6?p=1)1.R语言 R语言是S语言的一种实现。R是一个全面的统计研究平台,提供了各式各样的数据分析技术,拥有顶尖的绘图功能。 R中有大量的扩展功能,这些扩展功能称为R的包,目前R已经有5000个以上的扩展包,R的官网:r-project.原创 2020-07-03 21:51:37 · 15996 阅读 · 7 评论