R语言
文章平均质量分 59
weixin_51077152
这个作者很懒,什么都没留下…
展开
-
R语言-相关性分析函数
相关性分析相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析,即两个变量之间是否有联系相关性衡量指标Pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数,多分格(polychoric)相关系数和多系列(polyserial)相关系数cor()函数cor(x, y = NULL, use = “everything”,method = c(“pears原创 2021-09-08 19:34:02 · 2237 阅读 · 0 评论 -
R语言-独立性检验函数
独立性检验根据频数选项判断两类因子彼此相关或相互独立的假设检验所谓独立性是指变量之间是独立的,没有关系独立性检验算法卡方检验Fisher检验Cochran-Mantel-Haenszel检验假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法原假设——没有发生备择假设——发生了具体做法:根据问题的需要对所研究的总体做某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已.原创 2021-09-08 16:06:27 · 897 阅读 · 0 评论 -
R语言-频数统计函数
R如何对数据进行分组1. factor()函数> mtcars$cyl <- factor(mtcars$cyl)> mtcars$cyl [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4Levels: 4 6 82. cut()函数> cut(mtcars$mpg,c(seq(10,50,10))) [1] (20,30] (20,30] (20,30] (20,30] (10,原创 2021-09-08 15:02:00 · 6260 阅读 · 0 评论 -
R语言-描述性统计函数
1. summary()函数:返回最小值,1/4分位数,中位数,3/4分位数,平均数,最大值> mycars <- mtcars[c("mpg","hp","wt","am")]> summary(mycars) mpg hp wt am Min. :10.40 Min. : 52.0 Min. :1.513 Min. :0.0000 1st Q原创 2021-09-08 10:15:27 · 2045 阅读 · 0 评论 -
R语言-数学统计函数
概率函数的作用这些概率函数都满足特定条件的数据分布情况,可以使用它们生成特定分布的随机数,绘制出对应的分布曲线来查看。R概率分布正态分布(normal distribution)的四个函数,norm加上以下四个前缀d 概率密度函数 (probability density)-dnorm:正态概率密度函数p 分布函数(distribution)-pnorm:正态分布函数q 分布函数的反函数 -qnorm:正态分位数函数r 产生相同分布的随机数(random number)-rnorm:正态.原创 2021-09-07 22:18:47 · 390 阅读 · 0 评论 -
R语言-R函数
输入数据类型向量:sum,mean,sd,rang,median,sort,order矩阵或数据框:cbind,rbind数字矩阵:heatmap函数的选项参数1. 输入控制部分file:接一个文件data:一般指要输入一个数据框x:表示单独的一个对象,一般都是向量,也可以是矩阵或者列表x和y:函数需要输入两个变量x,y,z:函数需要输入三个输入变量formula:公式(用波浪线连接的公式,波浪线(~)表示相关na.rm:删除缺失值…:表示参数可传递;或者表示没有数量限制原创 2021-09-07 21:28:51 · 361 阅读 · 0 评论 -
R语言-数据转换
常见的数据类型: 向量,矩阵,数据框,列表1. 用is和as函数is相关函数:判断数据类型> methods(is) [1] is.Alignment is.array is.atomic is.Border is.call [6] is.CellBlock is.CellProtection is.CellS.原创 2021-09-02 11:52:32 · 11359 阅读 · 1 评论 -
R语言-写入文件
1. 将数据另存为纯文本文件cat()函数:将数据输出到屏幕上> x <- rivers> cat(x)735 320 325 392 524 450 1459 135 465 600 330 336 280 315 870 906 202 329 290 1000 600 505 1450 840 1243 890 350 407 286 280 525 720 390 250 327 230 265 850 210 630 260 230 360 730 600 306原创 2021-09-01 10:37:32 · 2441 阅读 · 0 评论 -
R语言-读取文件
1. 纯文本文件将数据表存储在纯文本文件中;文本中每一行对应数据表的每一行;每一行的不同元素用一些简单的符号进行分隔,常用的有逗号,空格,制表符等;一个文件使用统一的分隔符文件的扩展名一般为.txt;若文件中分隔符为逗号,则扩展名为.csvread.table()函数read.table(file, header = FALSE, sep = “”, row.names, col.names,na.strings = “NA”, nrows = -1, skip = 0, chec原创 2021-08-30 17:48:14 · 12398 阅读 · 0 评论 -
R语言-获取数据
R语言获取数据的三种途径1. 利用键盘来输入数据不够安全,如果中途断掉,数据丢失比较麻烦,较大的数据集,无法用键盘进行输入> patientId <- c(1:4)> admDate <- c("11/15/2009","11,01/2009","10/21/2009","10/28/2009")> age <- c(25,34,28,52)> diabetes <- c("Type1","Type2","Type1","Type1")&g原创 2021-08-30 14:48:42 · 836 阅读 · 0 评论 -
R语言-日期和时间
时间序列分析对时间序列的描述利用前面的结果进行预测1. 获取当前系统的时间:Sys.Date()函数> Sys.Date()[1] "2021-08-27"> class(Sys.Date())[1] "Date"2. as.Date()函数:将字符串转换成Dateas.Date(x,format)format:定义输出字符串的外观(%Y-%m-%d)> a <- "2021/8/27"> class(a)[1] "character.原创 2021-08-27 17:59:56 · 865 阅读 · 0 评论 -
R语言-字符串
字符串R中的字符串要加引号1. 字符串的长度nchar()函数:返回每个元素字符串的个数length()函数:返回元素中向量的个数当元素为数值型时,将数值型元素看成字符型进行处理> month.name [1] "January" "February" "March" "April" "May" "June" "July" "August" "September" "October" "November" [12]原创 2021-08-27 14:40:42 · 352 阅读 · 0 评论 -
R语言-处理缺失值的方法
缺失值NA在R中,NA表示缺失值,NA是不可用,not available的简称,用来存储缺失信息缺失值NA表示没有,并不一定就是0,NA是不知道是多少,也可以是0,也可以是任何值,缺失值和0 是完全不同的。1. 处理mean,sum等常规统计函数中的缺失值出现的问题:添加参数na.rm=T> x <- c(NA,1:20,NA,NA,34:35)> x [1] NA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18原创 2021-08-27 12:07:37 · 9510 阅读 · 1 评论 -
R语言-因子
变量分类名义型变量:没有顺序的区别,元素之间相互独立有序性变量:趋于名义型变量和连续型变量中间连续型变量:某个范围中的任意值因子在R中名义型变量和有序性变量称为因子,factor。这些分类变量的可能值称为应该水平lever,例如good,better,best,都称为一个lever;由这些水平之构成的向量称为因子数据框 mtcars> mtcars mpg cyl disp hp drat wt qsec vs am gear原创 2021-08-26 17:58:50 · 669 阅读 · 0 评论 -
R语言-数据框
数据框数据框是一种表格式的数据结构,数据框旨在模拟数据集数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量数据框实际上是一个列表,列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度数据框是矩形结构,而且数据框的列必须命名、数据框不同列的数据类型可以不同1. 数据框的创建 data.frame(col1,col2,…)> name <- c("张三","王二","李四","赵武")> age <- c(12,13,12,11)>原创 2021-08-26 17:00:57 · 617 阅读 · 0 评论 -
R语言-列表
列表列表是用来存储很多内容的一个集合,在R中是一个非常复杂的数据结构列表是一些对象的有序集合列表中可以存储若干向量,矩阵,数据框,甚至其他列表的组合向量与列表的区别:在模式上两者相似,都是一维数据集合向量只能存储一种数据类型,列表中的对象可以是R中的任何数据结构,也可以是列表本身1. 创建列表list()函数> a <- 1:20> b <- matrix(1:20,2)> c <- "This is a object"> >原创 2021-08-26 15:57:05 · 228 阅读 · 0 评论 -
R语言-矩阵与数组
矩阵矩阵是一个按照长方阵列排列的复数或实数集合向量是一维的,矩阵是二维的,需要行和列R语言的矩阵是有维数的向量,矩阵元素可以是数值型,字符型或者逻辑型,每个元素必须拥有相同的模式创建矩阵matrix(x,nrow,ncol,byrow)matrix(x,nrow,ncol,byrow)x:表示矩阵中的个数nrow:矩阵的行数ncol:矩阵的列数byrow:改变排序顺序;F:按列排列;T:按行排列(默认按列排序)注意:矩阵中的元素数量必须是行跟列中元素数量的整倍数 x <原创 2021-08-26 11:22:52 · 1567 阅读 · 0 评论 -
R语言(1)
创建向量和矩阵函数c():用来把一些数据组合成向量nchar():主要使用来返回字符长度length():则是用来返回字符数量mode():指变量的类型如:数值型、字符型、逻辑型等class():指变量的类别如:矩阵、列表、数据框等typeof():对变量类型的细分函数cbind() 和rbind() 把向量和矩阵拼成一个新的矩阵。cbind() 把矩阵横向合并成一个大矩阵(列方式),而rbind()是纵向合并(行方式)。x=c(1,2,3,7,5)y=3La="Jone"b=c原创 2021-08-03 17:37:07 · 2163 阅读 · 0 评论 -
R语言-用xlsx包在已有数据的工作表中添加数据
xlsx包中的函数函数参数作用xlsx::write.xlsx()x, file, sheetName=“Sheet1”, col.names=TRUE, row.names=TRUE, append=FALSE, showNA=TRUE, password=NULL写入数据到excel表中xlsx::read.xlsx()file, sheetIndex, sheetName=NULL, rowIndex=NULL,startRow=NULL,endRow=NULL,原创 2021-08-16 09:49:41 · 1937 阅读 · 0 评论 -
R语言-向量
向量(vector)类似于数学上的集合的概念,或是其他语言的数组,由一个或多个元素所构成向量其实是用于存储数值型,字符型或逻辑性数据的一维数组用函数c()来创建向量c代表concatenate连接,也可以理解为收集collect,或者合并combine。数值型变量:不需要用引号> x <- c(1,3,2,5,8)> x[1] 1 3 2 5 8字符型变量:使用引号,否则报错:找不到对象(单双引号都可以)不加引号表示引用对象,如变量,函数等,去R语言内部原创 2021-08-24 18:01:39 · 1161 阅读 · 0 评论