数据集创建常用函数,本文中有详细介绍:
#c函数,将元素组成向量
#matrix函数用于创建矩阵
#t函数,转置函数
#array函数创建数组
#data.frame()函数创建数据框
#str查看数据结构,查看table1的数据结构
#class查看数据类型
#rbind函数,数据框的合并
#c函数,将元素组成向量a1,b"甲",c"TRUE",a;b;c #运行向量a,b,ca[c(1,3)] #访问a向量中的第一和第三的元素 #matrix函数用于创建矩阵#函数格式matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)#data为向量,nrow矩阵行数,ncol矩阵列数,byrow=FALSE默认按照列填充矩阵#中的元素;按照行填充是,设置byrow=TRUE,dimnames列出矩阵的行名和列名#创建5行4列a1mat5,ncol=View(mat) #mat#t函数,转置函数t(mat) #array函数创建数组#函数格式#array(data = NA,dim=length(data),dimnames = NULL)#data是一个向量,包含数组中的向量;dim指定每个维度的最大长度;dimnames是每个维度名称标签的一个列表#创建4*3*4dim1"男1",dim2"赞成",dim3"东部",data48,d4,d #运行d#数据框#data.frame()函数创建数据框#函数格式#data.frame(col1,col2,col3,col4,...)#以下创建6名学生考试成绩names"张三",chinese"56",math"32",english"72",#将向量组成数据框形式,储存在对象table1中table1#显示前2位同学的成绩head(table1,2) #显示最后2位同学的成绩tail(table1,2)#str查看数据结构,查看table1的数据结构#class查看数据类型str(table1) #查看table1的数据结构class(table1) #查看table1的数据类型,table1的数据类型结果为data.frame,即为数据框格式#查看table1的数据结构#结果显示4个变量,6个观测值#'data.frame': 6 obs. of 4 variables:#$ 姓名: chr "张三" "李四" "刘文" "李玉" ...#$ 语文: chr "56" "89" "78" "45" ...#$ 数学: chr "32" "86" "98" "89" ...#$ 英语: chr "72" "65" "7" "77" ...#查看多少行和多少列,使用nrow和ncol或dim()函数nrow(table1) #多少行ncol(table1) #多少列dim(table1) #多少行和列#[1] 6 4 即为6行,4列#对特定行和列的指定,使用"$"符号#如,对table1中的英语分析,则table1$英语,同时等价于table1$[,3]table1$英语table1[,3]#对两个变量分析,如数学和英语,则为table1[,c(2,3)]或者table1[,c(2:3)]#指定行时,把逗号放到后面即可,如第三行的数据,table1[3,],第二行和第四行为table1[(2,4),]table1[3,]table1[c(2,4),]#rbind函数,数据框的合并 #将数据框table2和table1合并 #先生成table2names"李华",chinese"15",math"86",english"78", #将向量组成数据框形式,储存在对象table2中table2#使用rbind函数合并table1和table2,并命名为tabletable#合并table1和table2table #还有两门(dance和sing)成绩录入,成绩为table3 #先生成table3names"张三",dance"89",sing"98",table3table3 #将上面已得到的table3合并到table的第四列和第五列中#cbind函数可以合并数据cbind(table,table3[,2:3])table#sort函数可用于对向量排序,函数默认decreasing=FALSE,即为升序排列,降序需要设置decreasing=TRUEsort(table1$姓名) #对table1中的姓名进行升序排列sort(table1$语文,decreasing=TRUE) #对table1中的语文进行降序排列#oder函数可对数据框中的数据进行排序,同时排序结果与数据框的行变量相对应table[order(table$姓名),] #按学生的姓名做升序排列,其他变量相应变动table[order(table$语文,decreasing=TRUE),] #按语文成绩做降序排列,其他变量相应变动#因子和列表#类别变量是取值为对象属性或类别以及区间值的变量,也称为定性变量 #类别变量分为无序类别变量和有序类别变量#数值变量是取值为数字的变量,数值的观测结果称为数值数据或定量数据 #数值变量根据取值的不同分为离散变量和连续变量#类别变量在R中称为因子,因子的取值称为水平,多数的分析及绘图都是按照因子的水平进行处理。#factor函数可将向量编码为因子;如向量a#factor(a)将此向量按照元素的名称编码为(2,1,3,3,2,3),根据分析的需要,使用as.numeric函数将因子转化为数值 #将无序因子转化为数值a"贸易",f#将向量a编码为因子as.numeric(f) #将因子a转换为数值 #将有序因子转换为数值,参数设置ordered=TRUE(默认为ordered=FALSE)b"很好",f"很好",as.numeric(f) #将因子b转换为数值
本文源代码百度网盘链接:
链接:https://pan.baidu.com/s/1wr8UGHdWNh1AXZ3R0rX5rQ
提取码:k147