R
memoryqiu
这个作者很懒,什么都没留下…
展开
-
[R数据预处理] 数据清洗: 删除重复数据、剔除空值和清除串前后空格
1. 删除重复数据 unique (x)> a30,10,20)) #生成有重复值得数据> a [1] 19 10 13 15 16 13 14 14 19 11 11 20 14 14 12 11 17 16 20 16 11 12[23] 15 10 14 13 19 17 12 15> data'data.csv',row.names=F) #写文件> newdata原创 2018-01-30 17:48:05 · 24830 阅读 · 0 评论 -
[R基础] 入门知识
ctrl +L 清空console界面R语言区别大小写,所以对象A与对象a并不一样。关闭R软件,使用命令q()或者直接点击右上角的关闭。R软件由R包组成,每个包里有各种函数。命令library()查看原装的几十个R包列表。对于非原装的R包,可以通过命令install.packages('packages_name'),选择任意镜- 像安装packages_name包。在调用此包的函...原创 2018-05-17 11:14:26 · 1641 阅读 · 0 评论 -
[R分析] 描述统计:频数和频率分布直方图
n<-round(runif(1000,0,100)) #生成0到100的1000个随机数hist(n) #频数分布直方图,纵坐标名字为frequencyhist(n,freq = F) #频率分布直方图,纵坐标名字为density n<-rnorm(1000) #服从正态分布的1000个数hist(n)hist(n,freq = F)...原创 2018-02-08 12:20:13 · 23082 阅读 · 0 评论 -
[R时间数据] 时间数据操作
Date类型1. 数据量少的情况下,可以手工输入为字符串格式,然后转为Date类型,数据量多的话应从外部文件输入,再转为Date格式,两种方式都需要as.Date函数。> date1'2018-02-05' #日期的标准格式> date2as.Date(date1)> class(date1)[1] "character"> class(date2)[1] "Date"原创 2018-02-06 16:05:55 · 4250 阅读 · 0 评论 -
[R基础] 数据输入输出
1. 用户可以使用print或只输入对象名,即在屏幕上得到显示。> out3)*10, x2=c('a','b','c'))> out x1 x21 3.7035707 a2 7.8101754 b3 0.1114951 c> print(out) x1 x21 3.7035707 a2 7.8101754 b3 0.1114951原创 2018-01-30 13:44:58 · 319 阅读 · 0 评论 -
[R] 对象深入
1. 求解线性方程组> a3,1,5,2),2,2)> b4,1),2,1)> x<-solve(a,b) > x [,1][1,] 3[2,] -12. 数据框> city'a','b','c','d')> age27,29,31,16)> data<-data.frame(city, age)> class(city)[1] "character原创 2018-01-29 21:37:19 · 181 阅读 · 0 评论 -
[R数值型向量] 数值型向量:增加、删除和更改元素
1.判断是否为数值型向量 2.增加一个元素 3.删除向量中的缺失值 4.删除最后一个元素 5.更改某个元素> x1:5> is.numeric(x) #判断是否为数值型向量。其他向量转换为数值型向量: as.numeric()[1] TRUE> is.character(x) #判断是否为字符、逻辑的函数: is.character()、is.logical(),转原创 2018-01-30 12:21:36 · 23810 阅读 · 0 评论 -
[R基础] 基础函数:sep, rep, runif, rnorm, matrix, cbind, ifelse
常用函数有sep, rep, runif, rnorm, matrix, cbind, ifelse。> a-seq(3,30,4) #3到30,步长为4(函数括号内都为逗号)> a[1] 3 7 11 15 19 23 27> b-rep(4:6,times=c(3,2,4)) #重复向量> b[1] 4 4 4 5 5 6 6 6 6> r原创 2018-01-29 20:52:16 · 7702 阅读 · 0 评论 -
[R基础] 数据形式:向量、函数、变量、数组、数据框、列表、类和对象和模型与公式
ctrl +L 清空console界面1. 变量> x-c(5:10)> x[1] 5 6 7 8 9 10> x[3] #从变量x中取出某一个元素的话,可以使用方括号加索引号[1] 7> x[3:5] #选择第三到第五位置的数[1] 7 8 9> x[-3] #删除第3个数[1] 5 6 8 9 10> x[x>8]原创 2018-01-29 19:59:03 · 527 阅读 · 0 评论 -
[R分析] 主成分分析
生成4列30个随机数;写csv文件,读csv文件;进行主成分分析。# runif(n, min = 0, max = 1)# runif函数生成随机数,n表示个数,min与max表示随机数的取值范围。# round函数四舍五入,默认小数位为0。&amp;gt; x130,130,170)) &amp;gt; x230,35,70))&amp;gt; x330,60,95))&amp;gt; x430,65,100原创 2018-01-26 22:38:08 · 949 阅读 · 0 评论 -
[R分析] 相关性分析与画图
目前有10名儿童的年龄和身高的数据(虚构数据),求身高的分布及体重和年龄的关系。 年龄(岁) 体重(kg) 4 45 6 56 4 47 7 60 5 56 7 61 5 58 8 66 6 64 8 65解题思路(1)建立age,height两个原创 2018-01-26 21:29:29 · 11698 阅读 · 0 评论 -
[R字符串] 字符串长度、分割、拼接、截取、替代、匹配和大小写替换
获取字符串长度:nchar() 字符串分割:strsplit() 字符串拼接:paste() 字符串截取:substr() 字符串替代:gsub() 字符串匹配:grep()1. 获取字符串长度nchar()能够获取字符串的长度,它也支持字符串向量操作。注意它和length()的结果是有区别的。fruit 'apple orange grape banana'nchar(f原创 2018-02-01 23:51:03 · 56752 阅读 · 0 评论 -
[R数据预处理] 数据重塑
统计中待分析的数据框通常有两种形式:(1)长型数据(堆叠数据),长型数据是各变量取值在一列中,而对应的变量名在另一列。(2)宽型数据(非堆叠数据),宽型数据一般是各变量取值类型一致,而变量以不同列的形式构成。(常用)1. 例如iris的前四列子集即是一个典型的宽型数据。例如下面将宽型数据转为长型数据:data_w 1:4]data_l &lt;- stack(data_w)head(dat原创 2018-02-01 19:35:01 · 345 阅读 · 0 评论 -
[R数据预处理] 数据整理:取子集、编码转换、离散化、数据类型转换 、因子合并与重设
1. 取数据子集 两种方式取数据子集:a. 使用方括号加索引来取子集b. subset函数取iris中花种类为setosa的子集,并取后三列数据。&gt; data_sub-subset(iris, Species == 'setosa', 3:5) #后面两个参数为条件&gt; head(data_sub) Petal.Length Petal.Width Species1原创 2018-02-01 19:34:33 · 1536 阅读 · 0 评论 -
[R可视化分析] 绘制旋转的三维散点图
读取xlsx文件安装xlsx程序包,选择China的任意一个镜像站点,它会自动安装其他所需的依赖包; 加载xlsx 读取xlsx文件install.packages("xlsx") library(xlsx) mydata&lt;-read.xlsx2(file="D:\\workspace\\data.xlsx",sheetIndex=1)...原创 2018-05-17 11:23:47 · 6060 阅读 · 0 评论