R 语言学习
文章平均质量分 69
lishangyin88
多一些坚持。
展开
-
barplot条形图的图例位置设置
例如我把图例移到中间,则:> barplot(counts,beside=TRUE,col=c("red","green","yellow"),legend=rownames(counts),main="条形图",xlab="处理方式",ylab="频数",args.legend=c(x=5.4,y=28.7))args.legend=c(x=,y=)如果不知道x 和y 的具体位置,可使用原创 2016-07-28 21:25:28 · 15129 阅读 · 0 评论 -
R中的数据抽样SMOTE (谢佳标老师讲课笔记)
在使用抽样之前,之前学的内容忘得差不多了。所以在使用本次例子之前,对获取该数据作下了解。hyper<-read.csv("http://archive.ics.uci.edu/ml/machine-learning-databases/thyroid-disease/hypothyroid.data",header=F)names<-read.csv("http://archive.原创 2017-02-27 21:24:10 · 3135 阅读 · 2 评论 -
数据抽样smaple、等比抽样 (根据谢佳标老师课程整理)
1.R 中的sample函数可以实现数据的随机抽样。sample(x, size, replace = FALSE, prob = NULL)x 表示向量或多个元素size 抽样的个数大小。replace=FALSE 非放回抽样。2.对样本进行抽样的一般做法。> x1<-read.csv("E:\\Users\\Administrator\\Desktop\\sample1原创 2017-02-28 21:45:45 · 2582 阅读 · 0 评论 -
R语言的绘图基础(谢佳标老师课程笔记)
1.plot函数> women height weight1 58 1152 59 1173 60 1204 61 1235 62 1266 63 1297 64 1328 65 1359 66 1391原创 2017-03-04 20:54:50 · 1168 阅读 · 0 评论 -
R语言描述性统计分析
1.mean函数mean(x,trim=0,na.rm=TURE)trim 表示剔除的元素的个数所占的比例。所取数值处于0和0.5之间。若该数值乘以x中的元素个数小于1,则不剔除。若x乘以元素个数大于1,则剔除的个数四舍五入,仍然是从排序后的首尾两端剔除。> x [1] 100 2 3 4 5 6 7 8 9 10 11 12> mean(x,tr原创 2017-02-20 21:49:32 · 5150 阅读 · 0 评论 -
画图函数title 和 axis 的用法
1.title# 可以单独使用,有时候绘图函数里已经包含了。attach(iris)# 这样就不用每个都写iris了。boxplot(Sepal.Length~Species,col=heat.colors(3), main=list("Sepal.Length按照Species分类的箱线图",font=4,col='red',cex=1.5), sub=li原创 2017-04-07 11:28:52 · 3215 阅读 · 0 评论 -
关于ggplot2画散点图、条形图的一些细节认识
学习了ggplot2 的一些最基本的东西,有了一些细微的发现。对于画图来说,要引起注意。1.散点图。点的颜色和形状的控制,放置的位置有讲究。如放置aes()里面,还是geom_point()里面大不相同。library("ggplot2")mtcars$am1mtcars$vs1mtcars$cylstr(mtcars)'data.frame': 32 obs.原创 2017-05-01 23:55:23 · 9539 阅读 · 0 评论 -
缺失值的插补
1.利用回归方法,将预测值插补进去。> sub> dataTR=nhanes2[-sub,]> dataTE> dataTE age bmi hyp chl1 20-39 NA NA4 60-99 NA NA10 40-59 NA NA11 20-39 NA NA12 40-59 NA NA15 2原创 2017-05-04 22:36:00 · 1720 阅读 · 0 评论 -
缺失值、异常值的识别
一、传统方法1. is.na() 函数。用在识别某一列中是否有缺失值的情况居多,若x是数据框类型,则is.na(x),则把每一个元素的情况按照TRUE/FALSE的逻辑形式列出。> data(sleep,package="VIM")>h> is.na(h) BodyWgt BrainWgt NonD Dream Sleep Span Gest Pred E原创 2017-05-04 22:02:29 · 4033 阅读 · 0 评论 -
lattice 包高级绘图函数
1.条形图barchart()> barchart(Titanic,layout=c(4,1),auto.key=TRUE,scales=list(x="free")#scales=free 表示各组的x轴的刻度存在不同。如果想要y轴不同时,则要设置成y="free"。还可以写成如下形式:barchart(Class~Freq|Sex+Age,data=as.data.原创 2017-04-25 11:18:42 · 939 阅读 · 0 评论 -
R 中数据的写入与导出
1.利用edit 函数,键盘输入。利用edit 函数首先要有原始值才可以。> a1<-matrix(1)> edit(a1) col1 var2 var3[1,] 1 1 1> a1 [,1][1,] 1可以看出,如果不把edit(a1)赋值,a1的结果是不会发生变化的。有没有自动保存到修改后的内容的函数呢?有,fix()。原创 2016-12-20 19:39:19 · 6528 阅读 · 0 评论 -
R循环语句
1.sqldf 包的使用。注意该包与RMySQL有一定的排斥性。出现这中问题需要卸载掉RMySQL包,detach(package:RMySQL)。2.利用sql语句求平均值。> a1> a1 cyl mean.mpg1 4 26.663642 6 19.742863 8 15.10000另一种方式。可以先选出来cyl 的值,然后再使用mean计算。>原创 2016-12-19 20:19:57 · 520 阅读 · 0 评论 -
aggregate 和 order函数
学习R 语言往往学了后面,忘了前面的。这不,画图这章节里面又用到了以前学过的函数。啰嗦着再写一下,权当复习。1.aggregate 函数基本语法,aggregate(x,by,FUN,...),主要用到的是前几个类型的。例:aggregate(mtcars,by=list(mtcars$cyl,mtcars$gear),FUN=mean),此处的by参数要写成list型的。如果原创 2016-07-30 15:51:18 · 867 阅读 · 0 评论 -
barplot条形图的调整
微调的条形图>counts >barplot(counts,main="Treatment Outcome",horiz=TRUE,cex.names = 1,names.arg = c("No","some","Marked"),xlim=c(0,50),col=c("red","green","yellow"),legend=c("No","some","Marked"),原创 2016-07-31 15:49:15 · 9634 阅读 · 0 评论 -
描述性统计分析
用sapply 函数计算所选择的任意描述性统计量。sapply(x,FUN,optins), 其中x是数据框或矩阵,FUN为一个任意的函数。如果指定了option,他们将被传递给FUN。例:mystats if(na.omit) x m n s skew kurt return(c(n=n,mean=m,s原创 2016-09-10 21:18:17 · 1112 阅读 · 0 评论 -
缺失值的查找与替换
X<-c(1,2,3,NA,5) y<-c(236,90,56,NA,7) z<-c(54,6558,5,21,5) x1<-data.frame(X,y,z) r<-c(NA,1,2,NA,NA)ee> ee X y z r1 1 236 54 NA2 2 90 6558 13 3 56 5 24 NA NA 21 NA5 5原创 2016-09-12 21:13:59 · 6816 阅读 · 0 评论 -
R语言虚拟化变量的设置
1.将factor类型的数据进行哑变量处理。> custome id gender mood outcom1 10 male happy 12 20 female sad 13 30 female happy 04 40 male sad 05 50 female happy 0需要加载包caret.之后利用du原创 2016-12-18 19:41:30 · 6610 阅读 · 0 评论 -
R语言数据基本管理
1.创建新变量常用的有两种方法一是利用$符号直接创建。> data1<-iris[,1:2]> data1$square<-data1$Sepal.Length*data1$Sepal.Width> head(data1) Sepal.Length Sepal.Width square1 5.1 3.5 17.852 4.9原创 2016-12-14 21:15:38 · 447 阅读 · 0 评论 -
R语言中日期变量
1.ISOdate() 将指定数字转化为日期。> ISOdate(2016,12,11)[1] "2016-12-11 12:00:00 GMT"也可以添加数字写成时分秒的形式。> ISOdatetime(2016,11,12,12,48,56)[1] "2016-11-12 12:48:56 CST"2.系统日期和时间 > Sys.Date()[1] "2016-12-12"原创 2016-12-12 19:21:57 · 4108 阅读 · 0 评论 -
数据对象向量详解
1.一个向量的所有元素都必须属于相同的模式,如果不是,R将强制执行类型转换。w1w2 w4[1] "张三" "李四" "王五" "TRUE" "FALSE" "TRUE" "FALSE" "TRUE"字符型+逻辑型(数值型)=字符型2.可以对每个元素进行相关操作。> rm(list=ls())> (w<-(1:10)) [1] 1 2 3 4 5 6原创 2016-12-11 18:46:50 · 486 阅读 · 0 评论 -
preprocess函数
caret 包是相当的强大,除了上文说的能抽样之外,还能补充缺失值,对数据标准化等预处理。一句话,caret包 你值得拥有。许多R使用者对该包相见恨晚,这里简单介绍下,但印象一定要留下。preProcess(X,method=c("center","scale"),thresh=0.95,pacComp=NULL,na.remove=TRUE,k=5,knnSummary=mean,out原创 2017-03-02 22:17:31 · 17465 阅读 · 0 评论