R参考卡片二

最新推荐文章于 2024-03-21 09:32:01 发布

余音丶未散

最新推荐文章于 2024-03-21 09:32:01 发布

阅读量1k

点赞数

分类专栏： R 文章标签： R 参考卡片

本文链接：https://blog.csdn.net/q383700092/article/details/51628697

版权

R 专栏收录该内容

41 篇文章 2 订阅

订阅专栏

清除单个变量使用 rm() 函数，清除内存中所有的变量：
rm(list=ls())
合并字符串
data<-"4分50秒"
data<-paste("网站停留时间:","3小时",data,sep="")
分割字符串
unlist(strsplit(<字符串>,split=<分割符>))函数
创建向量和矩阵 =与<-区别：=是传值，<-是赋值
c(), length(), mode(), rbind()#行, cbind()
求平均值，和，连乘，最值，方差，标准差帮助help(函数名) help(matrix)
mean(), sum(), min(), max(), var()#方差, sd()#标准差, prod()#将传入的数值连乘
中位数 median() 百分位数quantile()
五数计算(中位数，下四分位数，上四分位数，最小值，最大值)fivenum()
产生向量
x=c(1:100) 1:10-1每项减一 1:10*2 每项乘2 2:60*2+1 每项乘2加1 x[5]显示第5项x[1:5] x[-5]显示除第5项其他所有项x[-(1:5)] x[x<20&x>5] x[x[5]]第5项的数值
seq()函数 Which()函数
seq(5,20) seq(5,20,by=2) 5-20公差为2 seq(5,20,length=6) 5-20长度为6自动算公差
产生字母序列letters[] letters[1:26]
Which()函数
x<-c(1,2,3,4,5) x[which(x==2)] x[which.max(x)] which.min(x) x[which(x>2)]
rev()函数，向量颠倒 x<-c(2,5,1,3) rev(x) 3 1 5 2
sort( )函数排序 sort(x) 1 2 3 5
生成矩阵矩阵函数matrix() 可简写matrix(x,n,n)
x<-c(1:12) matrix(x,nrow=3)形成3行的矩阵(默认按列排) matrix(x,ncol=4)形成4列的矩阵按行排列matrix(d,ncol=7,byrow = TRUE)
matrix(x,nrow=3,ncol=4) 形成3行4列的矩阵 matrix(x,nrow=3,ncol=4,byrow=T)按行排列下去
函数t() t(矩阵)将矩阵转置
矩阵相乘a%*%b，加减a+b a-b
函数diag() diag(矩阵)取矩阵对角线的数diag(a) diag(向量)对角线矩阵diag(c(1:4)) diag(4)生成4阶单位矩阵
矩阵求逆，函数solve()
解方程组 ax=b x<-solve(a,b)
求矩阵特征值与特征向量eigen()
a=diag(4)+1 a.e=eigen(a,symmtric=T) 特征值a.e$values 特征向量a.e$vectors
判别x类型 is.vector(x) is.array(x) is.matrix(x)
数据框 x1=c(1:20) x2=c(21:40) x=data.frame(x1,x2)
画散点图 plot()
读R脚本 source("D:/H.r")
输出 print()
正态分布函数rnorm( ) rnorm(100,mean=80,sd=7)
泊松分布函数rpois( ) 见R分布函数图片
指数分布函数rexp( )
Gamma分布函数rgamma( )
均匀分布函数runif( ) runif(100,min=80,max=100)
二项分布函数rbinom( )
几何分布函数rgeom( )
求均值函数mean( ), colMeans( ), apply( )
colMeans(x)[c("x1","x2")] apply(x,2,mean)求列的均值2是列 1是行apply(x,1,max)
num=seq(10378001,10378100)
x1=round(runif(100,min=80,max=100))
x2=round(rnorm(100,mean=80,sd=7))
x3=round(rnorm(100,mean=83,sd=18))
x3[which(x3>100)]=100
x=data.frame(num,x1,x2,x3)
直方图 hist(x$x1)
散点图绘制函数 plot(x1,x2) plot(x$x1,x$x2)
列联函数 table(x$x1)
柱状图 barplot(table(x$x1))
饼图 pie(table(x$x1))
箱尾图 boxplot(x$x1,x$x2,x$x3)
箱线图 boxplot(x[2:4],col=c("red","green","blue"),notch=T)
水平放置的箱尾图 boxplot(x[2:4],col=c("red","green","blue"),horizontal=T)
星相图 stars(x[c("x1","x2","x3")])
QQ图判断是否符合正态分布 > qqnorm(x1) > qqline(x1)
茎叶图 stem(x$x1)
散点图的进一步设置 plot(x$x1,x$x2,main="数学分析与线性代数成绩的关系",xlab="数学分析",ylab="线性代数",
xlim=c(0,100),#横坐标区间
ylim=c(0,100),#纵坐标区间
xaxs="i",#Set x axis style as internal 使用内置属性
yaxs="i",#Set y axis style as internal
col="red", #Set the color of plotting symbol to red 颜色
pch=19) #Set the plotting symbol to filled dots 形状
连线图 plot(x$x1,x$x2,type="l") x$x1横坐标数组x$x2纵坐标数组
多条曲线的效果 plot(rain$Tokyo,type="l",col="red", ylim=c(0,300), main="Monthly Rainfall in major cities", xlab="Month of Year", ylab="Rainfall (mm)", lwd=2)
lines(rain$NewYork,type="l",col="blue",lwd=2)
lines(rain$London,type="l",col="green",lwd=2)
密度图 plot(density(rnorm(1000)))
函数data( )列出内置数据 data("cars")
散点图集 data("iris") pairs(iris[,1:4]) plot(iris[,1:4])
向日葵散点图 sunflowerplot(iris[, 3:4], col = "gold", seg.col = "gold")
利用par( )在同一个device输出多个散点图 par(mfrow=c(3,1)) plot(x1,x2); plot(x2,x3);plot(x3,x1);
绘图参数 colors()
绘图设备 dev.new() .....
正态性检测 shapiro.test()
协方差 cov(x,y) 相关系数 cor(x,y) cor.test(x,y) 相关系数越接近1,x与y越相关
x[is.na(x)]=0替换缺失值为0
数据框排序
y[order(y[,2],decreasing=F),] 逆序从大到小
y[order(y[,2],decreasing=T),] 顺序从小到大

数据结构
一、数据管理
vector：向量
numeric：数值型向量
logical：逻辑型向量
character；字符型向量
list：列表
data.frame：数据框
c：连接为向量或列表
length：求长度
subset：求子集
seq，from:to，sequence：等差序列
rep：重复
NA：缺失值
NULL：空对象
sort，order，unique去重，rev：排序
unlist：展平列表
attr，attributes：对象属性
mode，typeof：对象存储模式与类型
names：对象的名字属性

二、字符串处理
character：字符型向量
nchar：字符数
substr：取子串
format，format C：把对象用格式转换为字符串
paste，strsplit：连接或拆分
charmatch，pmatch：字符串匹配
grep，sub，gsub：模式匹配与替换

三、复数
complex，Re，Im，Mod，Arg，Conj：复数函数

四、因子
factor：因子
codes：因子的编码
levels：因子的各水平的名字
nlevels：因子的水平个数
cut：把数值型对象分区间转换为因子
table：交叉频数表
split：按因子分组
aggregate：计算各数据子集的概括统计量
tapply：对“不规则”数组应用函数

数学相关计算
一、计算
+, -, *, /, ^, %%, %/%：四则运算
ceiling，floor向下，round，signif，trunc，zapsmall：舍入
max，min，pmax，pmin：最大最小值
range：最大值和最小值
sum，prod：向量元素和积
cumsum，cumprod，cummax，cummin：累加、累乘
sort：排序
approx和approx fun：插值
diff：差分
sign：符号函数

二、数学函数
abs，sqrt：绝对值，平方根
log, exp, log10, log2：对数与指数函数
sin，cos，tan，asin，acos，atan，atan2：三角函数
sinh，cosh，tanh，asinh，acosh，atanh：双曲函数
beta，lbeta，gamma，lgamma，digamma，trigamma，tetragamma，pentagamma，choose ，lchoose：与贝塔函数、伽玛函数、组合数有关的特殊函数
fft，mvfft，convolve：富利叶变换及卷积
polyroot：多项式求根
poly：正交多项式
spline，splinefun：样条差值
besselI，besselK，besselJ，besselY，gammaCody：Bessel函数
deriv：简单表达式的符号微分或算法微分

三、数组
array：建立数组
matrix：生成矩阵
data.matrix：把数据框转换为数值型矩阵
lower.tri：矩阵的下三角部分
mat.or.vec：生成矩阵或向量 t：矩阵转置
cbind：把列合并为矩阵
rbind：把行合并为矩阵
diag：矩阵对角元素向量或生成对角矩阵
aperm：数组转置
nrow, ncol：计算数组的行数和列数
dim：对象的维向量
dimnames：对象的维名
row/colnames：行名或列名
%*%：矩阵乘法
crossprod：矩阵交叉乘积（内积）
outer：数组外积
kronecker：数组的Kronecker积
apply：对数组的某些维应用函数
tapply：对“不规则”数组应用函数
sweep：计算数组的概括统计量
aggregate：计算数据子集的概括统计量
scale：矩阵标准化
matplot：对矩阵各列绘图
cor：相关阵或协差阵
Contrast：对照矩阵
row：矩阵的行下标集
col：求列下标集

四、线性代数
solve：解线性方程组或求逆
eigen：矩阵的特征值分解
svd：矩阵的奇异值分解
backsolve：解上三角或下三角方程组
chol：Choleski分解
qr：矩阵的QR分解
chol2inv：由Choleski分解求逆

五、逻辑运算
<，>，<=，>=，==，!=：比较运算符
!，&，&&，|，||，xor()：逻辑运算符
logical：生成逻辑向量
all，any：逻辑向量都为真或存在真
ifelse()：二者择一
match，%in%：查找
unique：找出互不相同的元素去重
which：找到真值下标集合
duplicated：找到重复元素

六、优化及求根
optimize，uniroot，polyroot：一维优化与求根
程序设计
一、控制结构
if，else，ifelse，switch：分支
for，while，repeat，break，next：循环
apply，lapply，sapply，tapply，sweep：替代循环的函数。

二、函数方面
function：函数定义
source：调用文件
call：函数调用
.C，.Fortran：调用C或者Fortran子程序的动态链接库
Recall：递归调用
browser，debug，trace，traceback：程序调试
options：指定系统参数
missing：判断虚参是否有对应实参
nargs：参数个数 stop：终止函数执行
on.exit：指定退出时执行
eval，expression：表达式计算
system.time：表达式计算计时
invisible：使变量不显示
menu：选择菜单（字符列表菜单）
其它与函数有关的还有：delay，delete.response，deparse，do.call，dput，environment ，，formals，format.info，interactive，
is.finite，is.function，is.language，is.recursive ，match.arg，match.call，match.fun，model.extract，name，parse，substitute，sys.parent ，warning，machine

三、输入输出
cat，print：显示对象
sink：输出转向到指定文件
dump，save，dput，write：输出对象
scan，read.table，load，dget：读入

四、工作环境
ls，objects：显示对象列表
rm, remove：删除对象
q，quit：退出系统
.First，.Last：初始运行函数与退出运行函数。
options：系统选项
?，help，help.start，apropos：帮助功能
data：列出数据集

统计分析
一、计分布
每一种分布有四个函数：d――density（密度函数），p――分布函数，q――分位数函数，r――随机数函数。
比如，正态分布的这四个函数为dnorm，pnorm，qnorm，rnorm
列出各分布后缀，前面加前缀d、p、q或r就构成函数名：
norm：正态
t：t分布
f：F分布
chisq：卡方（包括非中心）
unif：均匀
exp：指数
weibull：威布尔
gamma：伽玛
beta：贝塔
lnorm：对数正态
logis：逻辑分布
cauchy：柯西
binom：二项分布
geom：几何分布
hyper：超几何
nbinom：负二项
pois：泊松
signrank：符号秩，
wilcox：秩和
tukey：学生化极差

二、简单统计量
sum, mean, var, sd, min, max, range, median, IQR（四分位间距）等为统计量
sort，order，rank与排序有关，其它还有ave，fivenum，mad，quantile，stem等

三、统计检验
R中已实现的有chisq.test，prop.test，t.test

四、多元分析
cor，cov.wt，var：协方差阵及相关阵计算
biplot，biplot.princomp：多元数据biplot图
cancor：典则相关
princomp：主成分分析
hclust：谱系聚类
kmeans：k-均值聚类
cmdscale：经典多维标度其它有dist，mahalanobis，cov.rob

五、时间序列
ts：时间序列对象
diff：计算差分
time：时间序列的采样时间
window：时间窗

六、统计模型
lm，glm，aov：线性模型、广义线性模型、方差分析

文件操作
一、文件执行：
在用R生成一个PDF文档后，如果想去打开它，你可能会在文件夹里找到再点开。再或者我们想调用系统中的其它程序来做点事情，可能要打开cmd敲点命令。实际上这都可以在R内部完成。举例来说用pandoc转换na.md成docx再打开它。
system('pandoc d:\\rspace\\na.md -o d:\\rspace\\na.docx')
shell.exec('d:\\rspace\\na.docx')

二、网络浏览：
browseURL：浏览某个指定的网页
download.file：下载网络文件到本地

三、文件操作
dir.create：新建一个文件夹
list.dirs：显示目录下的文件夹
list.files：显示目录下的文档
file.create：文档创建
file.exists：判断文档是否存在
file.remove：文档删除
file.rename：重命名
file.append：文档添加
file.copy：文档复制
file.symlink(from, to)
file.show：显示文档内容
file.info：显示文档信息
file.edit：编辑文档
zip：压缩文件
unzip：解压缩文件

四、运算进度条
在一个大循环运算时，如果可以看到目前的进度是比较方便的，txtProgressBar和setTxtProgressBar函数可以帮助做到这一点
library(stringr)
用stringr包处理字符串
# 合并字符串
fruit <- c("apple","banana","pear","pinapple")
res <- str_c(1:4,fruit,sep=' ',collapse=' ')
str_c('I want to buy ',res,collapse=' ')

# 计算字符串长度
str_length(c("i","like","programming R",123,res))

# 按位置取子字符串
str_sub(fruit,1,3)
# 子字符串重新赋值
capital <-toupper(str_sub(fruit,1,1))
str_sub(fruit,rep(1,4),rep(1,4))<- capital

# 重复字符串
str_dup(fruit,c(1,2,3,4))

# 加空白
str_pad(fruit,10,"both")
# 去除空白
str_trim(fruit)

# 根据正则表达式检验是否匹配
str_detect(fruit,"a$")
str_detect(fruit,"[aeiou]")

# 找出匹配的字符串位置
str_locate(fruit,"a")

# 提取匹配的部分
str_extract(fruit,"[a-z]+")
str_match(fruit,"[a-z]+")

# 替换匹配的部分
str_replace(fruit,"[aeiou]","-")

# 分割
str_split(res," ")

library(stringr)
str_c(str_sub(x, 1, 4),str_sub(x, 5, 6),str_sub(x, 7, 8),sep='-')

余音丶未散

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
R参考卡片二

清除单个变量使用 rm() 函数，清除内存中所有的变量：rm(list=ls())合并字符串datadata分割字符串unlist(strsplit(,split=))函数创建向量和矩阵 =与c(), length(), mode(), rbind()#行, cbind()求平均值，和，连乘，最值，方差，标准差帮助help(函数名) help(mat
复制链接

扫一扫

专栏目录