高级数据管理
#数学函数
data=read.csv('sample.csv')
high=data$high[c(1:20)]
abs(high)
sqrt(high)
#不小于high的最小整数
ceiling(high)
#不大于high 的最小整数
floor(high)
#向0方向截取的high整数部分
trunc(high)
#将high舍入为指定的小数
round(high,digits = 1)
#将high舍入为指定的有效数字位数
signif(high,digits = 6)
log(high,base = 2)
log(x) #自然对数
log10(x)
exp(x)
#统计函数
mean(high)
median(high)
sd(high)
min()
max()
var(high)
mad(high)
sum(high)
#分位数 30%,84%
quantile(high,probs = c(.3,.84))
#滞后差分
diff(high,lag = 1)
#中心化或者标准化处理
scale(high)
#概率函数
#d=密度函数(density)
#p=分布函数(distribution function)
#q=分位数函数(quantile function)
#r=生成随机数(随机偏差)
#字符处理函数
cc="I love you "
nchar(cc) #字符串数量
substr(cc,4,8)
grep(o,cc)
sub('\\s','.',cc) #替换
strsplit() #python split
paste() #python zip
toupper()
tolower()
#其他函数
seq(1,20,by=0.5) #生成序列
rep(1:3,4) #重复
cut()
pretty()
cat()
#控制流
for (i in 1:10) print('i')
i=10
while(i>0){
print('heloo');
i=i-1
}
for (i in 1:2)
switch(i,
1='liming',
2 ='weiyudang')
weiyudang=function(x){return(x**2)}
#装置
t(data)
#整合数据,使用一个或者多个by变量和一个预先定义好的函数来折叠(collapse)数据
#reshape