##高级数据管理
#设定随机数种子
runif(5)#用来生成0到1区间上服从均匀分布的伪随机数
##在每次生成伪随机数的时候,函数都会使用一个不同种子
##所以可以通过set.seed这个函数显示指定这个种子,让结果重现
set.seed(1234)#
runif(5)
##生成多元正态数据mvrnorm()
#mvrnnorm(n,mean,sigma)
#n是样本大小,mean为均值向量,sigma是协方差矩阵
#先安mass包
options(digits = 3)
set.seed(1234)
mean<-c(230.7,146.7,3.6)
sigma<-matrix(c(15360.8,6721.2,-47.1,6721.2,4700.9,-16.5,
-47.1,-16.5,0.3),nrow = 3,ncol = 3)
mydata<-mvrnorm(500,mean,sigma)
mydata<-as.data.frame(mydata)
names(mydata)<-c("y","x1","x2")
dim(mydata)
head(mydata)
head(mydata,n=10)
#字符串处理函数
#计算x中的字符数量
x=c("ab","cde","fghij")
nchar(x[3])
length(x)
##提取或替换一个字符向量中的子串
#substr(x,start,end)
x="abcdef"
substr(x,2,4)
substr(x,2,4)="222