Week 1 tutorial R语言的基本操作
2.1 Read
read.csv():读取csv文件
2.2 Data Frame
head():检查数据前10行
class():返回数据类型
dim():数据维度
nrow():数据行数
$:可以直接找到数据的属性
[[]]:里面放上列名,直接找到该列
cereal[1:10,]:提取1到10行
subset(data, col_name == “value”):在data里找到列的值为value的所有行数据
2.3 Factors
read.csv(data, stringsAsFactors = TRUE):将字符串转换成factor类型。
class(data$属性):查看属性的类型
levels:有哪些值得,去重后。必须是factor类型
nlevel:不同值的个数。必须是factor类型
2.4 Vectors
c:设置Vectors
length:查看Vector长度
属性[start, end]:取数据从start到end
c(属性 , 值):像属性直接添加值
2.5 Matrix
as.metrix:将data frame变成矩阵
data frame[start, end]:取data frame的列从start到end
3.1 Numeric Summary
summary(属性):查看列属性的最小值,最大值,均值,中位数,1分位,3分位
3.2 Basic Statistics
min():最小值
max():最大值
mean():均值
sd():标准差
4.1 Graphical summary Boxplot
boxplot(sodium ~ mfr, data = cereal):sodium按照mfr分组画boxplot,数据是cereal。记住后面的是分组,一般type都是factor。也就是名词性的数据。
4.2 plot
plot(x, y, main, xlab, ylab):main是标题,xlab是x轴名称,ylab是y轴名称
5.1 Write.csv
write.csv(data, file=“数据名”)