读写CSV文件
读取 CSV 文件
data <- read.csv("dataset.csv", encoding="UTF-8")
colnames(data) <- c("p1","p2","p3","p4","p5","p6","p7","lable")
print(data)
读取dataset文件,文件自行提供。
运行结果
p1 p2 p3 p4 p5 p6 p7 lable
1 1 2 3 4 5 6 7 A
2 2 2 2 2 2 2 2 C
3 1 3 3 3 3 3 3 B
4 1 2 3 4 4 4 4 D
5 1 2 3 1 5 6 7 A
6 1 2 3 2 5 6 7 A
7 1 2 3 4 4 4 7 A
8 1 2 3 4 4 4 4 A
9 6 6 6 6 6 6 6 D
保存 CSV 文件
data <- read.csv("dataset.csv", encoding="UTF-8")
colnames(data) <- c("p1","p2","p3","p4","p5","p6","p7","lable")
data2 <- data[data$lable=="A",] #筛选lable为A的所有数据
write.table(data2, "data2.csv", row.names=FALSE, col.names=FALSE, sep=",") #不包含行列名
保存为csv文件
常用数据框查询取值
ncol(data) #[1] 8
nrow(data) #[1] 9
str(data) #查看数据结构
summary(data) #查看统计量
data[data$p1>1,] #查询p1列值>1的所有行
data[c(1,3,4),] #查询第1,3,4行
data[,c(1,2,8)] #查询 第1,2,8列的所有行
data[,which(colnames(data)==c("p1","lable"))] #查询列名为 "p1","lable" 的所有行
data[which(row.names(data)>=3 & row.names(data)<=5),] #查询3-5行
data[data$p1>1,] #查询p1>1的所有行