iris数据的详细介绍如下:
首先,要查看iris数据集的大小和结构,其维度和名称分别使用函数dim 和names获取,函数str 和attributes返回数据的结构和属性。
dim(iris)
names(iris)
str(iris)
attributes(iris)
接下来,查看数据的前五行,返回第一和最后一行,使用head和tail
iris[1:5,]
head(iris)
tail(iris)
还可以查找某一列的值:
例如,下面的两行代码可用来获取到Sepal.Length的前10个值。
iris[1:10, "Sepal.Length"]
iris$Sepal.Length[1:10]
每一个数值型变量的分布情况,可用函数summary进行查看。该函数的返回值是变量中的最小值、最大值、平均值、中位数、第一四分位数(25%)和第三四分位数(75%)。
对于因子(或分类变量)而言,函数返回的是每一个等级水平的频数。
summary(iris)
平均值、中位数和极差也可以分别使用函数mean、median和range获取,获取四分位数和百分位数可以使用quantile函数,代码如下所示:
quantile(iris$Sepal.Length)
quantile(iris$Sepal.Length, c(.1, .3, .65))
首先,要查看iris数据集的大小和结构,其维度和名称分别使用函数dim 和names获取,函数str 和attributes返回数据的结构和属性。
dim(iris)
names(iris)
str(iris)
attributes(iris)
接下来,查看数据的前五行,返回第一和最后一行,使用head和tail
iris[1:5,]
head(iris)
tail(iris)
还可以查找某一列的值:
例如,下面的两行代码可用来获取到Sepal.Length的前10个值。
iris[1:10, "Sepal.Length"]
iris$Sepal.Length[1:10]
每一个数值型变量的分布情况,可用函数summary进行查看。该函数的返回值是变量中的最小值、最大值、平均值、中位数、第一四分位数(25%)和第三四分位数(75%)。
对于因子(或分类变量)而言,函数返回的是每一个等级水平的频数。
summary(iris)
平均值、中位数和极差也可以分别使用函数mean、median和range获取,获取四分位数和百分位数可以使用quantile函数,代码如下所示:
quantile(iris$Sepal.Length)
quantile(iris$Sepal.Length, c(.1, .3, .65))