1.iris 数据集中有几种不重复的 Species?
Iris 数据集是一个非常著名的数据集,包含了三种不同的鸢尾花(Iris Setosa、Iris Versicolour 和 Iris Virginica)的样本数据。因此,数据集中有三种不重复的 Species。每个样本都包含了四个特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。这些特征是通过测量一组 50 个每个种类的鸢尾花的样本得出的。Iris 数据集常被用作分类、聚类和数据可视化的基准数据集。
2.请运行下述代码,生成 test_list。计算 test_list 中名为 a 的元素与名为 c 的元素
的均值之差,保留三位小数。
set.seed(123)
test_list <- list(a = sample(-100:100, 100, replace = FALSE),
b = “R test list”,
c = list(runif(50)))
运行下述代码可以生成 test_list。
set.seed(123)
test_list <- list(a = sample(-100:100, 100, replace = FALSE),
b = "R test list",
c = list(runif(50)))
其中,a 列表包含 100 个在 -100 和 100 之间的不重复随机整数,b 为字符串 “R test list”,c 为一个嵌套列表,其中包含了长度为 50 的随机数列表。要计算 test_list 中名为 a 的元素与名为 c 的元素的均值之差,我们可以使用下面的代码:
mean_a <- mean(test_list$a)
mean_c <- mean(unlist(test_list$c))
round(mean_a - mean_c, 3)
首先,我们使用 mean()
函数计算了列表 a 中所有元素的均值,并将其存储在 mean_a
变量中。然后,我们使用 unlist()
函数将列表 c 转换为数字向量,并计算其均值,并将其存储在 mean_c
变量中。最后,我们计算了 mean_a - mean_c
的差,使用 round()
函数将其保留为三位小数,并输出结果。