R数据可视化|使用Scatterplot3d包制作3D散点图

介绍

R 中有许多包(RGL、car、lattice、scatterplot3d等)用于创建3D 图形。

本教程介绍了如何使用 R 的 scatterplot3d包 在 3D 空间中生成散点图。

scaterplot3d 使用起来非常简单,可以通过在已经生成的图形中添加补充点或回归平面来轻松扩展。

它可以很容易地安装,因为它只需要一个已安装的 R 版本。
在这里插入图片描述

安装并加载 scaterplot3d

install.packages("scatterplot3d")
library("scatterplot3d")

准备数据

iris 数据集将被使用进行画图:

data(iris)
head(iris)

Iris 也称鸢尾花卉数据集,是一类多重变量分析的数据集。
数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。
可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

函数 scatterplot3d()

一个简化的格式是:

scatterplot3d(x, y=NULL, z=NULL)

x, y, z 是要绘制的点的坐标。参数 y 和 z 可以是可选的,具体取决于 x 的结构。

那么在什么情况下,y 和 z 是可选变量?

情况1: x是 zvar ~ xvar + yvar 类型的公式。xvar、yvar 和 zvar 用作 x、y 和 z 变量

情况2: x是一个矩阵,包含至少3列,分别对应于x、y和z变量

基本 3D 散点图

scatterplot3d(iris[,1:3])


# 改变点视图的角度
scatterplot3d(iris[,1:3], angle = 60)


更改主标题和轴标签

scatterplot3d(iris[,1:3],
              main="3D Scatter Plot",
              xlab = "Sepal Length (cm)",
              ylab = "Sepal Width (cm)",
              zlab = "Petal Length (cm)")


改变点的形状和颜色

可以使用参数 pchcolor

scatterplot3d(iris[,1:3], pch = 16, color="steelblue")


按组更改点形状

shapes = c(16, 17, 18) 
shapes <- shapes[as.numeric(iris$Species)]
scatterplot3d(iris[,1:3], pch = shapes)


按组更改点颜色

colors <- c("#32CD32", "#0000FF", "#FF4500")
colors <- colors[as.numeric(iris$Species)]
scatterplot3d(iris[,1:3], pch = 16, color=colors)


更改图形的全局外观

可以使用以下参数:

  • grid : 一个逻辑值。如果为 TRUE,则在底部绘制网格。
  • box : 一个逻辑值。如果为 TRUE,则在图片上方周围绘制一个框

删除周围的框

scatterplot3d(iris[,1:3], pch = 16, color = colors,
              grid=TRUE, box=FALSE)


  • x、y 和 z 是指定点的 x、y、z 坐标的数值向量。
    x 可以是一个矩阵或一个包含 3 列对应于 x、y 和 z 坐标的数据框。
    在这种情况下,参数 y 和 z 是可选的
  • grid 指定绘制网格的面。
    可能的值是“xy”、“xz”或“yz”的组合。 示例:grid = c(“xy”, “yz”)。
    默认值为 TRUE 以仅在 xy 平面上添加网格。
  • col.grid, lty.grid: 用于网格的颜色和线型

scatterplot3d 图形的不同面上添加网格:

# 1. 源函数
source('http://www.sthda.com/sthda/RDoc/functions/addgrids3d.r')
# 2. 3D散点图
scatterplot3d(iris[, 1:3], pch = 16, grid=FALSE, box=FALSE)
# 3. 添加网格
addgrids3d(iris[, 1:3], grid = c("xy", "xz", "yz"))


上图中有一个问题就是网格是在点上绘制的。

在下面的R代码中,我们将使用以下步骤将点放在前景中:

  1. 创建空的 scatterplot3 图形,并将 scatterplot3d() 的结果指定给 s3d
  2. 函数 addgrids3d() 用于添加网格
  3. 最后,函数 s3d$points3d 用于在三维散点图上添加点
# 1. 源函数
source('~/hubiC/Documents/R/function/addgrids3d.r')
# 2. 使用 pch="" 清空 3D 散点图
s3d <- scatterplot3d(iris[, 1:3], pch = "", grid=FALSE, box=FALSE)
# 3. 添加网格
addgrids3d(iris[, 1:3], grid = c("xy", "xz", "yz"))
# 4. 添加点
s3d$points3d(iris[, 1:3], pch = 16)


函数 points3d() 将在下一节中描述。

添加 bars

使用参数 type=“h”。这有助于非常清楚地查看点在 x-y 上的位置。

scatterplot3d(iris[,1:3], pch = 16, type="h", 
              color=colors)


修改 scatterplot3d 输出

scatterplot3d 返回一个函数闭包列表,可用于在现有绘图上添加元素。

返回的函数是:

  • xyz.convert(): 将 3D 坐标转换为现有 scatterplot3d 的 2D 平行投影。 它可用于向绘图中添加任意元素,例如图例。
  • points3d():在现有图中添加点或线
  • plane3d():将平面添加到现有绘图中
  • box3d():在图周围添加一个框

添加图例

使用 xyz.convert() 指定图例位置

  1. scatterplot3d() 的结果指定给 s3d
  2. 函数 s3d$xyz.convert() 用于指定图例的坐标
  3. 函数 legend() 用于添加图例
s3d <- scatterplot3d(iris[,1:3], pch = 16, color=colors)
legend(s3d$xyz.convert(7.5, 3, 4.5), legend = levels(iris$Species),
      col =  c("#32CD32", "#0000FF", "#FF4500"), pch = 16)


也可以使用以下关键字指定图例的位置:“bottomright”、“bottom”、“bottomleft”、“left”、“topleft”、“top”、“topright”、“right”和“center”

使用关键字指定图例位置

# 图例位置修改为 "right"
s3d <- scatterplot3d(iris[,1:3], pch = 16, color=colors)
legend("right", legend = levels(iris$Species),
      col =  c("#32CD32", "#0000FF", "#FF4500"), pch = 16)


# 使用参数 inset,其中inset设置值越大,图例越向左偏移

s3d <- scatterplot3d(iris[,1:3], pch = 16, color=colors)
legend("right", legend = levels(iris$Species),
  col = c("#32CD32", "#0000FF", "#FF4500"), pch = 16, inset = 0.1)


# 图例位置修改为 "bottom"
s3d <- scatterplot3d(iris[,1:3], pch = 16, color=colors)
legend("bottom", legend = levels(iris$Species),
      col = c("#32CD32", "#0000FF", "#FF4500"), pch = 16)


使用关键字来指定图例位置非常简单。但是,有时,某些点和图例框之间或轴和图例框之间存在重叠。

那么有什么解决方案可以避免这种重叠吗?

当然,对于函数 Legend(),有多种使用以下参数组合的解决方案

  • bty = “n” :删除图例周围的框。 在这种情况下,图例的背景颜色变得透明,重叠点变得可见
  • bg = “transparent” :将图例框的背景颜色更改为透明颜色(仅当 bty != “n” 时才有可能)
  • inset :修改图边距和图例框之间的距离
  • horiz :一个逻辑值; 如果为 TRUE,则水平而不是垂直设置图例
  • xpd :逻辑值; 如果为 TRUE,则它允许将图例项绘制在绘图之外

自定义图例位置

# 自定义点形状
s3d <- scatterplot3d(iris[,1:3], pch = shapes)
legend("bottom", legend = levels(iris$Species),
       pch = c(16, 17, 18), 
      inset = -0.25, xpd = TRUE, horiz = TRUE)


# 自定义颜色
colors <- c("#ADD8E6", "#FFA07A", "#8470FF")
colors <- colors[as.numeric(iris$Species)]
s3d <- scatterplot3d(iris[,1:3], pch = shapes, color=colors)
legend("bottom", legend = levels(iris$Species),
      col =  c("#ADD8E6", "#FFA07A", "#8470FF"), pch = 16, 
      inset = -0.25, xpd = TRUE, horiz = TRUE)


在上面的 R 代码中,可以使用参数 inset、xpd 和 horiz 来查看对图例框外观的影响。

添加点标签

函数 text() 的用法如下:

scatterplot3d(iris[,1:3], pch = 16, color=colors)
text(s3d$xyz.convert(iris[, 1:3]), labels = rownames(iris),
     cex= 0.7, col = "black")


添加回归平面和补充点

  1. scatterplot3d() 的结果赋值给 s3d
  2. 线性模型计算如下:lm(zvar ~ xvar + yvar)。 假设:zvar 取决于 xvar 和 yvar
  3. 函数 s3d$plane3d() 用于添加回归平面
  4. 使用函数 s3d$points3d() 添加补充点

将使用数据集:

data(trees)
head(trees)
# 该数据集提供了黑樱桃树的周长、高度和体积的测量值。

带有回归平面的 3D 散点图:

# 3D scatter plot
s3d <- scatterplot3d(trees, type = "h", color = "blue",
    angle=45, pch = 16)
# 添加回归平面
my.lm <- lm(trees$Volume ~ trees$Girth + trees$Height)
s3d$plane3d(my.lm)
# 添加补充点
s3d$points3d(seq(10, 20, 2), seq(85, 60, -5), seq(60, 10, -10),
    col = "red", type = "h", pch = 8)


  • 20
    点赞
  • 127
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 要进行python-鸢尾花数据集iris数据的可视化,首先需要读取数据。我们可以使用pandas库中的read_csv函数来读取csv文件,并将数据存储在一个DataFrame对象中。 ```python import pandas as pd data = pd.read_csv('iris.csv') ``` 读取完数据后,我们可以使用`head()`函数来显示前几行的数据,以便了解数据的结构和内容。 ```python print(data.head()) ``` 下一步,我们可以通过使用`describe()`函数来计算数据的描述性统计信息,例如平均值、标准差、最大值、最小值等。 ```python print(data.describe()) ``` 要绘制散点图,我们可以使用`seaborn`和`matplotlib`库。首先,我们需要安装这两个库,使用`pip`命令: ``` pip install seaborn matplotlib ``` 然后,我们可以使用`seaborn`库中的`scatterplot()`函数来绘制散点图。以下是一个示例代码: ```python import seaborn as sns import matplotlib.pyplot as plt sns.scatterplot(x="sepal_length", y="sepal_width", hue="species", data=data) plt.show() ``` 上述代码会根据鸢尾花数据集中的花瓣长度和花瓣宽度绘制一个散点图,并使用不同的颜色表示不同的鸢尾花种类。 这些是python-鸢尾花数据集iris数据可视化的基本步骤。请根据需要进行相应的修改和扩展。 ### 回答2: Python中有很多数据可视化的库,比如Matplotlib和Seaborn可以帮助我们对数据进行可视化处理。接下来我将展示如何使用Python读取鸢尾花数据集,并进行数据可视化。 首先,我们需要导入相关的库和数据集。 ```python import pandas as pd import seaborn as sns df = sns.load_dataset('iris') ``` 通过以上代码,我们通过Seaborn库的load_dataset函数直接加载了鸢尾花数据集,并将数据存储在一个DataFrame中(命名为df)。 接下来,我们可以使用.head()函数来查看数据的前几行,以确保数据正确加载。 ```python print(df.head()) ``` 然后,我们可以使用.describe()函数来对数据进行描述性统计。 ```python print(df.describe()) ``` 描述性统计能够提供一些基本的统计信息,比如平均值、标准差、最小值、最大值等。 最后,我们可以使用散点图来可视化数据集。 ```python sns.scatterplot(x='sepal_length', y='sepal_width', hue='species', data=df) ``` 以上代码将使用sepal_length作为x轴,sepal_width作为y轴,hue参数将根据鸢尾花的品种来着色,从而区分不同的品种。 以上就是使用Python进行鸢尾花数据集的数据读取、描述性统计和散点图可视化。通过这些步骤,我们能够更好地了解数据集,发现数据的分布和关系,从而对数据进行更进一步的分析或者挖掘。 ### 回答3: 鸢尾花数据集是机器学习和数据分析中常用的一个数据集,由英国统计学家罗纳德·费舍尔在1936年收集而来。该数据含了三种不同种类的鸢尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的花萼长度、花萼宽度、花瓣长度和花瓣宽度的测量值。下面是使用Python对鸢尾花数据集进行可视化的步骤: 1. 导入必要的库:首先需要导入一些常用的数据科学库,例如numpy、pandas和matplotlib,以及用于加载数据集的sklearn库。 2. 读取数据:使用sklearn库中的load_iris函数加载鸢尾花数据集,并将其存储在一个变量中。这个数据集是一个sklearn自带的示例数据集,非常容易加载和使用。 3. 显示数据:可以使用pandas库中的DataFrame来显示数据集的前几行。DataFrame是一个二维的表格结构,可以更加直观地展示数据。 4. 描述性统计:使用pandas库的describe函数可以显示数据集的一些基本统计信息,如平均值、标准差、最小值、最大值等。 5. 散点图使用matplotlib库绘制散点图来可视化鸢尾花数据集。可以根据花瓣长度和花瓣宽度的测量值,将数据集中的每个样本点绘制在二维坐标系上。通过使用不同的颜色或符号来表示不同种类的鸢尾花,可以更好地区分不同种类的花朵。 通过上述步骤,我们可以很方便地读取鸢尾花数据集,显示数据集,获取描述性统计信息,并通过散点图数据可视化。这些步骤是进行数据分析和机器学习中的基本操作,可以帮助我们更好地理解鸢尾花数据集,并做进一步的分析和挖掘。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值