数据可视化在数据分析中的作用举足轻重。通过图形展示数据,能够直观地呈现数据分布、趋势和关系,从而为分析和决策提供有力支持。在R语言中,散点图、直方图、概率密度图和条形图是常用的几种数据可视化工具。本文将深入探讨这几种图形的应用,并通过具体示例展示其用法。
一、散点图
1、认识散点图
散点图(Scatter plot)是展示两个变量之间关系的常用工具。在散点图中,每个点代表一个数据样本,点的位置由样本的两个变量决定。通过观察散点图中点的分布,我们可以判断这两个变量之间的相关性。
散点图是由一组二维坐标组成的,每个数据点代表一个观察值。通常,横轴(X轴)表示自变量,纵轴(Y轴)表示因变量。通过观察数据点的分布模式,研究者可以初步判断变量之间的关系,如正相关、负相关或无相关。
以R语言为例,绘制散点图非常简单。假设我们有两个变量 x
和 y
,使用 plot()
函数即可生成基本的散点图。
# 示例代码
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 6, 7, 10)
plot(x, y)
图结果为: