原标题:R语言做数据可视化分析
这是我的 第50篇原创文章,关于数据可视化分析。
阅读完本文,你可以知道:
1 R语言的可视化包?
2 R语言实现常用的可视化?
0
前言
我们 身处数据时代,我们倡导数字经济,我们都是数据人。因此,我们合理分析数据以发现有意义的洞见就显得尤为重要。
数据可视化分析是一个重要的工具,可以让你从数据中挖掘出关键的洞见。如果你的分析结果能够恰当的可视化,那可以与利益相关者做有效地沟通。
1
R语言的可视化包
1 graphics包,R语言base包之一,用于绘制基础的可视化图形,例如:散点图、盒箱图等。
2 lattice包,它在graphics包的基础上做了改进和拓新,适用于多变量数据可视化分析。
3 ggplot2包,它基于Grammar of Graphics的原理设计和实现各种复杂的可视化,把可视化采用 分图层叠加的方式来创建。
4 plotly包,它利用开源Java图形库创建 可交互式的Web图形。
等等
2
R语言实现常用的数据可视化
数据准备,选择了R语言自带的2个数据集,分别如下:
1airquality:1973年5月到9月纽约每日的空气质量测量
2mtcars:Motor Trend Car Road Tests
加载R包和数据集
参考代码
# 加载R包
library(pacman)
p_load(lattice, ggplot2, plotly)
# 数据准备
data( "airquality")
data( "mtcars")
数据可视化
1 graphics包画图
1.1 散点图
参考代码
# 1.1 散点图
plot(airquality $Ozone, airquality $Wind)
结论:
Wind与Ozone具有一定的负相关性。
1.2 散点图矩阵
参考代码
# 1.2 散点图矩阵
plot(airquality)
1.3 点线图
参考代码
# 1.3 点线图
plot(airquality $Ozone, type= 'b')
1.4 图形添加标签和标题
参考代码
# 1.4 添加标签和标题
plot(airquality $Ozone,
xlab = '观察的index',
<