0. 开篇
学习笔记
2. R的基本作图
2.1 利用plot()和hist()等
2.1.0 准备
为了举例,我用电脑里的一个表格进行作图,这里关于数据的导入在下一篇文章会详细介绍。我的表格来源于https://community.tableau.com,下载链接是:https://public.tableau.com/s/sites/default/files/media/HollywoodsMostProfitableStories.csv
# 导入
example <- read.csv("C:/Users/Rony/Downloads/HollywoodsMostProfitableStories.csv",
header = TRUE)
# 查看结构
> str(example)
'data.frame': 74 obs. of 8 variables:
$ Film : Factor w/ 74 levels "(500) Days of Summer",..: 2 1 3 4 5 6 7 8 9 10 ...
$ Genre : Factor w/ 6 levels "Action","Animation",..: 3 3 4 4 6 3 4 3 4 3 ...
$ Lead.Studio : Factor w/ 14 levels "","20th Century Fox",..: 5 5 6 13 6 6 10 4 6 14 ...
$ Audience..score..: int 71 81 89 64 84 80 66 80 51 52 ...
$ Profitability : num 5.344 8.096 0.449 4.383 0.653 ...
$ Rotten.Tomatoes..: int 40 87 79 89 54 84 29 93 40 26 ...
$ Worldwide.Gross : num 160.31 60.72 8.97 30.68 29.37 ...
$ Year : int 2008 2009 2011 2009 2007 2011 2010 2007 2008 2008 ...
2.2 最基础作图
不作细述,可以试着在R里跑跑看各种plot(),hist(),boxplot(),pie()等等,。
2.3 常见参数
2.3.1 标注
main主标题,sub副标题,xlab和ylab横纵坐标标注。
2.3.2 图像
pch点的类型
col图像颜色,cex.axis坐标数字的字体大小,xlim,ylim横纵轴的范围c(lower limit,upper limit)
2.3.3 改变布局
par()可以控制所有图像的性质
# 一张图中放两个图形:2行一列,按行放置
par(mfrow = c(2,1))
# 另一种方式
# Build the grid matrix
grid <- matrix(c(1:3,3),nrow=2,byrow=FALSE)
# Specify the layout
layout(mat=grid)
2.3.4 作线性回归线
plot(example$Audience..score..,example$Profitability)
delay_lm <- lm(example$arrival_delay~example$depart_delay)
abline(coef(delay_lm))
2.4 使用ggplot2
# 申明调用ggplot2的包
library(ggplot2)
# 作histogram
ggplot(example,aes(x = Profitability))+
geom_histogram()
# 作不同种类电影和不同制作公司下的histogram
ggplot(example,aes(x = Profitability))+
geom_histogram()+
facet_grid(Genre~Lead.Studio,scales = "free_y")