


1 图层的几何和统计类型

1.1 几何/统计类型设置函数


<span style="color: rgb(0, 42, 84);">library</span>(ggplot2)
<span style="color: rgb(0, 42, 84);">ls</span>(<span style="color: rgb(209, 0, 0);">"package:ggplot2"</span>, <span style="color: rgb(0, 84, 0);">pattern</span>=<span style="color: rgb(209, 0, 0);">"^geom_.+"</span>)
##  [1] "geom_abline"     "geom_area"       "geom_bar"       
##  [4] "geom_bin2d"      "geom_blank"      "geom_boxplot"   
##  [7] "geom_contour"    "geom_crossbar"   "geom_density"   
## [10] "geom_density2d"  "geom_dotplot"    "geom_errorbar"  
## [13] "geom_errorbarh"  "geom_freqpoly"   "geom_hex"       
## [16] "geom_histogram"  "geom_hline"      "geom_jitter"    
## [19] "geom_line"       "geom_linerange"  "geom_map"       
## [22] "geom_path"       "geom_point"      "geom_pointrange"
## [25] "geom_polygon"    "geom_quantile"   "geom_raster"    
## [28] "geom_rect"       "geom_ribbon"     "geom_rug"       
## [31] "geom_segment"    "geom_smooth"     "geom_step"      
## [34] "geom_text"       "geom_tile"       "geom_violin"    
## [37] "geom_vline"
<span style="color: rgb(0, 42, 84);">ls</span>(<span style="color: rgb(209, 0, 0);">"package:ggplot2"</span>, <span style="color: rgb(0, 84, 0);">pattern</span>=<span style="color: rgb(209, 0, 0);">"^stat_.+"</span>)
##  [1] "stat_abline"      "stat_bin"         "stat_bin2d"      
##  [4] "stat_bindot"      "stat_binhex"      "stat_boxplot"    
##  [7] "stat_contour"     "stat_density"     "stat_density2d"  
## [10] "stat_ecdf"        "stat_function"    "stat_hline"      
## [13] "stat_identity"    "stat_qq"          "stat_quantile"   
## [16] "stat_smooth"      "stat_spoke"       "stat_sum"        
## [19] "stat_summary"     "stat_summary2d"   "stat_summary_hex"
## [22] "stat_unique"      "stat_vline"       "stat_ydensity"


<span style="color: rgb(0, 0, 195);"># 函数说明,非运行代码</span>
<span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">mapping</span> = <span style="color: rgb(0, 0, 127);">NULL</span>, <span style="color: rgb(0, 84, 0);">data</span> = <span style="color: rgb(0, 0, 127);">NULL</span>, <span style="color: rgb(0, 84, 0);">stat</span> = <span style="color: rgb(209, 0, 0);">"identity"</span>,
           <span style="color: rgb(0, 84, 0);">position</span> = <span style="color: rgb(209, 0, 0);">"identity"</span>, <span style="color: rgb(0, 84, 0);">na.rm</span> = <span style="color: rgb(184, 93, 0);">FALSE</span>, ...)
<span style="color: rgb(0, 42, 84);">stat_identity</span>(<span style="color: rgb(0, 84, 0);">mapping</span> = <span style="color: rgb(0, 0, 127);">NULL</span>, <span style="color: rgb(0, 84, 0);">data</span> = <span style="color: rgb(0, 0, 127);">NULL</span>, <span style="color: rgb(0, 84, 0);">geom</span> = <span style="color: rgb(209, 0, 0);">"point"</span>,
              <span style="color: rgb(0, 84, 0);">position</span> = <span style="color: rgb(209, 0, 0);">"identity"</span>, <span style="color: rgb(0, 84, 0);">width</span> = <span style="color: rgb(0, 0, 127);">NULL</span>,
              <span style="color: rgb(0, 84, 0);">height</span> = <span style="color: rgb(0, 0, 127);">NULL</span>, ...)

有4个参数是一样的:映射(mapping)、数据(data)、位置(position)和点点点(Dot-dot-dot: …)。H.W.特别强调了mapping和data参数的先后顺序在几何/统计类型设定函数和ggplot函数中的差别:ggplot函数先设定数据,再设定映射;而几何/统计类型函数则相反,因为确定作图或统计之前一般都已经有数据,只需指定映射即可。如果不写参数名,它们的用法是这样的:

<span style="color: rgb(0, 0, 195);"># 示例,非运行代码</span>
<span style="color: rgb(0, 42, 84);">ggplot</span>(数据, 映射)
<span style="color: rgb(0, 42, 84);">geom_xxx</span>(映射, 数据)
<span style="color: rgb(0, 42, 84);">stat_xxx</span>(映射, 数据)

"点点点"参数是R语言非常特殊的一个数据类型,用在函数的参数用表示任意参数,在这里表示传递给图层的任意参数如color, shape, alpha等。


<span style="color: rgb(0, 0, 195);"># 取ggplot2的diamonds数据集的一部分数据:</span>
<span style="color: rgb(0, 42, 84);">set.seed</span>(<span style="color: rgb(184, 93, 0);">100</span>)
d.sub <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> diamonds[<span style="color: rgb(0, 42, 84);">sample</span>(<span style="color: rgb(0, 42, 84);">nrow</span>(diamonds), <span style="color: rgb(184, 93, 0);">500</span>),]
p <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=price))
<span style="color: rgb(0, 42, 84);">theme_set</span>(<span style="color: rgb(0, 42, 84);">theme_bw</span>())
p + <span style="color: rgb(0, 42, 84);">stat_identity</span>()
p + <span style="color: rgb(0, 42, 84);">geom_point</span>()


(p + <span style="color: rgb(0, 42, 84);">stat_identity</span>())$layers
## [[1]]
## geom_point:  
## stat_identity: width = NULL, height = NULL 
## position_identity: (width = NULL, height = NULL)
(p + <span style="color: rgb(0, 42, 84);">geom_point</span>())$layers
## [[1]]
## geom_point: na.rm = FALSE 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)


(p + <span style="color: rgb(0, 42, 84);">stat_identity</span>(<span style="color: rgb(0, 84, 0);">geom</span>=<span style="color: rgb(0, 0, 127);">NULL</span>))$layers
## [[1]]
## geom_point:  
## stat_identity: width = NULL, height = NULL 
## position_identity: (width = NULL, height = NULL)
(p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(0, 0, 127);">NULL</span>))$layers
## [[1]]
## geom_point: na.rm = FALSE 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)


1.2 图层对象


p <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">mapping</span>=<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=price), <span style="color: rgb(0, 84, 0);">data</span>=d.sub)
<span style="color: rgb(0, 42, 84);">class</span>(p)
## [1] "proto"       "environment"
## mapping: x = carat, y = price 
## geom_point: na.rm = FALSE 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)


<span style="color: rgb(0, 42, 84);">ggplot</span>() + p


p + <span style="color: rgb(0, 42, 84);">ggplot</span>()
<span style="color: rgb(0, 42, 84);">class</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=price) + <span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub))
## [1] "NULL"
<span style="color: rgb(0, 42, 84);">class</span>(<span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub) + <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=price))
## [1] "gg"     "ggplot"

2 图层的位置调整参数


  • dodge:“避让”方式,即往旁边闪,如柱形图的并排方式就是这种。
  • fill:填充方式, 先把数据归一化,再填充到绘图区的顶部。
  • identity:原地不动,不调整位置
  • jitter:随机抖一抖,让本来重叠的露出点头来
  • stack:叠罗汉

p <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=cut, <span style="color: rgb(0, 84, 0);">y</span>=price, <span style="color: rgb(0, 84, 0);">fill</span>=color))
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"summary"</span>, <span style="color: rgb(0, 84, 0);">fun.y</span>=<span style="color: rgb(209, 0, 0);">"mean"</span>, <span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"stack"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"summary"</span>, <span style="color: rgb(0, 84, 0);">fun.y</span>=<span style="color: rgb(209, 0, 0);">"mean"</span>, <span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"fill"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"summary"</span>, <span style="color: rgb(0, 84, 0);">fun.y</span>=<span style="color: rgb(209, 0, 0);">"mean"</span>, <span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"dodge"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"summary"</span>, <span style="color: rgb(0, 84, 0);">fun.y</span>=<span style="color: rgb(209, 0, 0);">"mean"</span>, <span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"jitter"</span>)


p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"identity"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"jitter"</span>)



p <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=price, <span style="color: rgb(0, 84, 0);">fill</span>=cut, <span style="color: rgb(0, 84, 0);">color</span>=cut))
p + <span style="color: rgb(0, 42, 84);">stat_density</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"stack"</span>)
p + <span style="color: rgb(0, 42, 84);">stat_density</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"fill"</span>)
p + <span style="color: rgb(0, 42, 84);">stat_density</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"identity"</span>)
p + <span style="color: rgb(0, 42, 84);">stat_density</span>(<span style="color: rgb(0, 84, 0);">position</span>=<span style="color: rgb(209, 0, 0);">"identity"</span>, <span style="color: rgb(0, 84, 0);">fill</span>=<span style="color: rgb(209, 0, 0);">"transparent"</span>)


3 图层组合


3.1 简单组合


datax <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">data.frame</span>(<span style="color: rgb(0, 84, 0);">x</span>=<span style="color: rgb(184, 93, 0);">1</span>:<span style="color: rgb(184, 93, 0);">10</span>, <span style="color: rgb(0, 84, 0);">y</span>=<span style="color: rgb(0, 42, 84);">rnorm</span>(<span style="color: rgb(184, 93, 0);">10</span>)+<span style="color: rgb(184, 93, 0);">1</span>:<span style="color: rgb(184, 93, 0);">10</span>)
p  <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(datax, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=x, <span style="color: rgb(0, 84, 0);">y</span>=y))
p + <span style="color: rgb(0, 42, 84);">geom_point</span>() + <span style="color: rgb(0, 42, 84);">geom_line</span>()
p + <span style="color: rgb(0, 42, 84);">geom_point</span>() + <span style="color: rgb(0, 42, 84);">geom_smooth</span>(<span style="color: rgb(0, 84, 0);">method</span>=<span style="color: rgb(209, 0, 0);">"lm"</span>)


p  <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(datax, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=<span style="color: rgb(0, 42, 84);">factor</span>(x), <span style="color: rgb(0, 84, 0);">y</span>=y)) + <span style="color: rgb(0, 42, 84);">xlab</span>(<span style="color: rgb(209, 0, 0);">"x"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"identity"</span>, <span style="color: rgb(0, 84, 0);">fill</span>=<span style="color: rgb(209, 0, 0);">"gray"</span>) +
  <span style="color: rgb(0, 42, 84);">geom_line</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">group</span>=<span style="color: rgb(184, 93, 0);">1</span>), <span style="color: rgb(0, 84, 0);">size</span>=<span style="color: rgb(184, 93, 0);">2</span>) + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(209, 0, 0);">"red"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_bar</span>(<span style="color: rgb(0, 84, 0);">stat</span>=<span style="color: rgb(209, 0, 0);">"identity"</span>, <span style="color: rgb(0, 84, 0);">fill</span>=<span style="color: rgb(209, 0, 0);">"gray"</span>) +
  <span style="color: rgb(0, 42, 84);">geom_smooth</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">group</span>=<span style="color: rgb(184, 93, 0);">1</span>), <span style="color: rgb(0, 84, 0);">method</span>=<span style="color: rgb(209, 0, 0);">"lm"</span>, <span style="color: rgb(0, 84, 0);">se</span>=<span style="color: rgb(184, 93, 0);">FALSE</span>, <span style="color: rgb(0, 84, 0);">size</span>=<span style="color: rgb(184, 93, 0);">2</span>)


3.2 不同映射的组合


p <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(d.sub, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat)) + <span style="color: rgb(0, 42, 84);">ylab</span>(<span style="color: rgb(209, 0, 0);">"depth (blue) / table (red)"</span>)
p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">y</span>=depth), <span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(209, 0, 0);">"blue"</span>)  +
  <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">y</span>=table), <span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(209, 0, 0);">"red"</span>)


<span style="color: rgb(0, 42, 84);">library</span>(reshape2)
datax <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">melt</span>(d.sub, <span style="color: rgb(0, 84, 0);">id.vars</span>=<span style="color: rgb(209, 0, 0);">"carat"</span>, <span style="color: rgb(0, 84, 0);">measure.vars</span>=<span style="color: rgb(0, 42, 84);">c</span>(<span style="color: rgb(209, 0, 0);">"depth"</span>, <span style="color: rgb(209, 0, 0);">"table"</span>))
<span style="color: rgb(0, 42, 84);">ggplot</span>(datax, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=value, <span style="color: rgb(0, 84, 0);">color</span>=variable)) + <span style="color: rgb(0, 42, 84);">geom_point</span>()

3.3 不同类型数据的组合


diamonds数据我们在前面已经了解过了,先看看R datasets包里面的mtcars数据:

<span style="color: rgb(0, 42, 84);">data</span>(mtcars, <span style="color: rgb(0, 84, 0);">package</span>=<span style="color: rgb(209, 0, 0);">"datasets"</span>)
<span style="color: rgb(0, 42, 84);">str</span>(mtcars)
## 'data.frame':	32 obs. of  11 variables:
##  $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ disp: num  160 160 108 258 360 ...
##  $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ qsec: num  16.5 17 18.6 19.4 17 ...
##  $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
##  $ carb: num  4 4 1 1 2 1 4 2 2 4 ...
<span style="color: rgb(0, 42, 84);">head</span>(mtcars, <span style="color: rgb(184, 93, 0);">4</span>)
##                 mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4      21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag  21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710     22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1


p  <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">ggplot</span>(<span style="color: rgb(0, 84, 0);">data</span>=d.sub, <span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carat, <span style="color: rgb(0, 84, 0);">y</span>=price, <span style="color: rgb(0, 84, 0);">color</span>=cut))
layer1 <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carb, <span style="color: rgb(0, 84, 0);">y</span>=mpg), mtcars, <span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(209, 0, 0);">"black"</span>)
(p1 <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> p + layer1)


<span style="color: rgb(0, 42, 84);">head</span>(p1$data, <span style="color: rgb(184, 93, 0);">4</span>)
##       carat       cut color clarity depth table price    x    y    z
## 16601  1.01 Very Good     D     SI1  62.1    59  6630 6.37 6.41 3.97
## 13899  0.90     Ideal     D     SI1  62.4    55  5656 6.15 6.19 3.85
## 29792  0.30     Ideal     D     SI1  61.6    56   709 4.34 4.30 2.66
## 3042   0.30 Very Good     G     VS1  62.0    60   565 4.27 4.31 2.66
## List of 3
##  $ x     : symbol carat
##  $ y     : symbol price
##  $ colour: symbol cut
## [[1]]
## mapping: x = carb, y = mpg 
## geom_point: na.rm = FALSE, colour = black 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)



layer2 <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">y</span>=depth))
(p1 <span style="color: rgb(84, 0, 84); "><strong><-</strong></span> p1 + layer2 + <span style="color: rgb(0, 42, 84);">xlab</span>(<span style="color: rgb(209, 0, 0);">"carb(black) / carat"</span>) + <span style="color: rgb(0, 42, 84);">ylab</span>(<span style="color: rgb(209, 0, 0);">"mpg(black) / depth"</span>))


## List of 3
##  $ x     : symbol carat
##  $ y     : symbol price
##  $ colour: symbol cut
## [[1]]
## mapping: x = carb, y = mpg 
## geom_point: na.rm = FALSE, colour = black 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)
## [[2]]
## mapping: y = depth 
## geom_point: na.rm = FALSE 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)



p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carb, <span style="color: rgb(0, 84, 0);">y</span>=mpg), mtcars)
## Error: arguments imply differing number of rows: 32, 0


p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carb, <span style="color: rgb(0, 84, 0);">y</span>=mpg, <span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(0, 0, 127);">NULL</span>), mtcars)
p + <span style="color: rgb(0, 42, 84);">geom_point</span>(<span style="color: rgb(0, 42, 84);">aes</span>(<span style="color: rgb(0, 84, 0);">x</span>=carb, <span style="color: rgb(0, 84, 0);">y</span>=mpg), mtcars, <span style="color: rgb(0, 84, 0);">color</span>=<span style="color: rgb(209, 0, 0);">"red"</span>)

4 SessionInfo

<span style="color: rgb(0, 42, 84);">sessionInfo</span>()
## R version 3.1.0 (2014-04-10)
## Platform: x86_64-pc-linux-gnu (64-bit)
## locale:
##  [1] LC_CTYPE=zh_CN.UTF-8       LC_NUMERIC=C              
##  [3] LC_TIME=zh_CN.UTF-8        LC_COLLATE=zh_CN.UTF-8    
##  [5] LC_MONETARY=zh_CN.UTF-8    LC_MESSAGES=zh_CN.UTF-8   
##  [7] LC_PAPER=zh_CN.UTF-8       LC_NAME=C                 
##  [9] LC_ADDRESS=C               LC_TELEPHONE=C            
## attached base packages:
## [1] tcltk     stats     graphics  grDevices utils     datasets  methods  
## [8] base     
## other attached packages:
## [1] reshape2_1.2.2  ggplot2_0.9.3.1 zblog_0.1.0     knitr_1.5      
## loaded via a namespace (and not attached):
##  [1] colorspace_1.2-4 digest_0.6.4     evaluate_0.5.3   formatR_0.10    
##  [5] grid_3.1.0       gtable_0.1.2     highr_0.3        labeling_0.2    
##  [9] MASS_7.3-31      munsell_0.4.2    plyr_1.8.1       proto_0.3-10    
## [13] Rcpp_0.11.1      scales_0.2.4     stringr_0.6.2    tools_3.1.0

  • 0
  • 5
    觉得还不错? 一键收藏
  • 0
中译本序, 每当我们看到一个新的软件,第一反应会是:为什么又要发明一个新软件?ggplot2是R世界里相对还比较年轻的一个包,在它之前,官方R已经有自己的基础图形系统(graphics包)和网格图形系统(grid包),并且Deepayan Sarkar也开发了lattice包,看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问,为什么还要发明一套新的系统?, 设计理念, 打个比方,想想我们小时候怎样学中文的。最开始的时候我们要识字,不认识字就没法阅读和写作,但我们并不是一直按照一个个汉字学习的,而是通过句子和具体的场景故事学习的。为什么不在小学时背六年字典呢?那样可能认识所有的汉字。原因很简单,光有单字,我们不会说话,也无法阅读和写作。缺的是什么?答案是对文字的组织能力,或者说语法。, R的基础图形系统基本上是一个“纸笔模型”,即:一块画布摆在面前,你可以在这里画几个点,在那里画几条线,指哪儿画哪儿。后来lattice包的出现稍微改善了这种情况,你可以说,我要画散点图或直方图,并且按照某个分类变量给图中的元素上色,此时数据才在画图中扮演了一定的中心角色,我们不用去想具体这个点要用什么颜色(颜色会根据变量自动生成)。然而,lattice继承了R语言的一个糟糕特征,就是参数设置铺天盖地,足以让人窒息,光是一份xyplot()函数的帮助文档,恐怕就够我们消磨一天时间了,更重要的是,lattice仍然面向特定的统计图形,像基础图形系统一样,有直方图、箱线图、条形图等等,它没有一套可以让数据分析者说话的语法。, 那么数据分析者是怎样说话的呢?他们从来不会说这条线用#FE09BE颜色,那个点用三角形状,他们只会说,把图中的线用数据中的职业类型变量上色,或图中点的形状对应性别变量。有时候他们画了一幅散点图,但马上他们发现这幅图太拥挤,最好是能具体看一下里面不同收入阶层的特征,所以他们会说,把这幅图拆成七幅小图,每幅图对应一个收入阶层。然后发现散点图的趋势不明显,最好加上回归直线,看看回归模型反映的趋势是什么,或者发现图中离群点太多,最好做一下对数变换,减少大数值对图形的主导性。, 从始至终,数据分析者都在数据层面上思考问题,而不是拿着水彩笔和调色板在那里一笔一划作图,而计算机程序员则倾向于画点画线。Leland Wilkinson的著作在理论上改善了这种状况,他提出了一套图形语法,让我们在考虑如何构建一幅图形的时候不再陷在具体的图形元素里面,而是把图形拆分为一些互相独立并且可以自由组合的成分。这套语法提出来之后他自己也做了一套软件,但显然这套软件没有被广泛采用;幸运的是,Hadley Wickham在R语言中把这套想法巧妙地实现了。, 为了说明这种语法的想法,我们考虑图形中的一个成分:坐标系。常见的坐标系有两种:笛卡尔坐标系和极坐标系。在语法中,它们属于一个成分,可自由拆卸替换。笛卡尔坐标系下的条形图实际上可以对应极坐标系下的饼图,因为条形图的高可以对应饼图的角度,本质上没什么区别。因此在ggplot2中,从一幅条形图过渡到饼图,只需要加极少量的代码,把坐标系换一下就可以了。如果我们用纸笔模型,则可以想象,这完全是不同的两幅图,一幅图里面要画的是矩形,另一幅图要画扇形。, 更多的细节在本书中会介绍,这里我们只是简略说明用语法画图对用纸笔画图来说在思维上的优越性;前者是说话,后者是说字。, 发展历程, ggplot2是Hadley在爱荷华州立大学博士期间的作品,也是他博士论文的主题之一,实际上ggplot2还有个前身ggplot,但后来废弃了,某种程度上这也是Hadley写软件的特征,熟悉他的人就知道这不是他第一个“2”版本的包了(还有reshape2)。带2的包和原来的包在语法上会有很大的改动,基本上不兼容。尽管如此,他的R代码风格在R社区可谓独树一帜,尤其是他的代码结构很好,可读性很高,ggplot2是R代码抽象的一个杰作。读者若感兴趣,可以在GitHub网站上浏览他的包:。在用法方面,ggplot2也开创了一种奇特而绝妙的语法,那就是加号:一幅图形从背后的设计来说,是若干图形语法的叠加,从外在的代码来看,也是若干R对象的相加。这一点精妙尽管只是ggplot2系统的很小一部分,但我个人认为没有任何程序语言可比拟,它对作为泛型函数的加号的扩展只能用两个字形容:绝了。, 至2013年2月26日,ggplot2的邮件列表( )订阅成员已达3394人,邮件总数为15185封,已经成为一个丰富、活跃的用户社区。未来ggplot2的发展也将越来越依赖于用户的贡献,这也是很多开源软件最终的走向。, 关于版本更新, 原书面


  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助




当前余额3.43前往充值 >
领取后你会自动成为博主和红包主的粉丝 规则
钱包余额 0


