期末结束,来分享一下 Exploration Data Analysis这门课我做的一个图。
语言依旧是 R, 用的Rstudio,这玩意儿真的拉闸,作为一个数据分析主要语言的软件,我数据量一大它就各种死机。
数据用的IMDB的电影数据,因为小组定的storyline是给电影制作人做一个电影分析
数据
外部数据
数据部分除了IMDB电影数据之外,还引入了国家经纬度的一个数据包。
其实这边数据过大,而且电影没有直接对应拍摄国关系的数据,所以我用了个很迷的筛选方法,导致结果其实不是很准确,但是今天主题是画图,所以暂且不论。如果大家想练手, 我更推荐这个数据集,相对数据量更小列更全。
Rstudio包
library(maps)
library(ggplot2)
library(RColorBrewer)
library(tidyverse)
画地图
导入世界地图边界数据
world_map <- map_data("world")
前十行显示如下:
long lat group order region subregion
1 -69.899124 12.452002 1 1 Aruba NA
2 -69.895706 12.422998 1 2 Aruba NA
3 -69.942192 12.438525 1 3 Aruba NA
4 -70.004150 12.500488 1 4 Aruba NA
5 -70.066116 12.546972 1 5 Aruba NA
6 -70.050880 12.597070 1 6 Aruba NA
7 -70.035110 12.614111 1 7 Aruba NA
8 -69.973145 12.567627 1 8 Aruba NA
9 -69.911812