library(readr);library(dplyr);library(ggplot2)
windowsFonts(STKaiti=windowsFont("华文楷体"))
athlete_events=read_csv("D:/Rdata/Windows/data/chap3/athlete_events.csv")
noc_regions=read_csv("D:/Rdata/Windows/data/chap3/noc_regions.csv")
#使用inner_join函数通过两数据集中的变量NOC将两个数据集合并
athletedata=inner_join(athlete_events,noc_regions[,1:3],by=c("NOC"="NOC"))
#athletedata=athlete_events
##查看每个地区参与奥运会运动员人数
plotdata=athletedata%>%group_by(region)%>% #按照region分组
summarise(number=n())%>% #计算每个region的参与人数
arrange(desc(number)) #将参与人数进行降序排列,得到新数据集
#可视化前30个人数多的地区参与人数
ggplot(plotdata[1:30,],aes(x=reorder(region,number),y=number))+
theme_bw(base_family="STKaiti")+
#使用数量映射条形图填充颜色aes(fill=number)
#show.legend = F不显示图例
#stat="identity"条形图统计特性为number的取值
#coord_flip翻转为水平条形图
#scale_fill_gradient设置填充映射颜色
geom_bar(aes(fill=number),stat = "identity",show.legend = F)+
coord_flip()+
scale_fill_gradient(low = "#56B1F7",high = "#132B43")+
labs(x="地区",y="运动员人数",title="不同地区奥运会运动员人数")+
theme(axis.text.x = element_text(vjust = 0.5),
plot.title = element_text(hjust = 0.5))
#region30=plotdata[1:30]
region30=athletedata%>%group_by(region)%>% #按照region分组
summarise(number=n())%>% #计算每个region的参与人数
arrange(desc(number)) #将参与人数进行降序排列,得到新数据集
region30=region30$region[1:30]
##不同性别人数最多的15个地区不同年份运动员人数变化
plotdata=athletedata[athletedata$region%in%region30[1:15],]%>%
group_by(region,Year,Sex)%>%
summarise(number=n())
ggplot(data = plotdata,aes(x=Year,y=region))+
theme_bw(base_family = "STKaiti")+
geom_tile(aes(fill=number),colour="white")+
#brewer.pal(10,"RdYlGn")将这种颜色切分为10份
scale_fill_gradientn(colours = rev(brewer.pal(10,"RdYlGn")))+
scale_x_continuous(breaks = unique(plotdata$Year))+
#将X轴标签旋转90°并居中
theme(axis.title.x = element_text(angle = 90,vjust = 0.5))+
#根据性别分图像为两行显示
facet_wrap(~Sex,nrow = 2)
R语言绘图初步2
最新推荐文章于 2024-09-05 06:00:00 发布