奥林匹克运动会发源于两千多年前的古希腊,因举办地在奥林匹亚而得名。并于1896年举办了首届奥运会,1924年举办了首届冬奥会,是世界上影响力最大的体育盛会。
本数据集来自于作者Randi H Griffin,于2018年5月从www.sports-reference.com上爬取。包含271116行和15列,每一行代表一个运动员参加的一项奥运比赛。
1.ID - Unique number for each athlete
2.Name - Athlete’s name
3.Sex - M or F
4.Age - Integer
5.Height - In centimeters
6.Weight - In kilograms
7.Team - Team name
8.NOC - National Olympic Committee 3-letter code
9.Games - Year and season
10.Year - Integer
11.Season - Summer or Winter
12.City - Host city
13.Sport - Sport
14.Event - Event
15.Medal - Gold, Silver, Bronze, or NA
需要注意的是,冬季奥运会和夏季奥运会从1994年起分开,每两年间隔举行,1992年冬季奥运会是最后一届与夏季奥运会同年举行的冬奥会。自1924年开始第1届,截至2018年共举办了23届,每四年一届。
Questions:
1.历届奥运会男女运动员人数情况
2.奥运项目的数目变化
3.参加历届奥运会的国家和地区与奥运会的举办城市情况
4.120年来获得奥运奖牌数最多的十个国家
5.中国在历届奥运会中的参与情况与获奖情况
工具:Navicat、power BI
导入数据,通过查询发现Age、Height 、Weight和Medal 存在NA值&