- 博客(2)
- 收藏
- 关注
原创 R数据分析|可视化|dplyr|Kaggle奥运会数据集(二)
R数据分析|可视化|dplyr|Kaggle奥运会数据集(二)由于这个数据集较为庞大,想深入探究点东西,所以想缩小数据范围。那么我们就仅关注“男子球类运动”。这里用到的是grepl函数,其实筛选的是参与项目名里含“ball”的,所以可能有所错漏。这篇文章里的分析方法比较偏统计学,有涉及p值、假设检验、回归分析等等。中美男子球类运动员历届平均身高分别为 194.7 米、191.1 米;历届平均年 龄都为 24.7 岁。为比较两国该类项目男运动员历届身高、年龄的差异,引入 t 检验。计算得关于身高的 p 值
2020-07-30 17:25:21 939 1
原创 R数据分析|可视化|dplyr|Kaggle奥运会数据集(一)
研究1896年至2016年奥运会运动员的数据集,主要指标有身高、体重、年龄、国籍、参与项目、是否获得金/银/铜牌。通过运用R软件对数据作描述性统计、可视化分析。先了解数据集的基本信息,例如首次创办奥运的时间、比赛项目;再得到有关运动员的信息,例如人数、男女比例、身体指标;之后观察各国获奖牌数的情况;最后深入探索男子球类项目——如各国运动员身高体重年龄的差异、影响此类项目获奖牌数的重要因素等。
2020-07-21 21:58:02 1970
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人