自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 R数据分析|可视化|dplyr|Kaggle奥运会数据集(二)

R数据分析|可视化|dplyr|Kaggle奥运会数据集(二)由于这个数据集较为庞大,想深入探究点东西,所以想缩小数据范围。那么我们就仅关注“男子球类运动”。这里用到的是grepl函数,其实筛选的是参与项目名里含“ball”的,所以可能有所错漏。这篇文章里的分析方法比较偏统计学,有涉及p值、假设检验、回归分析等等。中美男子球类运动员历届平均身高分别为 194.7 米、191.1 米;历届平均年 龄都为 24.7 岁。为比较两国该类项目男运动员历届身高、年龄的差异,引入 t 检验。计算得关于身高的 p 值

2020-07-30 17:25:21 937 1

原创 R数据分析|可视化|dplyr|Kaggle奥运会数据集(一)

研究1896年至2016年奥运会运动员的数据集,主要指标有身高、体重、年龄、国籍、参与项目、是否获得金/银/铜牌。通过运用R软件对数据作描述性统计、可视化分析。先了解数据集的基本信息,例如首次创办奥运的时间、比赛项目;再得到有关运动员的信息,例如人数、男女比例、身体指标;之后观察各国获奖牌数的情况;最后深入探索男子球类项目——如各国运动员身高体重年龄的差异、影响此类项目获奖牌数的重要因素等。

2020-07-21 21:58:02 1959

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除