【简说基因】R 语言数据集对于数据科学和统计学具有重要的作用,可以帮助提高数据分析和可视化能力、验证和改进统计模型和算法、促进社区合作和知识共享。
gapminder 数据集是 R 语言中的一个经典数据集,包含了世界各国在过去几十年里的人口、寿命和 GDP 等方面的数据,可以通过 gapminder 包来加载:
library(gapminder)
gapminder
## # A tibble: 1,704 x 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Afghanistan Asia 1952 28.8 8425333 779.
## 2 Afghanistan Asia 1957 30.3 9240934 821.
## 3 Afghanistan Asia 1962 32.0 10267083 853.
## 4 Afghanistan Asia 1967 34.0 11537966 836.
## 5 Afghanistan Asia 1972 36.1 13079460 740.
## 6 Afghanistan Asia 1977 38.4 14880372 786.
## 7 Afghanistan Asia 1982 39.9 12881816 978.
## 8 Afghanistan Asia 1987 40.8 13867957 852.
## 9 Afghanistan Asia 1992 41.7 16317921 649.
## 10 Afghanistan Asia 1997 41.8 22227415 635.
## # ... with 1,694 more rows
country:国家名称。
continent:所在洲别,包括非洲、亚洲、欧洲、美洲和大洋洲。
year:年份,从 1952 年到 2007 年,每隔 5 年记录一次。
lifeExp:平均寿命,单位为年。
pop:人口数量,单位为人。
gdpPercap:人均 GDP,单位为美元。
gapminder 数据集的目的是为了帮助人们更好地了解世界各国在不同时间段的经济和人口状况,以及这些变量之间的关系。通过对这个数据集进行可视化和探索性数据分析,可以帮助我们更好地理解世界各国的发展趋势和差异。
本文首发于公众号:简说基因,欢迎关注。