文章目录
从内置数据集获取数据
- 内置数据集存在于各个包中
- 基本包
datasets
中包含各个领域的100多个数据集,可使用data()
函数进行查看
data(package="datasets")
- 调用数据集到工作空间:
data(数据集名称)
- 查看数据集的帮助:
help(数据集名称)
- 调用不在内存之中包的数据集时,需要先加载该包到内存之中
# e.g.
> library(MASS)
> data(package="MASS")
> data(bacteria)
> bacteria
模拟特定分布的数据
- 一系列以r开头的函数,模拟生成1个各元素服从特定分布的向量
函数 | 解释 |
---|---|
rnorm(n= ,mean= ,sd= ) |
正态分布,给出元素个数、均值和标准差 |
runif(n= ,min= ,max= ) |
均匀分布,给出元素个数、最小值、最大值 |
rbinom(n= ,size= ,prob= ) |
二项分布,给出观察次数、试验次数、发生概率 |
rpois(n= ,lambda= ) |
泊松分布,给出元素个数、λ值 |
对rbinom()
的特殊说明:rbinom(n=N,size=SIZE,prob=PROB)
表示进行SIZE
次独立重复试验,每次出现阳性结果概率为PROB
,记录这SIZE
次独立重复实验中出现阳性结果的次数;将这种记录重复N
次,得到一个N维列向量。
获取其他格式的数据来源的数据
需要将这些来源的数据先放到工作目录下。
txt与csv
read.table()
用于从txt文件中读取数据