(2)使用 class()函数查看 date 的类型,并将其转化为 date 型,格式为 年/月/日。
(3)使用 subset()根据 ‘Temp’ 列获取 air 中 ‘Temp’ 大于 60 小于 70 的数据。
(4)将 air 中含有缺失值的列去掉。
(5)找出 ‘Temp’ 中大于 85 的值将其设置为缺失值。
(6)创建一个数据框 air1 包含两个列 q1,q2。用 cbind 函数添加到 air 中。
(7)使用 names() 函数查看 air 的列名,并根据列自己创建一个数据框。使用 rbind() 函数添加到 air 中
2.使用程序包DAAG中的数据集tinting,
(1)获得变量‘tint’和‘sex’的列联表;
(2)在同一图上作出变量 ‘sex’与‘tint’的联合柱状图;
(3) 作出‘age’和‘it’的散点图, 并进一步完成下面的操作:
i. 用lowess()函数作出拟合线;
ii. 在图的两个坐标轴上加上更细小的刻度;
iii. 在图的两个坐标轴上加上箱型图.
(4) 作出‘age’和‘it’关于因子变量‘tint’的条件散点图;
(5)作出‘age’和‘it’关于因子变量‘tint’和‘sex’的条件散点图;
(6)做出‘it’与‘csoa’的等高线图;
(7)使用matplot( )描述变量‘age’,‘it’和‘csoa’.
- 一个复杂系统由100个相互独立的元件组成,在系统运行时每个元件损坏的概率为0.1,为使系统正常工作,至少必须有85个元件工作,求系统的可靠度(正常工作的概率)
- 考虑两个大的且相互独立的奶牛群。在牛群A中,假定牛奶产量服从平均产量为40磅、标准差为5磅的正态分布。牛群B服从产奶量平均值为36磅、标准差为8磅的正态分布。一位乳品科学家将大的产奶量定义为至少48磅。请问从哪个牛群中随机挑选母牛更有可能获得大产奶量?请提供用R语言分析本题的过程。
、
从B牛群中挑选更有可能获得更大产奶量。
所有题目的参考答案在我的资源里面—>>>R语言与统计性描述题目及参考答案
【作业】
1.1 我们以大马哈鱼为例。执行下列操作:
a.生成一些如下的人工数据:100个正态分布的随机数(即长度为100的向量),该正态分布满足均值为42.0以及标准差为6.3的条件。将该向量命名为‘weight’(即大马哈鱼的重量)并输出它的前25个值。
b.计算并输出‘weight’向量的均值、中位数、值域、标准差以及该向量的图基五数总括(Tukey’s five-number summary)。
c.生成一个‘weight’向量的直方图。要求直方图中的柱状体为蓝色,并且x轴对应的标签为‘Salmon Weight(lbs.)
d.生成‘weight’向量的箱线图。要求y轴对应的标签为‘Salmon Weight (lbs.)’,设置颜色为蓝色,看看会出现什么。
e.在你看来,操作c,d中对于‘weight’向量分别绘制的两种图,哪种图生成了更多信息?(不超过70字)
我觉得箱线图生成了更多的信息。从箱线图中可以看到数据的最值以及中位数和两个四分位数,而我们在直方图中仅仅可以看到数据的一个范围。
1.2 使用大马哈鱼的长度来估计它自身的重量
a.分别输入下列数据,将第一组数据命名为‘length1’的向量,第二组数据命名为‘weight1’。
Length (inches): 10 20 30 40 50 60
Weight (lbs): 0.4 2.4 9.5 21.0 38.7 74.0
b.使用散点图绘制数据。x轴对应标签为‘Length’,y轴为‘Weight’。
c.定性描述b中绘制的散点图的趋势。(不超过25个字)
weigh随length的增加而增加,指数递增。
d.使用散点图再绘制数据一次(本次要求对散点图中的自变量和因变量求对数。提示:对两个变量使用log()函数,且均放在plot()命令中作为参数)。
e.描述d中散点图的趋势(不超过25个字)
weight随着 length增长而增长,线性增长
1.3生成一个因子(类别)变量,其长度为100,分为5个因子水平(每个因子水平20个值)分别对应着以下5条河流:“Egegik” “Cinder” “Igushik” “Kvichak” “Meshik”
a.将因子变量命名为‘river’,并将‘river’与第1题中的‘weight’向量合并到一个命名为‘bristol.df’的数据框(data frame)中。使用rm()函数将‘river’和‘weight’变量移除。
b.将‘bristol.df’作为参数,调用summary()函数并输出结果。
c.将‘bristol.df’作为参数,调用str()函数并输出结果。
d.生成一个名为river的计数表。
e.为每条河流中大马哈鱼的重量数据绘制一个箱线图。
- 由命令
data(InsectSprays)
InsectSprays
得到数据集InsectSprays, 根据数据作出有意义的图, 并对数据作出描述
性统计.
- Felix是只喜欢捉老鼠的猫,它每天成功捕获至少一只老鼠的概率是0.6。假设他狩猎成功的概率每天都是独立的。我们仔细观察了他四天,请问Felix四天狩猎成功的概率为0.0256吗?请首先列出你动手计算的解题过程,再列出用R语言求解的过程。
捕获不到老鼠的概率为0.4,四次都没狩猎成功则为0.4的四次方,根据题意得到这四天内狩猎成功的概率为1-p(失败)
- 有绿色和红色两种硬币,已知绿色硬币正面朝上的概率为0.5,而红色硬币正面朝上的概率为0.8。请用R语言计算下列题目。
a. 绿色硬币独立掷两次,红色硬币独立掷两次。假设绿色和红色硬币的投掷事件彼此独立。请计算出两枚硬币正面朝上总数为3的概率。
b. 令X为投掷硬币4次的正面总数。求出X的概率分布。
c. 求X的期望和方差
最后
我可以将最近整理的前端面试题分享出来,其中包含HTML、CSS、JavaScript、服务端与网络、Vue、浏览器、数据结构与算法等等,还在持续整理更新中,希望大家都能找到心仪的工作。
篇幅有限,仅展示部分截图: