R语言题目及参考答案(2)

(2)使用 class()函数查看 date 的类型,并将其转化为 date 型,格式为 年/月/日。

在这里插入图片描述

(3)使用 subset()根据 ‘Temp’ 列获取 air 中 ‘Temp’ 大于 60 小于 70 的数据。

在这里插入图片描述

(4)将 air 中含有缺失值的列去掉。

在这里插入图片描述

(5)找出 ‘Temp’ 中大于 85 的值将其设置为缺失值。

在这里插入图片描述

(6)创建一个数据框 air1 包含两个列 q1,q2。用 cbind 函数添加到 air 中。

在这里插入图片描述

在这里插入图片描述

(7)使用 names() 函数查看 air 的列名,并根据列自己创建一个数据框。使用 rbind() 函数添加到 air 中

在这里插入图片描述

2.使用程序包DAAG中的数据集tinting,

在这里插入图片描述

在这里插入图片描述

(1)获得变量‘tint’和‘sex’的列联表;

在这里插入图片描述

(2)在同一图上作出变量 ‘sex’与‘tint’的联合柱状图;

在这里插入图片描述

在这里插入图片描述

(3) 作出‘age’和‘it’的散点图, 并进一步完成下面的操作:

i. 用lowess()函数作出拟合线;

在这里插入图片描述

在这里插入图片描述

ii. 在图的两个坐标轴上加上更细小的刻度;

在这里插入图片描述

在这里插入图片描述

iii. 在图的两个坐标轴上加上箱型图.

在这里插入图片描述

在这里插入图片描述

(4) 作出‘age’和‘it’关于因子变量‘tint’的条件散点图;

在这里插入图片描述

在这里插入图片描述

(5)作出‘age’和‘it’关于因子变量‘tint’和‘sex’的条件散点图;

在这里插入图片描述

在这里插入图片描述

(6)做出‘it’与‘csoa’的等高线图;

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(7)使用matplot( )描述变量‘age’,‘it’和‘csoa’.

在这里插入图片描述

在这里插入图片描述

  1. 一个复杂系统由100个相互独立的元件组成,在系统运行时每个元件损坏的概率为0.1,为使系统正常工作,至少必须有85个元件工作,求系统的可靠度(正常工作的概率)

在这里插入图片描述

  1. 考虑两个大的且相互独立的奶牛群。在牛群A中,假定牛奶产量服从平均产量为40磅、标准差为5磅的正态分布。牛群B服从产奶量平均值为36磅、标准差为8磅的正态分布。一位乳品科学家将大的产奶量定义为至少48磅。请问从哪个牛群中随机挑选母牛更有可能获得大产奶量?请提供用R语言分析本题的过程。

在这里插入图片描述

从B牛群中挑选更有可能获得更大产奶量。

所有题目的参考答案在我的资源里面—>>>R语言与统计性描述题目及参考答案

【作业】

1.1 我们以大马哈鱼为例。执行下列操作:

a.生成一些如下的人工数据:100个正态分布的随机数(即长度为100的向量),该正态分布满足均值为42.0以及标准差为6.3的条件。将该向量命名为‘weight’(即大马哈鱼的重量)并输出它的前25个值。

b.计算并输出‘weight’向量的均值、中位数、值域、标准差以及该向量的图基五数总括(Tukey’s five-number summary)。

c.生成一个‘weight’向量的直方图。要求直方图中的柱状体为蓝色,并且x轴对应的标签为‘Salmon Weight(lbs.)

d.生成‘weight’向量的箱线图。要求y轴对应的标签为‘Salmon Weight (lbs.)’,设置颜色为蓝色,看看会出现什么。

e.在你看来,操作c,d中对于‘weight’向量分别绘制的两种图,哪种图生成了更多信息?(不超过70字)

我觉得箱线图生成了更多的信息。从箱线图中可以看到数据的最值以及中位数和两个四分位数,而我们在直方图中仅仅可以看到数据的一个范围。

1.2 使用大马哈鱼的长度来估计它自身的重量

a.分别输入下列数据,将第一组数据命名为‘length1’的向量,第二组数据命名为‘weight1’。

Length (inches): 10 20 30 40 50 60

Weight (lbs): 0.4 2.4 9.5 21.0 38.7 74.0

b.使用散点图绘制数据。x轴对应标签为‘Length’,y轴为‘Weight’。

c.定性描述b中绘制的散点图的趋势。(不超过25个字)

weigh随length的增加而增加,指数递增。

d.使用散点图再绘制数据一次(本次要求对散点图中的自变量和因变量求对数。提示:对两个变量使用log()函数,且均放在plot()命令中作为参数)。

e.描述d中散点图的趋势(不超过25个字)

weight随着 length增长而增长,线性增长

1.3生成一个因子(类别)变量,其长度为100,分为5个因子水平(每个因子水平20个值)分别对应着以下5条河流:“Egegik” “Cinder” “Igushik” “Kvichak” “Meshik”

a.将因子变量命名为‘river’,并将‘river’与第1题中的‘weight’向量合并到一个命名为‘bristol.df’的数据框(data frame)中。使用rm()函数将‘river’和‘weight’变量移除。

b.将‘bristol.df’作为参数,调用summary()函数并输出结果。

c.将‘bristol.df’作为参数,调用str()函数并输出结果。

d.生成一个名为river的计数表。

e.为每条河流中大马哈鱼的重量数据绘制一个箱线图。

  1. 由命令

data(InsectSprays)

InsectSprays

得到数据集InsectSprays, 根据数据作出有意义的图, 并对数据作出描述

性统计.

  1. Felix是只喜欢捉老鼠的猫,它每天成功捕获至少一只老鼠的概率是0.6。假设他狩猎成功的概率每天都是独立的。我们仔细观察了他四天,请问Felix四天狩猎成功的概率为0.0256吗?请首先列出你动手计算的解题过程,再列出用R语言求解的过程。

捕获不到老鼠的概率为0.4,四次都没狩猎成功则为0.4的四次方,根据题意得到这四天内狩猎成功的概率为1-p(失败)

  1. 有绿色和红色两种硬币,已知绿色硬币正面朝上的概率为0.5,而红色硬币正面朝上的概率为0.8。请用R语言计算下列题目。

a. 绿色硬币独立掷两次,红色硬币独立掷两次。假设绿色和红色硬币的投掷事件彼此独立。请计算出两枚硬币正面朝上总数为3的概率。

b. 令X为投掷硬币4次的正面总数。求出X的概率分布。

c. 求X的期望和方差

最后

我可以将最近整理的前端面试题分享出来,其中包含HTML、CSS、JavaScript、服务端与网络、Vue、浏览器、数据结构与算法等等,还在持续整理更新中,希望大家都能找到心仪的工作。

篇幅有限,仅展示部分截图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值