r语言安装包_面试|R语言面试问题集1

本文整理了R语言面试中常见的问题,包括数据结构、数据导入、图形语法、RMarkdown用法、包安装、线性回归模型构建、数据插补、混淆矩阵、自定义函数、dplyr包函数、R6类创建、随机森林应用、Shiny介绍、apply函数族的优势以及数据挖掘包。通过这些问题,帮助R语言学习者和从业者准备面试,提升技能。
摘要由CSDN通过智能技术生成

编者按:【R语言面试问题集】是从网络上面收集和整理R的语言面试过程中基础的重要的问题集。通过这些问题的学习与解答,一来作为R语言知识掌握的检测,二来感受R语言在各方面的应用。您遇到什么R语言面试问题集?请给我留言。我创建了R语言微信群,定位是R语言学习与实践,需要入群的朋友,请添加我的微信:luqin360,备注:R语言入群。

以下是你需要准备的R语言面试问题和参考答案答案。这个文章涵盖了你在R的面试中可能会问到重要问题。这些R的面试问题将使你在数据分析市场中处于优势,在这个市场中,全球和当地的企业,无论大小,都在寻找具有R认证专业知识的专业人士。

R是一种编程语言,它可以像您希望的那样有用。它是您可以随意使用的工具,可以用于多种目的,如统计分析、数据可视化、数据操作、预测建模、预测分析等等。R被谷歌、Facebook和Twitter等顶级公司使用。

R语言面试问题集1

1 R中有哪些不同的数据结构?简要解释一下。

广义来说,这些数据结构在R中可用:

e7e7f952874bd8fa2d7b3e1e5554b26e.png
2 如何在R中加载.csv文件?

在R中加载.csv文件非常简单。
您只需使用“read.csv()”函数并指定文件的路径。

houseread.csv("C:/Users/John/Desktop/house.csv")
3 图形语法的不同组成部分是什么?

广义来说,这些是图形语法的不同组成部分:

  • 数据层

  • 美学层

  • 几何层

  • 面板层

  • 坐标系统层

  • 主题层

4 Rmarkdown是什么?它有什么用呢?

RMarkdown是R提供的一个报告工具,在RMarkdown的帮助下,您可以为R代码创建高质量的报告
Rmarkdown的输出格式为:

  • HTML

  • PDF

  • WORD

5 如何在R中安装包?

下面的命令用于在R中安装包:

install.packages (“package_name >”)

让我们看一个例子。

cde66862cef3f1ab4c6a0e2908d72181.png
6 在R中建立和评估线性回归模型的步骤是什么?

以下是建立线性回归模型时需要遵循的顺序步骤:
1 首先将数据划分为训练集和测试集,这一步非常重要,因为您将在训练集上构建模型并评估它在测试集上的性能。
您可以使用“catools”包中的sample.split()函数来实现这一点。这个函数提供了一个split-ratio选项,您可以根据需要指定该选项。

a9c9dbc6f8065c75a8a1be57cdd7a5b1.png

2 一旦您完成了将数据分解为训练集和测试集,您就可以继续在训练集上构建模型了。“lm()”函数用于构建模型。

459d309ed7329bf7712906f25ce8e7bd.png

3 最后,您可以使用“predict()”函数预测测试集中的值。

619ab08771959773d66f064e3eccb0e7.png

4 最后一步是计算RMSE, RMSE值越低,预测效果越好。

5172b9298ffb8d9254db62d82ec71f18.png
7 在R中列出一些可以用于数据插补的包?

这些是R中的一些包,可以用来进行数据插补

  • MICE

  • Amelia

  • missForest

  • Hmisc

  • Mi

  • imputeR

8 解释R中的混淆矩阵?

一个混淆矩阵可以用来评估所建立模型的准确性。它计算观察类和预测类的交叉列表。这可以使用“caTools”包中的“confusionmatrix()”函数来完成。

f7061c92f2fed7f7f255d27b537b000f.png

这里,我们创建了一个混淆矩阵,它给出了“实际”和“预测”值的列表。

9 如何在R中编写自定义函数?给一个例子。

这是在R中编写自定义函数的语法:

=function(x){

}

让我们看一个在R中创建自定义函数的例子

fun1function(x){ ifelse(x>5,100,0) } 
v1,2,3,4,5,6,7,8,9,10)
fun1(v)->v 
10 列出“dplyr”包中可用的一些函数。

dplyr包可用函数:

  • filter

  • select

  • mutate

  • arrange

  • count

11 如何创建一个新的R6类?

我们必须首先创建一个对象模板,它由类中出现的“数据成员”和“类函数”组成。

一个R6对象模板由这些部分组成

  • 类名

  • 私有数据成员

  • 公共成员函数

让我们通过代码来理解对象模板

2f01ad48512bdc0645930fde5a9f8c00.png

上述代码由以下部分组成:

  • 类名-“Employee”

  • 私有数据成员——“名称”和“指定”

  • 公共成员函数- " set_name() " & " set_design"

12 什么是随机森林?如何在R中构建和评估随机森林?

随机森林是一种使用多颗决策树模型的集成分类器。它结合了许多决策树模型的结果,这个结果通常比任何单个模型的结果都好。

我们将处理“birth”数据集,其中包括以下列:

ec8007fc8ee61f8c902cd68beb336eb7.png

让我们在此基础上建立一个随机森林模型来预测“smoke”列,即母亲是否吸烟。

我们先把数据分成训练和测试两部分

c4374593fd6c25e7b6424e8e665daf2b.png

在训练集上建立随机森林模型

randomForest(smoke~.,birth)->mod1

现在,我们用模型来预测测试集

predict(mod1,test)->result
13 跟我说说shinyR吧。

shiny是一个R包,可以很容易地直接从R构建交互式web应用程序。您还可以使用CSS主题、htmlwidgets和JavaScript动作来扩展您的shiny应用程序。

14 在R中使用应用apply函数族有什么好处?

apply函数族允许我们对数据框和矩阵进行逐项更改。

R的用法如下:

apply(X, MARGIN, FUN, …)

这里
X是一个数组或矩阵

MARGIN是一个变量,它决定函数是应用于行(MARGIN=1)、列(MARGIN=2),还是同时应用于行和列(MARGIN=c(1,2))

FUN是要应用的函数。

如果MARGIN=1,函数接受X的每一行作为向量参数,并返回结果的向量。同样,如果MARGIN=2,函数作用于X的列。最令人印象深刻的是,当MARGIN=c(1,2)时,函数作用于X的每一项。

优势:
使用apply函数,我们可以用一行命令编辑数据帧的每个条目。没有自动填充,没有浪费CPU周期。

15 在R中什么包用于数据挖掘?

R中用于数据挖掘的一些包:

  • data.table-提供快速读取大文件

  • rpart和caret-用于机器学习模型

  • Arules-用于关联规则

  • ggplot-用于数据可视化

  • tm-用户文本挖掘

  • forecast-用户时间序列分析

原文链接:

https://www.edureka.co/blog/interview-questions/r-interview-questions/

你若是觉得有用,清点赞并分享给其它朋友。更多数据知识,请点击阅读原文。您有任何问题,请留言。

内容推荐

  • 视频|RStudio项目和版本控制

  • 视频|我常用的R包

  • 视频|R语言编码风格

  • 视频|RMarkdown帮准您做数据报告

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值