r语言安装包_面试|R语言面试问题集1-CSDN博客

本文链接：https://blog.csdn.net/weixin_39538607/article/details/111283935

本文整理了R语言面试中常见的问题，包括数据结构、数据导入、图形语法、RMarkdown用法、包安装、线性回归模型构建、数据插补、混淆矩阵、自定义函数、dplyr包函数、R6类创建、随机森林应用、Shiny介绍、apply函数族的优势以及数据挖掘包。通过这些问题，帮助R语言学习者和从业者准备面试，提升技能。

摘要由CSDN通过智能技术生成

编者按：【R语言面试问题集】是从网络上面收集和整理R的语言面试过程中基础的重要的问题集。通过这些问题的学习与解答，一来作为R语言知识掌握的检测，二来感受R语言在各方面的应用。您遇到什么R语言面试问题集？请给我留言。我创建了R语言微信群，定位是R语言学习与实践，需要入群的朋友，请添加我的微信：luqin360,备注：R语言入群。

以下是你需要准备的R语言面试问题和参考答案答案。这个文章涵盖了你在R的面试中可能会问到重要问题。这些R的面试问题将使你在数据分析市场中处于优势，在这个市场中，全球和当地的企业，无论大小，都在寻找具有R认证专业知识的专业人士。

R是一种编程语言，它可以像您希望的那样有用。它是您可以随意使用的工具，可以用于多种目的，如统计分析、数据可视化、数据操作、预测建模、预测分析等等。R被谷歌、Facebook和Twitter等顶级公司使用。

R语言面试问题集1

1 R中有哪些不同的数据结构?简要解释一下。

广义来说，这些数据结构在R中可用:

2 如何在R中加载.csv文件?

在R中加载.csv文件非常简单。
您只需使用“read.csv()”函数并指定文件的路径。

houseread.csv("C:/Users/John/Desktop/house.csv")

3 图形语法的不同组成部分是什么?

广义来说，这些是图形语法的不同组成部分:

数据层
美学层
几何层
面板层
坐标系统层
主题层

4 Rmarkdown是什么?它有什么用呢?

RMarkdown是R提供的一个报告工具，在RMarkdown的帮助下，您可以为R代码创建高质量的报告。
Rmarkdown的输出格式为:

HTML
PDF
WORD

5 如何在R中安装包?

下面的命令用于在R中安装包:

install.packages (“package_name >”)

让我们看一个例子。

6 在R中建立和评估线性回归模型的步骤是什么?

以下是建立线性回归模型时需要遵循的顺序步骤:
1 首先将数据划分为训练集和测试集，这一步非常重要，因为您将在训练集上构建模型并评估它在测试集上的性能。
您可以使用“catools”包中的sample.split()函数来实现这一点。这个函数提供了一个split-ratio选项，您可以根据需要指定该选项。

2 一旦您完成了将数据分解为训练集和测试集，您就可以继续在训练集上构建模型了。“lm()”函数用于构建模型。

3 最后，您可以使用“predict()”函数预测测试集中的值。

4 最后一步是计算RMSE, RMSE值越低，预测效果越好。

7 在R中列出一些可以用于数据插补的包?

这些是R中的一些包，可以用来进行数据插补

MICE
Amelia
missForest
Hmisc
Mi
imputeR

8 解释R中的混淆矩阵?

一个混淆矩阵可以用来评估所建立模型的准确性。它计算观察类和预测类的交叉列表。这可以使用“caTools”包中的“confusionmatrix()”函数来完成。

这里，我们创建了一个混淆矩阵，它给出了“实际”和“预测”值的列表。

9 如何在R中编写自定义函数?给一个例子。

这是在R中编写自定义函数的语法:

=function(x){

—

}

让我们看一个在R中创建自定义函数的例子

fun1function(x){ ifelse(x>5,100,0) } 
v1,2,3,4,5,6,7,8,9,10)
fun1(v)->v

10 列出“dplyr”包中可用的一些函数。

dplyr包可用函数:

filter
select
mutate
arrange
count

11 如何创建一个新的R6类?

我们必须首先创建一个对象模板，它由类中出现的“数据成员”和“类函数”组成。

一个R6对象模板由这些部分组成

类名
私有数据成员
公共成员函数

让我们通过代码来理解对象模板

上述代码由以下部分组成:

类名-“Employee”
私有数据成员——“名称”和“指定”
公共成员函数- " set_name() " & " set_design"

12 什么是随机森林?如何在R中构建和评估随机森林?

随机森林是一种使用多颗决策树模型的集成分类器。它结合了许多决策树模型的结果，这个结果通常比任何单个模型的结果都好。

我们将处理“birth”数据集，其中包括以下列:

让我们在此基础上建立一个随机森林模型来预测“smoke”列，即母亲是否吸烟。

我们先把数据分成训练和测试两部分

在训练集上建立随机森林模型

randomForest(smoke~.,birth)->mod1

现在，我们用模型来预测测试集

predict(mod1,test)->result

13 跟我说说shinyR吧。

shiny是一个R包，可以很容易地直接从R构建交互式web应用程序。您还可以使用CSS主题、htmlwidgets和JavaScript动作来扩展您的shiny应用程序。

14 在R中使用应用apply函数族有什么好处?

apply函数族允许我们对数据框和矩阵进行逐项更改。

R的用法如下:

apply(X, MARGIN, FUN, …)

这里
X是一个数组或矩阵

MARGIN是一个变量，它决定函数是应用于行(MARGIN=1)、列(MARGIN=2)，还是同时应用于行和列(MARGIN=c(1,2))

FUN是要应用的函数。

如果MARGIN=1，函数接受X的每一行作为向量参数，并返回结果的向量。同样，如果MARGIN=2，函数作用于X的列。最令人印象深刻的是，当MARGIN=c(1,2)时，函数作用于X的每一项。

优势:
使用apply函数，我们可以用一行命令编辑数据帧的每个条目。没有自动填充，没有浪费CPU周期。

15 在R中什么包用于数据挖掘?

R中用于数据挖掘的一些包:

data.table-提供快速读取大文件
rpart和caret-用于机器学习模型
Arules-用于关联规则
ggplot-用于数据可视化
tm-用户文本挖掘
forecast-用户时间序列分析

原文链接：

https://www.edureka.co/blog/interview-questions/r-interview-questions/

你若是觉得有用，清点赞并分享给其它朋友。更多数据知识，请点击阅读原文。您有任何问题，请留言。

内容推荐

视频|RStudio项目和版本控制
视频|我常用的R包
视频|R语言编码风格
视频|RMarkdown帮准您做数据报告