编者按:【R语言面试问题集】是从网络上面收集和整理R的语言面试过程中基础的重要的问题集。通过这些问题的学习与解答,一来作为R语言知识掌握的检测,二来感受R语言在各方面的应用。您遇到什么R语言面试问题集?请给我留言。我创建了R语言微信群,定位是R语言学习与实践,需要入群的朋友,请添加我的微信:luqin360,备注:R语言入群。
以下是你需要准备的R语言面试问题和参考答案答案。这个文章涵盖了你在R的面试中可能会问到重要问题。这些R的面试问题将使你在数据分析市场中处于优势,在这个市场中,全球和当地的企业,无论大小,都在寻找具有R认证专业知识的专业人士。
R是一种编程语言,它可以像您希望的那样有用。它是您可以随意使用的工具,可以用于多种目的,如统计分析、数据可视化、数据操作、预测建模、预测分析等等。R被谷歌、Facebook和Twitter等顶级公司使用。
R语言面试问题集1
1 R中有哪些不同的数据结构?简要解释一下。
广义来说,这些数据结构在R中可用:
![e7e7f952874bd8fa2d7b3e1e5554b26e.png](https://i-blog.csdnimg.cn/blog_migrate/0725bd7bbc07acc608fd7591db5df1c4.jpeg)
2 如何在R中加载.csv文件?
在R中加载.csv文件非常简单。
您只需使用“read.csv()”函数并指定文件的路径。
houseread.csv("C:/Users/John/Desktop/house.csv")
3 图形语法的不同组成部分是什么?
广义来说,这些是图形语法的不同组成部分:
数据层
美学层
几何层
面板层
坐标系统层
主题层
4 Rmarkdown是什么?它有什么用呢?
RMarkdown是R提供的一个报告工具,在RMarkdown的帮助下,您可以为R代码创建高质量的报告。
Rmarkdown的输出格式为:
HTML
PDF
WORD
5 如何在R中安装包?
下面的命令用于在R中安装包:
install.packages (“package_name >”)
让我们看一个例子。
![cde66862cef3f1ab4c6a0e2908d72181.png](https://i-blog.csdnimg.cn/blog_migrate/b54c0add9a517a8b72cc2798995fa900.jpeg)
6 在R中建立和评估线性回归模型的步骤是什么?
以下是建立线性回归模型时需要遵循的顺序步骤:
1 首先将数据划分为训练集和测试集,这一步非常重要,因为您将在训练集上构建模型并评估它在测试集上的性能。
您可以使用“catools”包中的sample.split()函数来实现这一点。这个函数提供了一个split-ratio选项,您可以根据需要指定该选项。
![a9c9dbc6f8065c75a8a1be57cdd7a5b1.png](https://i-blog.csdnimg.cn/blog_migrate/a8eb05b7798e473e289b331381005cdd.png)
2 一旦您完成了将数据分解为训练集和测试集,您就可以继续在训练集上构建模型了。“lm()”函数用于构建模型。
3 最后,您可以使用“predict()”函数预测测试集中的值。
![619ab08771959773d66f064e3eccb0e7.png](https://i-blog.csdnimg.cn/blog_migrate/5201726ad233c6fda0cef33c53ff29b0.png)
4 最后一步是计算RMSE, RMSE值越低,预测效果越好。
![5172b9298ffb8d9254db62d82ec71f18.png](https://i-blog.csdnimg.cn/blog_migrate/bcbc8c44e44bcae7e7577abd1bddbad4.png)
7 在R中列出一些可以用于数据插补的包?
这些是R中的一些包,可以用来进行数据插补
MICE
Amelia
missForest
Hmisc
Mi
imputeR
8 解释R中的混淆矩阵?
一个混淆矩阵可以用来评估所建立模型的准确性。它计算观察类和预测类的交叉列表。这可以使用“caTools”包中的“confusionmatrix()”函数来完成。
![f7061c92f2fed7f7f255d27b537b000f.png](https://i-blog.csdnimg.cn/blog_migrate/c803d1f01c03454d6473114495a1f3cb.jpeg)
这里,我们创建了一个混淆矩阵,它给出了“实际”和“预测”值的列表。
9 如何在R中编写自定义函数?给一个例子。
这是在R中编写自定义函数的语法:
=function(x){
—
—
—
}
让我们看一个在R中创建自定义函数的例子
fun1function(x){ ifelse(x>5,100,0) }
v1,2,3,4,5,6,7,8,9,10)
fun1(v)->v
10 列出“dplyr”包中可用的一些函数。
dplyr包可用函数:
filter
select
mutate
arrange
count
11 如何创建一个新的R6类?
我们必须首先创建一个对象模板,它由类中出现的“数据成员”和“类函数”组成。
一个R6对象模板由这些部分组成
类名
私有数据成员
公共成员函数
让我们通过代码来理解对象模板
![2f01ad48512bdc0645930fde5a9f8c00.png](https://i-blog.csdnimg.cn/blog_migrate/9d40ffec0e141902c560f7707d5eb197.jpeg)
上述代码由以下部分组成:
类名-“Employee”
私有数据成员——“名称”和“指定”
公共成员函数- " set_name() " & " set_design"
12 什么是随机森林?如何在R中构建和评估随机森林?
随机森林是一种使用多颗决策树模型的集成分类器。它结合了许多决策树模型的结果,这个结果通常比任何单个模型的结果都好。
我们将处理“birth”数据集,其中包括以下列:
![ec8007fc8ee61f8c902cd68beb336eb7.png](https://i-blog.csdnimg.cn/blog_migrate/354c99b826c90b8778a3bd186b2b1b7d.png)
让我们在此基础上建立一个随机森林模型来预测“smoke”列,即母亲是否吸烟。
我们先把数据分成训练和测试两部分
![c4374593fd6c25e7b6424e8e665daf2b.png](https://i-blog.csdnimg.cn/blog_migrate/280caf8d903fdd6a2dde8ccfd185cad6.png)
在训练集上建立随机森林模型
randomForest(smoke~.,birth)->mod1
现在,我们用模型来预测测试集
predict(mod1,test)->result
13 跟我说说shinyR吧。
shiny是一个R包,可以很容易地直接从R构建交互式web应用程序。您还可以使用CSS主题、htmlwidgets和JavaScript动作来扩展您的shiny应用程序。
14 在R中使用应用apply函数族有什么好处?
apply函数族允许我们对数据框和矩阵进行逐项更改。
R的用法如下:
apply(X, MARGIN, FUN, …)
这里
X是一个数组或矩阵
MARGIN是一个变量,它决定函数是应用于行(MARGIN=1)、列(MARGIN=2),还是同时应用于行和列(MARGIN=c(1,2))
FUN是要应用的函数。
如果MARGIN=1,函数接受X的每一行作为向量参数,并返回结果的向量。同样,如果MARGIN=2,函数作用于X的列。最令人印象深刻的是,当MARGIN=c(1,2)时,函数作用于X的每一项。
优势:
使用apply函数,我们可以用一行命令编辑数据帧的每个条目。没有自动填充,没有浪费CPU周期。
15 在R中什么包用于数据挖掘?
R中用于数据挖掘的一些包:
data.table-提供快速读取大文件
rpart和caret-用于机器学习模型
Arules-用于关联规则
ggplot-用于数据可视化
tm-用户文本挖掘
forecast-用户时间序列分析
原文链接:
https://www.edureka.co/blog/interview-questions/r-interview-questions/
你若是觉得有用,清点赞并分享给其它朋友。更多数据知识,请点击阅读原文。您有任何问题,请留言。
内容推荐
视频|RStudio项目和版本控制
视频|我常用的R包
视频|R语言编码风格
视频|RMarkdown帮准您做数据报告