命令介绍
导入csv文件时不想写路径,直接输入下面这行命令,然后ctrl+enter,直接跳出文件框自己选择相应文件就好,很方便!
read.csv(file.choose())
导出csv文件,一行命令
write.csv(data, file = "cit1.csv", row.names = FALSE)
包介绍
以下所有包都可以通过install.packages("包名字"),调用包直接library(包名字)
1.AER
发愁没有数据练手?AER包有各种有意思的数据集,比如2011年出轨调查数据集,银行薪水变化,美国航班数据等等等等,各种数据集,详情可见AER包介绍
2.Amelia
什么?你觉得缺失值看表格太麻烦?Amelia可以将缺失值可视化,且只需要两行代码
library(Amelia)
missmap(data,main = 'Missing Map',col=c('yellow','black'),legend=FALSE)
3.ggtheme
颜狗必备包,经济学人的统计图表
4.magrittr
%管道函数必备包
管道函数kaggle上很多选手都有用,长这样%>%,有种层层迭代的感觉,后来学习了下发现真的很方便,我翻译了一篇(不过文章有些长),有兴趣可以去瞄瞄翻译:用R语言进行数据清洗
5.dplyr
合并两个相似表
“dplyr专注接受dataframe对象, 大幅提高了速度,并且提供了更稳健的数据库接口”
这么说抽象了点,举个例子好了,比如A表B表唯一不同的是A表没有性别这一栏,我们可以将这两个表合并生成新的表,
如果你直接合并,抱歉,无法生成表~
data
train.row
test.row
只能变成这样
只有加了导入包library(dplyr)才能生成新的表~自动匹配的那种~
6.shiny
近期发现的新宠,也是在研究中,可以动态的展示图表,方便链接分析研究报告给其他人~~
其他用到再补充