R数据分析
文章平均质量分 77
borayolo
殊途同归
展开
-
R语言_rpart包和party包的简单比较
决策树模型是一种简单易用的非参数分类器。它不需要对数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强,不怕噪声数据和缺失数据。决策树模型的基本计算步骤如下:先从n个自变量中挑选一个,寻找最佳分割点,将数据划分为两组。针对分组后数据,将上述步骤重复下去,直到满足某种条件。在决策树建模中需要解决的重要问题有三个:如何选择自变量如何选择分割点确定停止划分的条件转载 2017-05-23 17:34:59 · 8319 阅读 · 0 评论 -
R语言_ggplot2 分面相关设置(facet)
分面设置在ggplot2应该也是要经常用到的一项画图内容,在数据对比以及分类显示上有着极为重要的作用,下面是两个经常要用到的分面函数。facet_wrap(facets, nrow = NULL, ncol = NULL, scales = "fixed", shrink = TRUE, as.table = TRUE, drop = TRUE)facet_grid(fac转载 2017-05-22 14:42:40 · 48143 阅读 · 2 评论 -
R语言_car_可视化
library(ggplot2)library(plyr)library(reshape2)#!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!#ggplot()不要分行写,都放在一行,要不然不好使!!!!!!!!!!!!!!!!#!!!!!!!!!!!!!!!!!!!!!!!!!vehicleshead(vehicles)colorscolors_原创 2017-05-22 16:49:48 · 1989 阅读 · 0 评论 -
R语言_缺失值问题
主要用到VIM和mice包[plain] view plain copyinstall.packages(c("VIM","mice")) 1.处理缺失值的步骤步骤:(1)识别缺失数据;(2)检查导致数据缺失的原因;(3)删除包含缺失值的实例或用合理的数值代替(插补)缺失值缺失值数据的分类:(1)完全转载 2017-06-07 20:26:09 · 1800 阅读 · 0 评论 -
R语言常用包分类总结
常用包:——数据处理:lubridata ,plyr ,reshape2,stringr,formatR,mcmc;——机器学习:nnet,rpart,tree,party,lars,boost,e1071,BayesTree,gafit,arules;——可视化包:ggplot2,lattice,googleVis;——地图包:ggmap,RgoogleMaps,rworldma转载 2017-06-15 17:04:04 · 6473 阅读 · 0 评论