![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R 学习
文章平均质量分 53
scpcmoon
这个作者很懒,什么都没留下…
展开
-
[转]R 模型评估
1、决定系数--复相关系数__R、决定系数__R方、校正决定系数__校正R方 A、复相关系数__R: 指的是多元回归系数,表示模型中y值与估计y值之间的相关系数,实际上是皮尔逊相关。 R取值范围是[ 0,1 ],没有负值。R越大表明模型越好。但是R值多大算是最好,并没有定论,通常在社会学科中,R>0.4就算是足够好了;但是在科学领域,R>...转载 2018-06-03 08:22:13 · 862 阅读 · 0 评论 -
目录 R 学习
数据处理1、[转] R 1 常用操作 https://blog.csdn.net/scpcmoon/article/details/80523153 数据生成、常用运算、文件操作、数据库连接2、[转] R 2 数据观察 https://blog.csdn.net/scpcmoon/article/details/80604619 主体查看、数据查看、分布情况、统计量、贡献度...转载 2018-06-09 16:52:25 · 137 阅读 · 0 评论 -
[转] R 函数
# 知识来源于网络,仅供交流使用,如有侵权请及时联系予以删除str_extract_all() # 字符提取,按照指定规则 x<-"abacdef123456789g" str_extract_all(x,"[adef0-9]{2,5}") # 按照给定的[字符]提取出来,且提取出的各个字符串,最少1个字符,最多5个字符separate() # 字符...转载 2018-06-16 15:14:11 · 323 阅读 · 0 评论 -
[转] R 4 字符串处理
# 数据准备x<-c("abcd","abcdef","good")x1<-"gabcde"y<-"好好"z<-"学习"z1<-"天天向上"# 1、查询函数nchar(x1) # 字符串的长度,即有几个字符nchar(x) # 字符串向量中,每个字符串的长度length(x)转载 2018-06-07 15:35:58 · 163 阅读 · 0 评论 -
[转] R 数据框数据处理
1、书本基本数据管理实操练习1.1生成一个数据框示例manager <- c(1,2,3,4,5)date <- c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")country <- c("US","US","UK","UK"转载 2018-05-31 16:41:21 · 502 阅读 · 0 评论 -
[转] R自带数据包
原文地址:R语言系列:datasets(R自带数据包)作者:老虎牛向量euro #欧元汇率,长度为11,每个元素都有命名landmasses #48个陆地的面积,每个都有命名precip #长度为70的命名向量rivers #北美141条河流长度state.abb #美国50个州的双字母缩写state.area #美国50个州的面积state.name #...转载 2018-05-31 16:17:06 · 4038 阅读 · 0 评论 -
[转] R 待定操作
释放包 detach(package:packge-name) 并行运算设置library(doParallel)cl <- makeCluster(15)registerDoParallel(cl)报错空间溢出:Java heap space,需要设置运行内存library(rJava).jinit(parameters="-Xmx7888m")...转载 2018-05-31 16:01:17 · 147 阅读 · 0 评论 -
[转] R 3 数据处理
常规数据查看data(data) #加载数据集data head(data) #显示数据集data的前若干条数据 tail(data) #显示数据集data的后若干条数据 class(data) #查看对象类型 str(data) #探寻数据集内部结构 summary(data) #获取数据集data的概括信息 dim(dat...转载 2018-05-31 16:02:34 · 198 阅读 · 0 评论 -
[转] R 2 数据观察
# 1、主体查看 class(data) #查看对象类型 str(data) #探寻数据集内部结构 summary(data) #获取数据集data的概括信息 dim(data) #查看数据集data的纪录数和维度数 nrow(data) #查看行数 ncol(data) #查看列数 length(data) #查看列...转载 2018-06-07 09:55:36 · 396 阅读 · 0 评论 -
[转] 大数据比赛题目
原文:https://www.sohu.com/a/203479583_486129赛题一:登录行为识别参赛者要根据用户登录的种种蛛丝马迹,预测交易是否有风险。估计优胜者的答案,足以让全网用户沸腾吧?毕竟,网购登录关乎每个人的账户安全。感谢大数据时代,风控技术不断升级,让我们可以在享受乐趣的同时,享受科技的保驾护航。赛题二:店铺销量预测这道赛题,要求参赛者对店铺开展贷款业务和经营状况等数据进行定量...转载 2018-06-13 16:38:47 · 5119 阅读 · 0 评论 -
[转] AI智能 比赛题目
原文:http://2018.njai.org.cn/#/solve转载 2018-06-13 16:38:41 · 1584 阅读 · 0 评论 -
[转] R 解读逻辑回归结果:回归系数,OR
原文地址:深入解读Logistic回归结果(一):回归系数,OR作者:王江源转文地址https://blog.csdn.net/sjpljr/article/details/70169046 作者:sjpljr我想说,你们真是太厉害了!Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。 一 从线性回归到Logistic...转载 2018-06-05 17:25:10 · 23857 阅读 · 1 评论 -
[转] R ggplot2包介绍学习
原文地址:https://www.cnblogs.com/nxld/p/6059603.html分析数据要做的第一件事情,就是观察它。对于每个变量,哪些值是最常见的?值域是大是小?是否有异常观测?ggplot2图形之基本语法:ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离ggplot2是按图层作图ggplot2保有命令式作图的调整函数,使其更具灵活性ggplot2将...转载 2018-06-12 13:39:05 · 5021 阅读 · 0 评论 -
[转] R 逐步回归分析 AIC信息统计量
逐步回归分析是以AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到删除或增加变量的目的。R语言中用于逐步回归分析的函数 step() drop1() add1()#1.载入数据 首先对数据进行多元线性回归分析tdata<-data.frame( x1=c( 7, 1,11,11, 7,11, 3, 1, 2,21, 1,11,10), x2=c(26,29,...转载 2018-06-04 13:37:11 · 11968 阅读 · 0 评论 -
[转] R 提升预测模型的方法
1.改善数据(能否获得更多的数据、能否创造更多的数据、清洗数据、重新采样、重新界定问题、重新缩放、转化数据、数据映射或降维、特征选择、特征工程)2.改善算法(重采样、评价指标、基线性能、标准参数设置)3.改善参数(诊断(学习曲线,overfitting or underfitting)、随机搜索、网格搜索、算法定制)4.模型融合(bagging、boosting、 stacked generali...转载 2018-06-04 08:40:13 · 631 阅读 · 0 评论 -
[转] R中常用数据挖掘算法包
数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:连续因变量的预测:stats包 lm函数,实现多元线性回归stats包 glm函数,实现广义线性回归stats包 nls函数,实现非线性最小二乘回归rpa...转载 2018-06-04 08:36:44 · 481 阅读 · 0 评论 -
[转] R 1 常用操作
查看目录及更改目录getwd() #查看工作目录setwd("E:/") #改变工作目录安装及释放包install.packages("packge-name") #安装包library(packge-name) #安装包删除R软件运行时保存在内存中的所有对象rm(list=ls(all=TRUE)) 加载数据集data data(data)...转载 2018-05-31 16:02:42 · 329 阅读 · 0 评论 -
[转] R 绘图ggplot2 一页多图及子图嵌入主图的多种实现方法
原文:https://mp.weixin.qq.com/s/tHbasjxsKbbnaIn7nP2D4g一、一面多图的实现方法:- 输入:minute <- c(110,118,120,123,131,137,144,149,152,160)VC <- c(5283,5299,5358,5292,5602,6014,5830,6102,6075,6411)lrdata <- ...转载 2018-06-18 09:34:23 · 19077 阅读 · 0 评论