自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

转载 交叉验证

  交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。     那么什么时候才需要交叉验证呢?交叉验证用在数据不是很充足的时候...

2018-02-15 12:00:00 196

转载 R语言-缺失值判断以及处理

#####缺失值判断以及处理######举例1:向量类型判断缺失值is.na和缺失值的填补which(x<-c(1,2,3,NA))is.na(x) #返回一个逻辑向量,TRUE为缺失值,FALSE为非缺失值table(is.na(x)) #统计分类个数sum(x) #当向量存在缺失值的时候统计结果也是缺失值sum(x,na....

2018-02-05 11:38:00 3530

转载 R语言实战学习总结

总的来说,这边书涵盖了很多R语言的知识,但是内容编排的比较琐碎,很难将整本书的各个章节串起来,如果将它作为一本R语言的知识字典还是非常的不错。该本书主要涵盖了以下内容,但是并没有对这些内容进行深入的探讨。接下来需要完成的事情需要将R检测函数的输出结果进行深入了解结合现实中的案例实践本书的内容R语言编程知识基本的数据结构:向量,列表,矩阵,数组,数据框R...

2017-11-26 15:23:00 360

转载 R语言学习笔记(十七):高级绘图ggplot2

#ggplot2library(ggplot2)#散点图ggplot(data=mtcars,aes(x=wt,y=mpg))+geom_point()+labs(title="Automation Data",x="Weight",y="Miles Per Gallon")#散点图+回归曲线ggplot(data=mtcars,aes(x=wt,y=...

2017-11-12 19:11:00 453

转载 R语言学习笔记(十六):处理缺失值

#识别缺失值install.packages("VIM")data(sleep,package="VIM")#列出没有缺失值的行sleep[complete.cases(sleep),]#列出有一个或多个缺失值的行sleep[!complete.cases(sleep),]#有多少个缺失值sum(is.na(sleep$Dream))...

2017-11-10 12:43:00 573

转载 R语言学习笔记(十五):分类

#数据准备loc<-"https://archive.ics.uci.edu/ml/machine-learning-databases/"ds<-"breast-cancer-wisconsin/breast-cancer-wisconsin.data"url<-paste(loc,ds,sep="")breast<-read.table...

2017-11-08 18:06:00 682

转载 R语言学习笔记(十四):聚类分析

#聚类分析par(mfrow=c(1,1))#计算距离install.packages("flexclust")data(nutrient,package="flexclust")head(nutrient,4) energy protein fat calcium ironbeef braised 340 20 28 9 2....

2017-11-05 21:45:00 735

转载 R语言学习笔记(十三):时间序列

#生成时间序列对象sales<-c(18,33,41,7,34,35,24,25,24,21,25,20,22,31,40,29,25,21,22,54,31,25,26,35)tsales<-ts(sales,start=c(2003,1),frequency = 12)tsales Jan Feb Mar Apr May Jun Jul A...

2017-11-05 15:12:00 959

转载 R语言学习笔记(十二):主成分分析和因子分析

#主成分分析par(mfrow=(c(1,1)))library(psych)head(USJudgeRatings,5)head(USJudgeRatings[,-1],5)fa.parallel(USJudgeRatings[,-1],fa="pc",n.iter=100,show.legend = FALSE,main="Scree plot with ...

2017-10-31 20:45:00 988

转载 R语言学习笔记(十一):广义线性模型

#Logistic 回归install.packages("AER")data(Affairs,package="AER")summary(Affairs) affairs gender age yearsmarried children Min. : 0.000 female:315 Min. :17.50 Min. : 0.125 n...

2017-10-31 13:16:00 786

转载 R语言学习笔记(十):重抽样与自助法

#置换实验 Coin包install.packages(c("coin"))#lmPerm包install.packages("lmPerm")#独立两样本和K样本检验library(coin)score<-c(40,57,45,55,58,57,64,55,62,65)treatment<-factor(c(rep("A",5),...

2017-10-26 15:08:00 1106

转载 R语言学习笔记(九):中级绘图

散点图attach(mtcars)plot(wt,mpg,main="Basic Scatter plot of MPG vs. Weight", xlab="Car Weight (lbs/1000)", ylab="Miles Per Gallon",pch=19)abline(lm(mpg~wt),col="red",lwd=2,...

2017-10-26 14:32:00 294

转载 R语言学习笔记(八):功效分析

T检测 #计算期望的样本大小install.packages("pwr")library(pwr)pwr.t.test(d=.8,sig.level=.05,power=.9,type="two.sample")Two-sample t test power calculation n = 33.82555 #样本大小 d = 0...

2017-10-26 11:57:00 336

转载 R语言与显著性检验学习笔记

一、何为显著性检验 显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一次检验中没有发生。 显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。 常把一个要检验的假设记作H0,称为原假设(或零假设),与H0...

2017-10-26 11:04:00 910

转载 R语言学习笔记(六):OLS回归

OSL回归简单的线性回归> fit<-lm(weight~height,women)> summary(fit)Call:lm(formula = weight ~ height, data = women)Residuals:Min 1Q Median 3Q Max -1.7333 -1.1333 -0.3833 0.741...

2017-10-24 17:20:00 1399

转载 R语言学习笔记(七):方差分析

单因素方程分析install.packages("multcomp")library(multcomp)attach(cholesterol)table(trt)aggregate(response, by=list(trt),FUN=mean)aggregate(response, by=list(trt),FUN=sd)fit<...

2017-10-24 17:18:00 513

转载 R语言数据集合

mtcarsR的内置数据集mtcars 记录了32种不同品牌的轿车的的11个属性,如下:[, 1]mpgMiles/(US) gallon[, 2]cylNumber of cylinders[, 3]dispDisplacement (cu.in.)[, 4]hpGross horsepower[, 5]dratRear axle ratio[, 6]wtWeight (lb/1000...

2017-10-02 17:11:00 266

转载 常用统计指标

方差 sd斜率 cor简介 summary数据抽样 sample正态分布测试数据 runifscalescale函数是将一组数进行处理,默认情况下是将一组数的每个数都减去这组数的平均值后再除以这组数的均方根。其中有两个参数,center=TRUE,默认的,是将一组数中每个数减去平均值,若为false,则不减...

2017-09-25 16:05:00 222

转载 R语言学习笔记(五)

总结下第七章的统计分析方法,里面涉及到了很多统计专业概念。 Summary 函数> myvars<-c("mpg","hp","wt")> summary(mtcars[myvars]) mpg hp wt Min. :10.40 Min. : 52.0 Min. :1....

2017-09-25 16:05:00 622

转载 R语言学习笔记(四)

R语言支持很多图形,并且有些图形是非常少见的,可能也因为自己不是专业弄数据分析的所以就孤陋寡闻了,总结下目前学习到的图形。条形图这个图比较常见,很多数据统计软件都支持这种图形,这种图形可以很好的展示数据的汇总结果,可以简洁明了的方式表达数据背后的含义> library(vcd)> counts<-table(Arthritis$Improve...

2017-09-25 16:04:00 776

转载 R语言学习笔记(三)

第四,五章学习总结,这两章主要讲解了R语言的系统函数,例如怎么把缺失值剔除,数据类型的识别和转换,数据集的合并,怎么使用SQL库,函数以及R程序的顺序,选择和循环的实现方式。缺失值> manager <- c(1,2,3,4,5)> date<-c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")>...

2017-09-25 16:03:00 883

转载 R语言学习笔记(二)

第一章 R语言介绍读取,设置当前工作区setwd("E:\\Desktop\\R Language\\R") getwd()特殊显示格式> options(digits=3) #显示小数点后三位> x<-runif(20) ?> x [1] 0.329 0.499 0.360 0.922 0.733 0.969 0.840 0.484 0.386 0....

2017-09-25 16:01:00 513

转载 R语言学习笔记(一)

今天把之前看的Head First Data Analysis中的R语言练习过来一遍,感觉R语言还是挺有意思的,它支持一些非常专业的统计库,例如用它来计算方差,斜率什么的都很简洁,特别是一张用R生成的分组散点图,效果非常的赞。但是这些生成的图片并不能像Excel中的图标一样支持数据钻取,希望后续的学习能解答我现在的这些疑惑。 加载统计文件R Source File...

2017-09-25 15:59:00 259

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除