【第22期】观点:IT 行业加班,到底有没有价值?

R语言实战之基本统计分析

原创 2016年05月31日 12:57:23

数据样本

这里写图片描述

列联表
以列表方式表示两个(或多个)变量或属性共同出现的频率。 或者是将两个属性变量的不同取值置于行和列的位置,在表格中填入变量组合取值的频数的表格。
这里写图片描述

#描述性统计Fenix
summary(stock)  #最小值,最大值,中位数。平均值,四分位数
# sapply(stock, FUN = ,options)
fivenum() #图基五数
# library(Hmisc)
# describe(stock)
library(pastecs)
library(boot)
stat.desc(stock)
library(psych)  #describe(stock)
stock=read.csv('hs_stock.csv')
#分组计算描述性统计量
var_names=names(stock)[2:7]
agg_mean=aggregate(stock[var_names],by=list(mean=stokc$code),mean)
agg_sd=aggregate(stock[var_names],by=list(mean=stokc$code),sd)

mystats<-function(x,na.omit=FALSE){
  if (na.omit)
    x<-x[!is.na()]
  m<-mean(x)
  s<-sd(x)
  n<-length(x)
  skew<-sum((x-m)^3/s^3)/n
  kurt<-sum((x-m)^3/s^4)/n-3
  q<-quantile(x,c(.6))
  return(c(n=n,mena=m,stdev=s,q6=q,skew=skew,kurtosis=kurt))
}

#一维列联表

mytable=with(data,table(Improved))

prop.table(mytable)
#二维列联表
xtabs(~Sex+Improved,data=data)
margin.table(myta,1)
#下标1指代table语句中的第一个变量
prop.table(myta,1)

#R语言的相关系数包括Pearson/Spearman,Kendall,ploychoric,polyserial
cor(stock[,c(2:15)],method='spearman')
#偏相关是指控制一个或者多个定量变量时,另外两个定量变量的先关关系
pcor()

#相关性的显著性检验  use='pairwise'or 'complete'(分别表示对缺失值执行删除或者行删除
library(psych)
corr.test(stock[,c(2:15)])

相关性
这里写图片描述
相关性的显著性检验

这里写图片描述

这里写图片描述

版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

R语言实战笔记--第六&七章 统计图形介绍及基本统计方法

R语言实战笔记–第六&七章 统计图形介绍及基本统计方法标签(空格分隔): R语言 箱线图 直方图 t检验 Kruskal-Wallis检验 Friedman检验  R语言实战的第六章和第七章介绍了一些...

R语言的基本统计分析

描述性统计分析
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)