数据处理之卡方检验

最新推荐文章于 2023-01-08 18:30:17 发布

eTionSean

最新推荐文章于 2023-01-08 18:30:17 发布

阅读量6.2k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eTionSean/article/details/79027903

版权

题型以及解法：

1.描绘图形，概率密度分布，集中趋势等， ——绘图函数

2.不同基因型在不同人群中是否存在显著差异 ——卡方独立性检验

3.不同变量之间的关联程度 ——多元线性回归分析

4.因变量为二分类变量时（是否，10），想要知道各个自变量影响大小，所占权重多少——Logistic回归分析

5.拟合探索自变量因变量关系 ——局部多项式回归

6.不知道总体分布，或不为正态分布时 ——非参数统计，Wilcoxon符号秩和检验(配对变量）：Kruskal-Wallis H检验（多组变量时）：

基础概率密度分布问题

dbinom(x, size, prob)#该函数给出了每个点的概率密度分布。

pbinom(x, size, prob)#该函数给出事件的累积概率，它用于表示概率的单个值。

x - 是数字的向量，size -是试验的次数，prob -是每次试验成功的概率

中心极限定理的验证：

对下面三种图进行对比分析和讨论。

#随机抽样 1 次

png(file = "gds4794-hist-sample1.png")

hist(a[sample(a, 100)], freq = F, breaks = 100)

dev.off()

#重复抽样 100次

png(file = "gds4794-hist-sample100.png")

x <- replicate(100, sample(a, size=100, replace = FALSE))

hist(x, freq = F, breaks = 100)

dev.off()

#重复抽样 100次, 绘制均值分布图

png(file = "gds4794-hist-sample100-mean.png")

x<-replicate(100, mean(a[sample(a, 100)]))

hist(x, freq = F, breaks = 100)

dev.off()

计算各种统计指标并绘制统计图：

x1<-min(a,na.rm=TRUE) # 计算最小值

x2<-max(a,na.rm=TRUE) # 计算最大值

ave<-mean(a,na.rm=TRUE) # 计算均值

med<-median(a,na.rm=TRUE) # 计算中位数

# 连续分布的众数定义为其分布的密度函数峰值对应的取值

ds=density(a,na.rm=TRUE)

mode <- ds$x[which.max(ds$y)]

quan<-quantile(a,na.rm=TRUE) # 计算四分位数 (0%,25%,50%,75%,100%)

dnorm_png<-png(" ") # 定义图片文档

hist(a, freq = F, breaks = 100) # 绘制频率分布直方图

curve(dnorm(x,mean(a,na.rm=TRUE), sd(a,na.rm=TRUE)), xlim=c(x1,x2),

col="blue", lwd=3, add=TRUE) # 绘制概率分布曲线

abline(v=ave,lty=3,lwd=3,col="red") # 增加均值线

abline(v=med,lty=3,lwd=3,col="purple") # 增加中位数线

abline(v=mode,lty=3,lwd=3,col="green") # 增加众数线

abline(v=quan,lty=3,lwd=3,col="blue") # 增加四分位数线

dev.off() # 保存图片文档

分类数据分析：

Kappa一致性的测量：(是测量不是检验，需要加载vcd库）

kappa计算结果为-1~1，但通常kappa是落在

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
数据处理之卡方检验

题型以及解法：1.描绘图形，概率密度分布，集中趋势等， ——绘图函数2.不同基因型在不同人群中是否存在显著差异 ——卡方独立性检验3.不同变量之间的关联程度 ——多元线性回归分析4.因变量为二分类变量时（是否，10），想要知道各个自变量影响大小，所占权重多少——Logistic回归分析5.拟合探索自变量因变量关系 ——局部多项式回归6.不知道总体分布，或不为正态分布时
复制链接

扫一扫

eTionSean CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

87万+: 周排名

202万+: 总排名

6251: 访问

: 等级

75: 积分

1: 粉丝

2: 获赞

0: 评论

6: 收藏

私信

关注

热门文章

数据处理之卡方检验 6251

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。