用R语言做词频统计_基本统计分析 基于R语言实战第四章

本文介绍了如何使用R语言进行基本统计分析,包括描述性统计、频数和列联表的创建,以及独立性检验和T检验的应用。通过summary()函数、table()和xtabs()函数进行数据探索,讨论了卡方独立性检验、Fisher精确检验和T检验的条件选择。此外,提到了R语言中T检验的可视化和方差分析的方法。
摘要由CSDN通过智能技术生成

基本统计分析分为:

1 描述性统计分析

最常用的函数summary函数,用法很简单,summary(var1),对于连续型变量返回最大值,最小值,均值等信息,对于类别型变量,返回类别型变量的种类及数目。

2 频数和列联表

列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数分布表,它是由两个以上的变量进行交叉分类的频数分布表。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。

通过table()或者xtabs()创建频数表,呈现每个观测值出现的数量。使用N个类别变量(因子)创建一个N维列联表

a<-c(1,1,1,2,2)
b<-c(2,3,3,2,3)
table(a)  #使用N个类别变量(因子)创建一个N维列联表
xtabs(~a+b)  #根据一个公式(~var1+var2+...+varN)创建一个N维列联表

a<-c("TRUE","TRUE","FLASE","TRUE","TRUE")
b<-c("TRUE","FLASE","TRUE","FLASE","TRUE")
table(a,b)
xtabs(~a+b)

函数prop.table()以列联表作为参数,以margins定义的边际把列联表中的频数表示为比例关系

4 相关性分析,详见

逆风成长:相关性分析​zhuanlan.zhihu.com
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值