R语言
文章平均质量分 76
小陈统计
这个作者很懒,什么都没留下…
展开
-
R语言数据处理——基于tidyverse (一)
子集的选取——基于tidyverse准备工作1 选取行子集1.1 slice :根据行特征选取行子集1.2 filter :按条件选取行子集2. 去除重复行3 选取列子集the end准备工作(1)安装tidyverse,用于数据处理install.packages("tidyverse")(2)运用R及相关包库及帮助文件进行学习?filter # 查看filter帮助文件 ?slice # 查看slice帮助文件??select # 查看select帮助文件,原创 2022-03-23 18:03:46 · 2919 阅读 · 0 评论 -
R语言基础统计分析:正态性检验、方差齐性检验、T检验、方差分析、秩和检验
R语言基础统计分析1. 正态性检验1.1 Shapiro-Wilk正态检验方法1.2 QQ图2. 方差齐性检验2.1 Bartlett检验,适用于正态分布数据2.2 Levene检验,非正态分布与正态分布数据均适用3. t 检验3.1 单样本t检验3.2 两独立样本t检验3.3 两配对样本t检验4. 方差分析5. 秩和检验5.1 两样本比较5.2 多样本比较1. 正态性检验单变量正态性检验1.1 Shapiro-Wilk正态检验方法# 示列:shapiro.test(var) # 正态性检验,p原创 2021-04-18 17:29:48 · 19641 阅读 · 0 评论 -
R语言描述性统计分析
1. 简单描述1.1 数值变量summary() 函数summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。其格式为:summary(data1$var1)Hmisc包中的describe()函数Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。其格式为library(Hmisc)describe(data1$var1)pastecs包原创 2021-04-15 11:37:46 · 11675 阅读 · 1 评论 -
R语言与数据基本处理
数据基本操作可以用用dplyr包1.数据筛选格式:filter(数据集名,变量名)如果需要根据多变量多条件进行筛选,加上 & 和 | 即可filter (data1,var1 =1 | var2 >6)filter (data1,var1 =1 & var2 >6)2.数据排序格式:arrange(数据集名称,变量名称)如果需要根据多个变量进行排序,按顺序即可desc表示逆序arrange(data1, var1, var2, desc(var3))3原创 2021-04-12 14:44:13 · 1259 阅读 · 0 评论 -
大样本OLS模型假设及R实现
异方差1. 异方差的后果(1) OLS 估计量依然无偏、一致且渐近正态。因为在证明这些性质时,并未用到“同方差”的假定。(2) OLS 估计量方差表达式不再是原表达式,t检验,F检验失效;也就是说,你的得到的t值,F值错误。(3) 高斯-马尔可夫定理不再成立,OLS 不再是 BLUE(最佳线性无偏估计)。也就是得到的方程不是最佳的。2. 异方差的检验(1)直观法——绘制残差图(2)3. 异方差的处理(1)使用OLS+稳健标准误(2)加权最小二乘法(WLS)、可行加权最小二乘法(FW原创 2020-09-24 11:30:11 · 4786 阅读 · 1 评论