概率函数
- beta Beta分布
- binomial 二项分布
- Cauchy 柯西分布
- chi-squared 非中心卡方分布
- F F分布
- gamma
- geometric 几何分布
- hypergeometric 超几何分布
- log-normal 对数正太分布
- logistsc
- negative binomia 负二项分布l
- normal 正态分布
- Poisson 泊松分布
- Student’s t T分布
- uniform 均匀分布
- Weibull
- Wilcoxon 秩和分布
正态分布命名特性,d 概率密度函数 、p 分布函数、 q 分布函数的反函数、r 产生相同分布的随机数
?norm 可见
描述性统计函数
- summary()
- describe()
频数统计函数
- prop()
独立性检验函数
- 卡方检验
- Fisher检验
相关性分析
相关性衡量指标
Pearson相关系数,Spearman相关系数,Kendall相关系数,偏相关希数,多分格相关系数,多系列相关系数。
- cor()
- cov()
相关性检验
对相关分析的结论进行度量。
- cor.test()
参数检验 在总体分布形式已知的情况下对总体分布的参数如均值、方差等进行推断的方法。也就是数据分布已知。
非参数检验就是在数据分布不清楚的情况下进行检验。在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名非参数检验。
R语言绘图
1.基础绘图 graphics
- 高级绘图 直接库函数调用
- 低级绘图 元素级绘图
demo(graphics)
plot()
par()
2 .
实战
回归
- 如何建立模型
- 如何评价指标
常用 liner mode 函数
- summary 展示拟合模型的详细结果
- coefficients 列出拟合模型的模型参数(截距项和斜率)
- confint 提供模型参数的置信区间
- residuals 列出拟合模型的残差值
- anova 生成一个拟合模型的方差分析表
- vcov 列出模型参数的协方差矩阵
- aic
- plot
- predict 拟合数据对新的数据集预测响应变量值
多元回归
##回归诊断
- 这个模型是否是最佳模型?
- 模型多大程度满足OSL模型的统计假设?
- 模型是否经得起更多数据的检验?
- 如果你和模型指标不好,如何继续?
检验手段
满足ols模型统计假设
- 正态性:对于固定的自变量值,因变量值成正态分布。
- 独立性 因变量之间相互独立
- 线性 因变量与自变量之间为线性相关
- 同方差性 因变量的方差不随自变量的水平不同而变化
方差分析
方差分析 analysis of variance ,ANOVA 变异数分析 ,用于两个及两个以上样本均属差别的显著性检验,从广义上将,方差分析属于回归分析的一种,线性回归的因变量一般是连续变量,自变量是因子时,关注的重点会有预测专项不同组之间的差异比较。
- 单因素方差分析
- 双因素方差分析
- 协方差分析
- 多元方差分析
以上都是在符合正太分布前提下成立的。
很多事情并非是符合已有分布。
先看用spss实现统计的案例,再用r