0. 前言
EXCEL 中数据分析常用统计方法介绍(一)介绍数据处理技巧部分,本文主要介绍几种分析方法。
1. 分析方法
(1)描述统计
该方法可以给出某个数据的基本指标,如:平均值、中位数、众数、方差、标准差、标准误差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大(k)、最小(k)。
指标 | 介绍 |
平均 | - |
标准误差 | standard error,标准误。样本统计量的标准差,是衡量样本抽样误差的指标。如果知道总体的标准差,该值=总体的标准差/sqrt(n); 如果知道样本的标准差,该值=样本的标准差/sqrt(n-1). 标准误和标准差的区别详见 standard deviation 和standard error的区别,能讲的通俗些吗? - Shinku的回答 - 知乎 https://www.zhihu.com/question/21925923/answer/286822186 |
中位数 | - |
众数 | - |
标准差 | standard deviation,表示一组数值之间的离散程度。 |
方差 | - |
峰度 | 峰度的取值范围为[1,+∞),完全服从正态分布的数据的峰度值为 3,峰度值越大,概率分布图越高尖,峰度值越小,越矮胖。 |
偏度 | 偏度的取值范围为(-∞,+∞) 当偏度<0时,概率分布图左偏。 当偏度=0时,表示数据相对均匀的分布在平均值两侧,不一定是绝对的对称分布。 当偏度>0时,概率分布图右偏。 |
区域 | 极差 = 最大值 - 最小值 |
最小值 | - |
最大值 | - |
求和 | - |
观测数 | 数据量 |
最大(k) | 第K大的数 |
最小(k) | 第K小的数 |
置信度(95.0%) | 指的是在95%的置信度下计算出的平均值的允许误差,可以用平均值+或-这个数来计算置信区间的上限和下限. |
(2)协方差
该方法提供按行或者列计算协方差矩阵,对角线上的为方差。
(3)相关系数
该方法提供按行或者列计算相关系数。
(4)回归
对于Excel给出的分析报告的解读
https://wenku.baidu.com/view/0996a441866fb84ae55c8d3c.html
(5)F-检验 双样本方差
该方法是验证两个总体方差是否相等的假设检验,也称为方差齐性检验。如何利用Excel做F检验-双样本方差分析?
(6)Z-检验:双样本平均差检验
独立随机样本取自均值未知,标准差已知的两个正态分布总体,根据样本判断总体均值是否相等或者等于某个常数。
https://zhuanlan.zhihu.com/p/49590022
(7)方差分析
方差分析:单因素方差分析 单因素方差分析及Excel示例
方差分析:可重复双因素分析 excel双因素方差分析(可重复)
方差分析:无重复双因素分析 双因素无重复试验方差分析
(8)t-检验
T-检验:平均值的成对二样本分析
T-检验:双样本等方差假设
T-检验:双样本异方差假设
https://www.jianshu.com/p/1c60c9c3fe33