STATA 操作正态检验、卡方检验和T检验
图示和基本概念
Coef. :回归分析系数。在回归方程中表示自变量x 对因变量y 影响大小的参数。回归系数越大表示x 对y 影响越大。
Std. Err. :标准误。给定样本大小(里面有多少个观测值),样本的某个统计量的抽样分布的标准差。标准差。是描述对应的样本平均数抽样分布的离散程度及衡量对应样本平均数抽样误差大小的尺度。
Confidence intervals (Ci mean):连续变量mean的置信区间
Proportion(prop):分类变量mean的置信区间
Pwcorr:变量的配对相关性
Graph matrix:相关性矩阵
Stata 正态分布
kernel density estimation:核密度估计。是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。
Bandwidth:带宽。是一个自由参数。带宽的大小决定了核密度估计函数的平滑(smooth)程度,带宽越小越undersmooth,带宽越大越oversmooth。
Sum of wgt:权重求和。权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。
Std. Dev.:样本标准偏差。描述一整批数据里每个数据点之间的变异程度的, 这个值越大表示数据越散, 越小表示数据之间相差越小。
Variance:方差。方差用来计算每一个变量(观察值)与总体均数之间的差异。方差刻画了随机变量的取值对于其数学期望的离散程度。(标准差、方差越大,离散程度越大)
QQPlot图:QQPlot图是用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于正态分布。
Jarque-Bera检验:在统计学中,Jarque–Bera检验是对样本数据是否具有符合正态分布的偏度和峰度的拟合优度的检验。如果样本数据来自具有正态分布的总体,JB统计量近似服从自由度为2的卡方分布,因此该统计量可以用于检验数据是否服从正态分布。
离散程度:反应数据远离中心的趋势。极差、四分位差、平均差、方差和标准差。
偏态和峰态:反应数据的偏斜程度和峰度。
加权平均数:被分为