常见统计量名词汇总

常见名词:

一、 数据结构

  1. 变量(指标、特征、属性、字段)、样本(观测、记录、实验)
  2. 变量取值类型:字符、数值、时间等
  3. 变量测量类型:名义、有序、度量

二、 数据预处理

  1. 数据编码及转换(特征重新构造)
  2. 缺失值填补、异常值识别/处理 (箱盒图识别法)
  3. 数据去量纲:标准化、规范化
  4. 数据概化
  5. 数据集的筛选/合并/拆分/排序
    1. SPSS实现模块:转换--计算变量/重新编码/创建虚拟变量/替换缺失值
    2. SPSS实现模块:数据--标识重复个案/标识异常个案/选择个案/拆分文件

三、 描述统计

关键词:频数、频率、累积频数、累积频率、众数、均值、方差、四分位数、最值、极差、变异系数、偏度、峰度、分布函数、密度函数、置信度、置信区间;

列联表、行百分比、列百分比;

熵、基尼系数、异常值;

常见分布:0-1分布、二项分布、泊松分布、均匀分布、指数分布、正态分布、卡方分布、t分布、F分布、几何分布、超几何分布、对数正态分布、柯西分布、威尔布分布、瑞利分布、拉普拉斯分布

常见分析图:饼图、条形图、折线图、箱图、直方图、面积图、散点图、茎叶图、Q-Q图

四、假设检验

关键词:原假设、备择假设、检验统计量、显著性水平、拒绝域、接受域、第一类错误概率、第二类错误概率;

参数检验、非参数检验;

单侧检验、双侧检验、独立性检验、分布检验、显著性检验

单正态总体检验、两正态总体检验、多正态总体检验、配对检验、卡方检验、t检验、F检验、秩和检验、符号检验、似然比检验、自由度、显著性

五、方差分析:单因素方差分析、多因素方差分析、总误差平方和、组间误差平方和、组内误差平方和、自由度、F值、方差分析表、显著性、因子、水平、主效应、交互效应、全因子模型、二阶效应、高阶效应

六、相关分析:Pearson相关系数、正相关、负相关、不相关 、相关性检验、列联表、交叉表、卡方统计量、卡方检验、相依系数、Kendall tau相关系数、Kappa系数、优比

七、回归分析:自变量、因变量、解释变量、响应变量、内生变量、外生变量、线性函数、回归系数、系数矩阵、设计矩阵、随机误差、高斯-马尔科夫假设、独立假设、同方差假设、正态假设、散点图;最小二乘估计、极大似然估计、截距、回归系数估计、回归系数置信区间估计;系数显著性检验、模型显著性检验、拟合优度、可决系数、调整的可决系数、R方、回归平方和、点预测、区间预测、回归诊断、残差、标准化残差、学生或残差、删失残差、残差图、残差平方和、异常点、高杠杆点、Cook统计量、多重共线、异方差、自相关、变量选择、逐步回归、前进法、后退法、AIC、BIC、岭回归、主成分回归、加权最小二乘回归

八、一般线性模型:方差分析、回归分析、因变量、固定因子、随机因子、协变量、主效应、交互效应、多重比较

九、广义线性模型:二元Logistic回归、多项logistics回归、Probit回归、对数线性回归

十、主成分、因子分析:协方差阵、相关系数矩阵、特征值、特征向量、贡献率、累积贡献率、主成分系数、主成分得分、KMO值、Bartlett球形检验、因子载荷、共同度、因子旋转、因子得分

十一、聚类分析:距离、相似系数、夹角余弦、距离矩阵、相似系数矩、变量聚类、样品聚类、系统聚类、动态聚类、模糊聚类、有序样品聚类、子空间聚类、最长距离法、最短距离法、重心法、类平均法、可变类平均法、Ward聚类法、系谱图、K-means聚类法、聚类中心、初始聚类中心、类别个数、类别标签

十一、判别分析:样本特征、样本标签、训练集、测试集、分类准确性、预测准确性、判别函数、预测概率、敏感性、特异性、过拟合、独立验证、交叉验证、留一验证、距离判别法、贝叶斯判别法、Fisher判别法、逐步判别法、最近邻、朴素贝叶斯、Losgitic回归、决策树、支持向量机、神经网络、随机森林、Boosting

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值