统计学
文章平均质量分 57
小神left
这个作者很懒,什么都没留下…
展开
-
数学统计概念
概念样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。方差和标准差。方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S²转载 2013-06-24 10:20:52 · 929 阅读 · 0 评论 -
Ljung-Box q 统计量
用于检验某个时间段内的一系列观测值是不是随机的独立观测值。如果观测值并非彼此独立,一个观测值可能会在 k 个时间单位后与另一个观测值相关,形成一种称为自相关的关系。自相关可以削减基于时间的预测模型(例如时间序列图)的准确性,并导致数据的错误解释。例如,一家电子公司对电池的月销售量跟踪记录五年。他们想使用这些数据来设计一个时间序列模型以帮助预测未来的销售。但是,月销售额可能会受到季节趋势的影响。转载 2013-08-12 17:32:30 · 28119 阅读 · 0 评论 -
方差分析
单因素单因素方差分析:(一)单因素方差分析概念理解步骤是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差 分析得到答案。单因素方差分析的第一步是明确观测变量和控制转载 2013-07-23 09:21:04 · 6290 阅读 · 0 评论 -
回归分析
•线性回归分析的内容能否找到一个线性组合来说明一组自变量和因变量的关系如果能的话,这种关系的强度有多大,也就是利用自变量的线性组合来预测因变量的能力有多强整体解释能力是否具有统计上的显著性意义在整体解释能力显著的情况下,哪些自变量有显著意义•回归分析的一般步骤确定回归方程中的解释变量(自变量)和被解释变量(因变量)确定回归方程对回归方程进行各种检验利用回归方转载 2013-07-25 15:03:59 · 8556 阅读 · 0 评论 -
spearman 相关系数
测量相关程度的相关系数很多,各种参数的计算方法及特点各异。 一般用积差相关系数,又称pearson相关系数来表示其相关性的大小,积差相关系数只适用于两变量呈线性相关时。其数值介于-1~1之间,当两变量相关性达到最大,散点呈一条直线时取值为-1或1,正负号表明了相关的方向,如果两变量完全无关,则取值为零。 作为参数方法,积差相关分析有一定的适用条件,当数转载 2013-07-26 10:42:04 · 2428 阅读 · 0 评论 -
T检验和F检验\自由度
1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probabilitydistribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会转载 2013-07-25 10:38:16 · 22314 阅读 · 0 评论 -
希腊字母读音及科学方面应用
大写小写英文读音国际音标意义Ααalpha/ˈælfə/角度,系数,角加速度Ββbeta/'beitə/磁通系数,角度,系数Γγgamma/'g&a转载 2013-07-23 17:18:18 · 1039 阅读 · 0 评论 -
如何在SPSS中做数据正态转化
严格说来,回答你的问题需要讲四个W:What's normal transformation?(什么是正态转换)Why do we need normal transformation?(为何做正态转换)When is normal transformation needed? (何时做正态转化)How can we do normal transformation?(如何做正态转化)原创 2013-07-18 17:38:53 · 8132 阅读 · 1 评论 -
常用的数据标准化方法
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 其中最典型的就是0-1标准化和Z标准化:1、0-1标准化(0-1normalization) 也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换转载 2013-07-19 08:49:40 · 1000 阅读 · 0 评论 -
数据挖掘之处理分类自变量与处理时间变量
某些数据挖掘方法能够直接处理分类自变量,譬如第八章将介绍的决策树;但很多数据挖掘方法都只能处理数值自变量,如线性回归、神经网络等,使用这些方法时就需要把分类自变量转换为数值自变量。对于定序自变量,最常用的一种转换是按各类别的序号直接将该变量转换为数值自变量。对于名义自变量,最常用的转换是将该变量转换为哑变量。例如,对于性别而言,可以生成一个二元哑变量,取值1表示“女”,0表示“男”。对于有转载 2013-07-18 14:51:40 · 1386 阅读 · 0 评论 -
数据的正态性检验汇总
一、图示法1、P-P图以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。2、Q-Q图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。转载 2013-07-17 10:02:51 · 13057 阅读 · 0 评论 -
权重确定方法之主成分分析法
什么是权重呢?所谓权重,是指某指标在整体评价中的相对重要程度。权重越大则该指标的重要性越高,对整体的影响就越高。 权重要满足两个条件:每个指标的权重在0、1之间。所有指标的权重和为1。 权重的确定方法有很多,这里我们学习用主成分分析确定权重。 一、主成分基本思想: 图1 主成分基本思想的问与答 二、利用主成分确定权重 如何利用主成分分析法确定指标权重转载 2013-07-17 10:04:40 · 14033 阅读 · 1 评论 -
统计学汇总备忘
随机变量的数学期望在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定转载 2013-07-11 10:34:15 · 906 阅读 · 0 评论 -
离群值
一:什么是OutliersOutliers是统计学专业术语,是指相比一组数据中的其它数据的极限值 二:极限值意味什么 1. 决定哪些值是Outliers是一个主观行为,有一些基准数据来决定是否一个值是一个Outliers,这些基准是任意选择的,比如P2. 一个基准是用BoxPlot来决定适度离群值(mild Outliers)和极限离群值(extreme Outliers),适转载 2013-11-14 11:37:03 · 7409 阅读 · 0 评论