统计学
黑子小明
这个作者很懒,什么都没留下…
展开
-
协方差的意义和计算公式
参考链接:http://blog.csdn.net/goodshot/article/details/8611178转载 2015-03-30 11:04:06 · 465 阅读 · 0 评论 -
常见概率分布
下面介绍几种常见的概率分布。离散概率分布关于期望和方差的计算,说明如下:首先假设有一个伯努利试验。试验有两个可能的结果:1和0,前者发生的概率为p,后者的概率为1 − p。该试验的期望值等于μ = 1 · p + 0 · (1−p) = p。试验的方差也可以类似地计算:σ2 = (1−p)2·p + (0−p)2·(1−p) = p(1 − p)。一般的二项转载 2015-04-29 09:11:50 · 737 阅读 · 0 评论 -
总体,个体,抽样,样本,样本容量,随机变量,期望,方差,离差,残差
开博第一篇先回顾下数据分析涉及到的统计学中最基本的概念,包含了以下几个概念:总体,个体,抽样,样本,样本容量。1 总体本小节所探讨的总体的概念,特指在统计学中的“总体”。统计学中的“总体”,或称统计总体(population),简称总体,指要调查或统计某一现象或事物全部数据的集合。例如,我们要统计具有中华人民共和国国籍的中国公民(这里简称中国人)的年龄,那么所有中国人的年龄,转载 2015-05-17 11:17:36 · 6674 阅读 · 0 评论 -
几种常见的参数估计
参数估计有点估计(point estimation)和区间估计(interval estimation)两种。点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。例如,设一批产品的废品率为θ。为估计θ,从这批产品中随机地抽出转载 2015-04-29 09:29:15 · 3768 阅读 · 0 评论 -
几种常见的假设检验
定义假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原转载 2015-04-29 09:31:17 · 7285 阅读 · 0 评论 -
常用统计方法
目 录统计描述T检验方差分析聚类与判别分析二项分布相关与回归因素分析非参数检验X2检验生存分析 定量资料的统计描述 N个连续型变量数据,分析结果:极差,最大值,最小值,算数平均数mean,几何均数geometric mean,中位数Median,标准差std.deviation,描述其频数分布特征的茎叶图;frenquencies 可转载 2015-05-06 10:09:47 · 2316 阅读 · 0 评论 -
独立性检验
本文给出基于两种统计量的假设检验,来检验变量间是否独立--χ2与秩和。χ2越小说明越独立。你可能会参考另一篇博客相关性检验。假设检验假设检验(Test of Hypothesis)又称为显著性检验(Test of Ststistical Significance)。在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比较两个或几个总体转载 2015-05-06 09:17:28 · 1488 阅读 · 0 评论 -
方差分析
方差分析是统计分析方法中,最重要、最常用的方法之一。本文应用多个实例来阐明方差分析的应用。在实际操作中,可采用相应的统计分析软件来进行计算。 1. 方差分析的意义、用途及适用条件 1.1 方差分析的意义 方差分析又称为变异数分析或F检验,其基本思想是把全部观察值之间的变异(总变异),按设计和需要分为二个或多个组成部分,再作分析。即把全部转载 2015-05-06 11:16:39 · 6197 阅读 · 1 评论 -
Fisher精确检验
检验两个二进制变量是否是独立的。该检验可以分析 2x2 列联表,并产生精确的 p 值,以检验以下假设:· H0:行变量和列变量是独立的· H1:行变量和列变量是相关的Fisher 精确检验中的 p 值对于所有样本数量都是准确的,而当单元格计数较小时,用于检查相同假设的卡方检验的结果可能不准确。例如,可以使用 Fisher 精确检验来分析下面的竞选结果转载 2015-05-06 11:20:35 · 23832 阅读 · 1 评论 -
数据降维
Matlab数据降维工具箱,包括几乎所有的数据降维方法:PCA、LDA、ICA、MDS、Isomap、LandmarkIsomap、LLE、LLC、Laplacian、HessianLLE、LTSA、DiffusionMaps、KernelPCA、KernelLDA、SNE、NPE、LPP、SPE、LLTSA、SPCA、CCA、MVU、FastMVU、AutoEncoder、AutoEncod原创 2015-05-05 15:50:17 · 1041 阅读 · 0 评论 -
SPSS常见数据分析
一、SPSS常用多变量分析技术比较汇总表注:卡方分析:定量两个定性变量的关联程度简单相关分析:计量两个计量变量的相关程度独立样本T检验:比较两组平均数是否相等ONEWAY ANOVA:可以比较三组以上的平均数是否相等,并进行多重比较检验TWOWAY ANOVA:可以比较两因素的平均数是否相等,并检验主效应和交互效应判别分析与logisti转载 2015-04-29 09:51:34 · 2568 阅读 · 0 评论 -
常见统计量
最小值. 数值变量的最小值。最大值. 数值变量的最大值。总数. 所有具有缺失值的测量值的总和或合计。范围.数值变量的最大值与最小值的差值就是用最大值减最小值后得出的值。平均值. 集中趋势的测量。 算术平均值,等于总和除以观测值数。均值标准误. 取自相同分布中随样本不同而变化的均值的值个数的度量值。 用于粗略将观测到的均值与假设值对比(即,转载 2015-04-08 09:58:30 · 1553 阅读 · 0 评论 -
盒图(boxplot)
最近在摆弄数据离散度的时候遇到一种图形,叫做盒图(boxplot)。它对于显示数据的离散的分布情况效果不错。盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。如上图。下四分位数、中位数、上四分位转载 2015-04-08 09:54:41 · 7144 阅读 · 0 评论 -
方差 残差 离差
1 总平方和(SST)、回归平方和(SSR)与残差平方和(SSE) 得到后,可以把Y分解为可以被解释变量解释的和不能被解释的两部分,Y = X+=+ (3.31)定义总平方和(原始值-平均值) SST = =- 2+T=Y 'Y - T (3.32)其中是yt 的样本平均数,定义为=。定转载 2015-05-20 09:01:01 · 20525 阅读 · 0 评论