SPSS-描述统计与图示分析

1. 描述统计

1.1 连续性变量

统计指标需要反映的是数据以下几方面的特征:
在这里插入图片描述

SPSS描述统计中有多项可以展示最大值、最小值等,这里重点介绍频率:
在这里插入图片描述

点击统计之后出现:
在这里插入图片描述
在这里插入图片描述

(后验分布可以认为是分布特征指标)
自行选择指标之后,得到分析结果:
在这里插入图片描述

 偏态系数为负-0.212,分布左偏,即大部分样本数据集中靠右,长尾在左。反之,系数为正,分布右偏,长尾在右。一般0.51.0或-0.5-1.0之间为中等程度的偏斜。标准正态分布的偏态系数为0。利用直方图能够很好地观察偏度。
在这里插入图片描述

 Z 分数(Z_Scores):相对位置的测度(一个数值距离平均值有多远)
在这里插入图片描述

1.2 分类变量

相对于连续变量,分类变量的统计描述指标体系比较简单,主要是对各个类别取值进行各自的频数和比例计算,主要的分析任务为
• 频数分布
• 多个分类变量的联合描述
• 多选项统计描述

1.2.1 交叉列联表分析

多个分类变量的联合描述:对两个,甚至多个分类变量的频数分布进行联合观察和汇总分析——交叉列联表分析 Crosstabulation。
例如分析当前居住的房子类别于购房需求之间是否存在联系。
在这里插入图片描述
在这里插入图片描述

行对应类别,显示百分比更利于比较。
在这里插入图片描述
在这里插入图片描述

282名受访者; 租房有200(70.9%);自有房82(29.1%);样本分布情况:未来购房预期中,增加,不变和减弱的人数分别为61(21.6%),175(62.1%),46(16.3%) ; 整体分析,大部分人观望,其次是有购买意愿者;整体态势是保守但有一定的积极性。
横向:对不同居住类型的人购房意愿的差异分析
租房200,预期增强43(21.5%),不变134(67%), 减弱23(11.5%);
自有房82,预期增强18(22.0%),不变41(50%) ,减弱23(28%);

1.2.2 分组条图

运用分组条图观察交叉列联表:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在报告中点开图表之后可以设置数字标签:
在这里插入图片描述
在这里插入图片描述

可见对于不同居住类型的人,未来的住房预期大部分人不变。租房者预期增强者显著高于减弱者,刚性需求;自有房者,减弱者略高于增强者。据这一结果推测,两种不同类型受访者购房预期之间存在一定差异。

1.2.3 总结

以上结论基于描述统计的频数分析的推测,但是不同“居住现状”的人的“购房预期”是否存在关联,还需要对“居住现状”与“购房预期”进行相关性分析(卡方检验)才能下定论。
交叉列联分析可以帮助我们了解多个变量的分布特征,在此基础上再进行变量的相互影响和关系的探索。

1.3 图示分析

除常见的各种图表之外,SPSS还有两个特殊的图表:P-P图和Q-Q图,可以检验数据的正态分布。
 P-P图是根据变量的累积比例与指定分布(正态)的累积比例之间的关系所绘制的图形。
 通过P-P图可以检验数据是否符合指定的分布。
 当数据符合指定分布时,P-P图中各点近似呈一条直线。
 如果P-P图中各点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。
 Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的期望值为纵坐标,样本值观察值为横坐标的散点图.
在这里插入图片描述在这里插入图片描述

1.3.1 对非正态变量进行转换

如下图所示,对激素水平这一项进行分析,观察其是否符合正态分布。

在这里插入图片描述
首先绘制出其频率分布图,观察其具体分布:
在这里插入图片描述在这里插入图片描述

数据长尾在右,这是明显的右偏数据。
绘制出其P-P图和Q-Q图:
在这里插入图片描述
在这里插入图片描述

如果符合选择的检验分布,点的分布应当拟合于图中直线,但是显然“激素水平”字段的数值很不拟合。同理,可以绘制出Q-Q图。
在这里插入图片描述在这里插入图片描述

对“激素水平”字段进行对数转换:
在这里插入图片描述在这里插入图片描述

从图可以看出转换后的数据更符合正态分布。

1.3.2 思考

为什么需要对数据进行转换?数据不应该求真吗?
**数据变换的目的在于使数据的呈现方式接近我们所希望的前提假设,从而更好的进行统计推断。**更详细的细节见 帖子

1.3.3 箱线图

偏离值:距离盒长的1.5倍以上被认为是偏离值Outliers
极端值:距离盒长3倍以上为极端值Extremes
极端值与偏离值越多,代表偏离情形越严重。

选择因变量并置可以将箱线图绘制在同一张图表上,进行对比分析。

在这里插入图片描述
在这里插入图片描述

不同的箱线图之间进行对比,可以分析变量处理前后分布的变化。
对于箱线图,多用于对分类变量某个指标的分布进行对比分析。

2. 图示技术

2.1 柱状图(条形图)

柱状图x轴是分类变量,直方图多为连续变量。

2.1.1 频率条形图

在这里插入图片描述在这里插入图片描述

2.1.2 群集条形图

在这里插入图片描述在这里插入图片描述

2.1.3 堆积条形图

在这里插入图片描述在这里插入图片描述

2.1.4 3D条形图

越复杂蕴涵的维度越多,图包含的内容也就越多。
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

2.1.5 误差条形图

误差条形图适用于展示自变量不同分类下,连续或有序分类变量的差异。自变量可以是二分类、有序多分类或无序多分类。误差条形图通常用于展示独立样本t检验和单因素方差分析结果。

在这里插入图片描述在这里插入图片描述

2.2 折线图

在这里插入图片描述在这里插入图片描述

2.3 面积图

在这里插入图片描述在这里插入图片描述

2.4 饼图

在这里插入图片描述在这里插入图片描述

2.5 点图

从垂线图中可以看出,无论何种学历,离异的现状指数都是比较低的。
在这里插入图片描述在这里插入图片描述

从散点图中可以看出不同指标之间的拟合关系。

在这里插入图片描述在这里插入图片描述

3D图可以展示同一题项不同小题之间的分布关系。

在这里插入图片描述

  • 2
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值