数据分析 数据特征分析

一.分布分析
1.定量数据:

对定量数据而言,选择"组数""组宽"是进行分布分析时最重要的问题,一般按以下步骤进行:
①求极差
②决定组距与组数
③确定分点
④列出频率分布表
⑤绘制频率分布直方图
要求:
①各组间是互斥的
②每个数据点都包含在某组中
③各组的组宽应尽可能相等

2.定性数据:

对定性数据而言,常依据某个属性的不同值分组,绘制成饼图或条形图

二.对比分析

分为"绝对数比较""相对数比较"

三.统计量分析
1.集中趋势度量:

平均水平的指标是对数据集中趋势的度量,包括"均值"/"中位数"/"众数"(多用于定性数据)

2.离中趋势度量:

反映变异程度的指标则是对数据离中趋势的度量,包括"标准差"/"四分位间距"/"极差"/"变异系数"

四.周期性分析

五.相关性分析
1.绘制散点图
(1)单一散点图:
在这里插入图片描述
(2)散点图矩阵:

考察多个变量间的相关性时,可利用散点图矩阵同时绘制任意2个变量间的散点图,从而快速发现多个变量间的主要相关性.这在多元线性回归中十分重要

在这里插入图片描述
2.相关系数:

在二元变量的相关分析过程中常用的相关系数包括:"Pearson相关系数"(Pearson Correlation Coefficient),"Spearman秩相关系数"(
Spearman's Rank Correlation Coefficient)"判定系数"(Coefficient of Determination)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值