matlab数据挖掘学习篇----数据特征分析

3.2.1 分布分析
1.定量数据的分布分析
(1)求极差
(2)决定组距与组数
(3)决定分点
(4)列出频率分布表
(5)绘制频率直方图

2.定性数据的分布分析
饼图和条形图

3.2.2 数据的对比分析
1.绝对数比较
2.相对数比较
结构相对数、比例相对数、比较相对数、强度相对数、计划完成程度相对数、动态相对数

3.2.3 统计量分析
1.集中趋势度量
均值、中位数、众数
2.离中趋势度量
极差、标准差、变异系数、四分位数间距

%% 统计量分析
clear;
% 简单读入数据
sales=xlsread('jiang.xlsx');

%% 统计量分析
% 均值
mean_=mean(sales);
% 中位数
median_=median(sales);
% 众数
mode_=mode(sales);
% 极差
range_=range(sales);
% 标准差
std_=std(sales);
% 变异系数
variation_=std_/mean_;
% 四分位数间距
q1=prctile(sales,25);
q3=prctile(sales,75);
distance=q3-q1;

3.2.4 周期性分析

3.2.5贡献度分析
制作帕累托图

3.2.6相关性分析
1.直接绘制散点图
2.绘制散点图矩阵
3.计算相关系数
(1)Pearson相关系数
|r|<=0.3 不存在相关性
0.3<|r|<=0.5 低度线性相关
0.5<|r|<=0.8 显著线性相关
|r|>0.8 高度线性相关
(2)Spearson秩相关系数
连续变量取值服从正态分布
(3)判定系数
相关系数的平方,越接近1,相关性越强
corr_=corr(num);

  • 1
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值