MATLAB数据分析方法第2章数据描述性分析

2.1 基本统计量与数据可视化

1.均值、中位数、分位数、三均值

均值、中位数:mean(A)、media(A)

分位数:prctile(A,P),P∈[0,100]

prctile(A,[25,50,75]) %求A的下、中、上分位数

三均值:

w=[0.25,0.5,0.75];

SM=w*prctile(A,[25,50,75])

    %例:计算安徽16省市森林资源统计量
    A=xlsread('senlin.xls','sheet1')
    M=mean(A); %均值, 
    MD=median(A); %中位数
    SM=[0.25,0.5,0.25]*prctile(A,[25,50,75]); %三均值
    [M;MD;SM]

2.方差、标准误、变异系数

方差:var(A,flag),flag默认0表示修正的方差,取1为未修正

标准差:std(A,flag),同上

变异系数:v=std(A)./abs(mean(A))

k阶原点矩、中心距:

ak=mean(A.^k)

bk=mean((A-mean(A)).^k)

%中心距系统命令bk=moment(A,k)

3.极差、四分位极差(上、下分位数之差)

R=rangr(A)

R1=iqr(A)

4.异常点判别(截断点)

XJ=parctile(A,[25])-1.5*R1

SJ=parctile(A,[75])+1.5*R1

5.偏度、峰度

偏度:sk=skewness(A,flag),默认1,取0为样本数据修正的偏度

峰度:ku=kurtosis(A,flg)-3,同上

2.1.2 多维样本数据

协方差:cov(A)

相关系数:corr(A)

标准化:zscore(A)

2.1.3 样本数据可视化

1.条形图

bar(x)%样本数据x的条形图,横坐标为1:length(x)

bar(x,y)%先把x和y一一对应,然后将x从小到大排序画图

2.直方图

hist(x,n)%数据x的直方图,n为组数,确省时n=10

[h,stats]=cdfplot(x)%x的经验分布函数图,stats给出数据最大最小值、中位数、均值、标准差

直方图基础上附加正态密度曲线

histfit(x)

histfit(x,nbins)%nbins指定bar个数,缺省时为x中数据个数的平方根

3.盒图,五个数值点组成:最小值、下四分位数、中位数、上四分位数、最大值。中间的盒子从Q1延申到Q3,盒子的直线标出中位数位置,盒子两端有直线往外延伸到最小数与最大数

boxplot(x)%矩阵x的每一列的盒图和“须”图,

<
  • 6
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值