Matlab中求数据概率分布的方法

一、问题描述

对已有的一些列数据进行分析,想得到该数据的分布和统计特性,如概率密度函数,概率分布,累计概率密度等等。

例如,已有一段时间的声音测量数据,求该数据的分布特性,并给出噪声的95%置信区间统计参数以表征该声音监测数据的总体水平。

二、Matlab 统计分析工具箱

Matlab自带了22个内置的概率分布例如概率密度类pdf,累积分布函数类cdf,概率图等,当然前提是安装Statistics and Machine Learning Toolbox™,matlab提供了应用程序可以直接调用,也可以用代码自己写。离散分布主要分为以下即大类,具体可以查看matlab官网资料

  • 二项分布
    对数据进行二项分布参数拟合,计算该分布或其逆分布,生成伪随机样本
  • 几何分布
    计算几何分布或其逆分布,生成伪随机样本
  • 超几何分布
    计算超几何分布或其逆分布,生成伪随机样本
  • 多项分布
    计算多项分布或其逆分布,生成伪随机样本
  • 负二项分布
    对数据进行负二项分布参数拟合,计算负二项分布或其逆分布,生成伪随机样本
  • 泊松分布
    对数据进行泊松分布参数拟合,计算泊松分布或其逆分布,生成伪随机样本
  • 均匀分布(离散)
    计算离散均匀分布或其逆分布,生成伪随机样本

三、具体方法

3.1 加载声音原始数据

声音数据是一维度列数据,直接用area绘制面积图:

% 原始曲线
figure
area(noiseday);
axis([0 599 0 80])
xlabel('datapoint');
ylabel('noise dB')
title('day noise');

3.2 数据分布拟合

第一种方法,这里用ksdensity函数实现,ksdensity函数时核心平滑密度函数,可以直接返回各个点的概率。

[f,xi]=ksdensity(data);
plot(xi,f);

可以看到,该声音的分布近似正态分布。

第二种方法,采用matlab的工具箱实现->APP->Distribution Fitter

导入数据:

数据显示类别可以选择当前数据的显示类型:density(PDF),cumulative probability(CDF),Quantile probability, probability plot等。这里我们选择density。

添加一个概率拟合 New  Fit,选择正态分布拟合Normal.

显示类别选择概率图,数据越靠近直线,说明越符合正态分布。以下结果表明总体上还是很符合正态分布(存在干扰数据)。

3.3 计算95%置信区间

通过拟合可以发现数据是符合正态分布,因此可以采用normfit函数求置信区间。具体用法:

[mu,sigma,muci,sigmaci]= normfit(noiseday,a);

mu: 均值
sigma: 标准差
muci:1-a 区间内的均值
sigmaci:1-a 区间内的标准差

因此,设置a=0.05可以求得95%置信区间内的数据分布

                                                           表1-1  95%置信区间的声音数据分布

分布均值

46.5124

分布标准差

2.7061

分布均值的95%置信区间

[46.2303,46.7944]

分布标准差的95%置信区间

[2.5218,2.9223]

  • 73
    点赞
  • 399
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值