(基于spss,matlab)得到一组数据,检验其分布的三大步骤。

得到一组数据:

  1. 箱式图排除异常值

箱式图

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“图形”à 点击“图表构建器” à 在图库栏点击“箱图” à 双击最后一个1-D框图形式的箱图à 拖动c语言至右侧x轴 à 点击“确定”

运行结果:

结果分析:

为了方便分析,我把c语言的第一个数据改成了1,由图形显示可以看出出现了一个下标为1的星形点,说明了这个第一个数据偏离总数据,视为异常值,分析的时候可以剔除。

  1. 然后进行正态性初步检验

  1. 方法一:Q-Q图和P-P图检验:

操作步骤:

打开spss软件,输入相关数据 à 在“变量视图”更改名称 à 点击“分析”à 点击“描述统计” à 选择“Q-Q图”或者“p-p图” à 拖动c语言至变量框 à 检验分布选择“正态” à 点击“确定”


运行结果及分析:

Q-Q图就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图其斜率为标准差,截距为均值,由图形可知,在60到70之间的数据绝大多数都偏离正态分布,所以c语言不符合正态分布。


p-p图就是由标准正态分布的累积比例为横坐标,样本值的累积比例为纵坐标的散点图,同Q-Q图的分析,60到70的样本数据偏离正态分布的标准值,所以我们认为c语言不服从正态分布。

c语言的去趋势正态Q-Q图用于表示各个数据的残差,由上图可知,在70到80之间的数据残差的绝对值均比其他数据小,如果将70到80的数据拿出检验其正态性,一定比剩余数据好。但此样本的残差绝对值绝大数大于0.05,所以我们认为c语言不符合正态分布。

由图可知0.2到0.4之间的数据与标准线的距离较大并且大于0.05,表明样本数据的离散程度在累计比例0.2到0.4的区间最大,也就成绩在60到70之间的数据离散程度最大,所以我们认为c语言不服从正态分布

  1. 最后进行严格检验
  2. B=rand(1,100);
  3. A=B';
  4. x = A;
  5. alpha = 0.01;
  6. % 正态分布判断
  7. [mu, sigma] = normfit(x);
  8. p1 = normcdf(x, mu, sigma);
  9. [H1,s1] = kstest(x, [x, p1], alpha);
  10. n = length(x);
  11. if H1 == 0
  12. disp('该数据源服从正态分布。')
  13. else
  14. disp('该数据源不服从正态分布。')
  15. end
  16. x2=A;
  17. alpha = 0.01;
  18. % 指数分布判断
  19. mu=expfit(x2,alpha);
  20. p4=expcdf(x2,mu);
  21. [H4,s4]=kstest(x2,[x2,p4],alpha);
  22. if H4==0
  23.     disp('该数据源服从指数分布。')
  24. else
  25.     disp('该数据源不服从指数分布。')
  26. end
  27. x1= A;
  28. alpha = 0.01;
  29. % 伽马分布判断
  30. phat=gamfit(x1,alpha);
  31. p2=gamcdf(x1,phat(1),phat(2));
  32. [H2,s2]=kstest(x1,[x1,p2],alpha);
  33. if H2==0
  34.     disp('该数据源服从γ分布。')
  35. else
  36.     disp('该数据源不服从γ分布。')
  37. end
  38. x3= A;
  39. alpha = 0.01;
  40. % 泊松分布判断
  41. lamda=poissfit(x3,alpha);
  42. p3=poisscdf(x3,lamda);
  43. [H3,s3]=kstest(x3,[x3,p3],alpha);
  44. if H3==0
  45.     disp('该数据源服从泊松分布。')
  46. else
  47.     disp('该数据源不服从泊松分布。')
  48. end
  49. x4= A;
  50. alpha = 0.01;
  51. % 均匀分布判断
  52. [ahat, bhat] = unifit(x4);
  53. p1 = unifcdf(x4, ahat, bhat);
  54. [h1, s1] = kstest(x4, [x4, p1], 0.05);
  55. if h1==0
  56. disp('该数据源服从标准均匀分布。')
  57. else
  58. disp('该数据源不服从标准均匀分布。')
  59. end

输出:

该数据源服从正态分布。

该数据源不服从指数分布。

该数据源服从γ分布。

该数据源不服从泊松分布。

该数据源服从标准均匀分布。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

君无戏言。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值